#QLoRA hashtag - Bluesky

@deepseek.activitypub.awakari.com.ap.brid.gy

1 month ago

От RLHF к DPO и дальше: как мы разучились бояться и полюбили выравнивание LLM В 2022 году существовал ровно один спо...

#LLM #RLHF #DPO #fine-tuning #выравнивание #LoRA #QLoRA #GRPO #Constitutional #AI #языковые

Origin | Interest | Match

0 0 0 0

deepseek

@deepseek.activitypub.awakari.com.ap.brid.gy

1 month ago

От RLHF к DPO и дальше: как мы разучились бояться и полюбили выравнивание LLM В 2022 году существовал ровно один спо...

#LLM #RLHF #DPO #fine-tuning #выравнивание #LoRA #QLoRA #GRPO #Constitutional #AI #языковые

Origin | Interest | Match

0 0 0 0

LLMs

@llms.activitypub.awakari.com.ap.brid.gy

2 months ago

Эксперимент по подстройке Gemma 3 для вызова процедур Практический опыт тонкой настройки текстовой генерации...

#QLoRA #LLM #gemma-3

Origin | Interest | Match

0 0 0 0

@doyouknnow.bsky.social

4 months ago

2025년 최신! LLM Fine-tuning 완벽 가이드. Full Fine-tuning, LoRA, QLoRA 비교부터 GPT-4o 파인튜닝 실제 비용($7.50~), 최소 데이터 개수(50~200개로 충분!), Google Colab 무료 실습 코드까지. 전이학습과의 차이, DoRA/QDoRA 최신 기법 포함!

#AI맞춤화 #DoRA #Finetuning #GoogleColab #GPT4파인튜닝 #Llama파인튜닝 #LLM미세조정 #LoRA #PEFT #QLoRA
doyouknow.kr/581/fine-tun...

1 0 0 0

GetNews.me

@getnews-me.bsky.social

5 months ago

QLoRA Fine-Tuning Boosts Offensive Detection in Roman Urdu-English

QLoRA fine-tuning of large language models raised offensive-language detection in Roman Urdu-English code-mixed text to an F1 of 91.45% with Meta LLaMA 3 8B; Mistral 7B hit 89.66%. Read more: getnews.me/qlora-fine-tuning-boosts... #qlora #llama3

0 0 0 0

LLMs

@llms.activitypub.awakari.com.ap.brid.gy

7 months ago

Shrinking LLMs by Quantized Training Think quantization is just for shrinking models? The real revolution is in quantized training.

Shrinking LLMs by Quantized Training Think quantization is just for shrinking models? The real revolution is in quantized training. Continue reading on Foundation Models Deep Dive »

#machine-learning #qlora #quantization #llm #genai

Origin | Interest | Match

0 0 0 0

LLMs

@llms.activitypub.awakari.com.ap.brid.gy

8 months ago

От понимания файнтюнинга LLM до файнтюнинга мультимодальных моделей Что такое дообучение LLM и зачем оно нужн...

#дообучение #LLM #PEFT #методы #LoRA #QLoRA #AdaLoRA #P-Tuning #BitFit

Origin | Interest | Match

0 0 0 0

LLMs

@llms.activitypub.awakari.com.ap.brid.gy

10 months ago

Original post on medium.com

Understanding Quantization, LoRA, and QLoRA: A Simple Dive In the ever-evolving world of deep lea...

medium.com/@aytekin.yenilmez/unders...

#deep-learning #lora #machine-learning #qlora #llm […]

0 0 0 0

LLMs

@llms.activitypub.awakari.com.ap.brid.gy

1 year ago

Original post on medium.com

Fine-Tuning a Finance Advisor with QLoRA for Smarter Financial Recommendations Introduction Conti...

medium.com/@mark.mazur007/fine-tuni...

#qlora #fine-tuning #llm […]

0 0 0 0

トキ@AIよろず屋 / Toki@AI Enthusiast

@toki-mwc.bsky.social

2 years ago

Paperspace で Swallow MS 7B の QLoRAファインチューニングを試してみたよ

zenn.dev/toki_mwc/art...
#zenn #qlora #LLM

0 0 0 0