Deep Learning
Büyük Dil Modellerini İnce Ayarlama: Pratik Bir Rehber
LLM'leri özel kullanım durumlarınız için nasıl ince ayarlayacağınızı öğrenin. LoRA, QLoRA ve verimli eğitim için en iyi uygulamaları kapsar.
18 Kasım 2024
2 dk okuma
Yazan: Uğur Kaval

Büyük Dil Modellerini İnce Ayarlama: Pratik Bir Rehber
İnce ayarlama (fine-tuning), LLM'leri özel ihtiyaçlarınıza göre uyarlamanıza olanak tanır. İşte bunu verimli bir şekilde yapmanız için pratik bir rehber.
Neden İnce Ayarlama Yapılmalı?
Kullanım Durumları
- Alan özelinde dil
- Özel komut takibi
- Belirli çıktı formatı
- Dar görevlerde gelişmiş doğruluk
Ne Zaman İnce Ayarlama Yapılmamalı?
- Prompt mühendisliği yeterliyse
- Sınırlı eğitim verisi varsa
- Genel bilgi görevleri
Teknikler
Tam İnce Ayarlama (Full Fine-Tuning)
Tüm model ağırlıklarını güncelleme:
- En iyi kalite
- En pahalı
- Katastrofik unutma riski
LoRA (Low-Rank Adaptation)
Küçük eğitilebilir matrisler ekleme:
- Çok daha ucuz
- Temel modeli korur
- Adaptörleri değiştirmek kolay
QLoRA
Nicemlenmiş (quantized) temel model ile LoRA:
- Daha da ucuz
- Tüketici GPU'larında çalıştırılabilir
- Hafif kalite ödünü
Veri Hazırlığı
Nicelikten Ziyade Nitelik
- Temiz, tutarlı örnekler
- Çeşitli senaryolar
- Uygun biçimlendirme
Format
Komut-yanıt çiftleri iyi çalışır. Tutarlı biçimlendirme anahtardır.
Eğitim İpuçları
Hiperparametreler
- Öğrenme oranı: 1e-4 ila 5e-4
- Epoklar: Küçük veri kümeleri için 3-5
- Yığın boyutu (Batch size): Belleğe sığan en büyük boyut
Değerlendirme
- Ayrı test seti
- İnsan değerlendirmesi
- Göreve özel metrikler
Yaygın Sorunlar
Aşırı Uyum (Overfitting)
- Dropout kullanın
- Erken durdurma (Early stopping)
- Daha fazla veri
Kalite Bozulması
- Daha büyük temel model
- Daha iyi veri
- Daha düşük öğrenme oranı
Sonuç
İnce ayarlama güçlüdür ancak dikkat gerektirir. İyi veriyle başlayın ve değerlendirmeye göre yineleyin.


