NLP ile Bir Duygu Analizi Sistemi Oluşturmak
Transformer'ları kullanarak üretime hazır bir duygu analizi sistemi oluşturmayı öğrenin. BERT ve RoBERTa modelleriyle %89 doğruluk elde edin.

NLP ile Bir Duygu Analizi Sistemi Oluşturmak
Duygu analizi, NLP'nin en pratik uygulamalarından biridir. Bu rehberde, transformer modellerini kullanarak %89 doğruluk elde eden bir duygu analizi sistemini nasıl kurduğumu paylaşacağım.
Duygu Analizini Anlamak
Duygu analizi, metni pozitif, negatif veya nötr olarak sınıflandırır. Modern yaklaşımlar, nüanslı bir anlayış için BERT ve RoBERTa gibi transformer modellerini kullanır.
Mimari
Model Seçimi
Birkaç modelle denemeler yaptım:
- BERT-base: İyi bir başlangıç noktası, %86 doğruluk
- RoBERTa-large: En iyi doğruluk, %89
- DistilBERT: Hızlı çıkarım, %84 doğruluk
İnce Ayar Stratejisi
Önceden eğitilmiş modellerin alana özgü veriler üzerinde ince ayar yapılması gerekir. Temel hususlar:
- Öğrenme oranı: 2e-5 (ön eğitimden daha düşük)
- Dönemler (Epochs): 3-5 (aşırı uydurmayı önlemek için)
- Isınma adımları (Warmup steps): Toplam adımların %10'u
Veri Hazırlığı
Veri Seti
Birden fazla kaynak birleştirildi:
- Ürün yorumları
- Sosyal medya gönderileri
- Film yorumları
Ön İşleme
- Metni temizle (HTML, özel karakterleri kaldır)
- Emojileri ele al (metin açıklamalarına dönüştür)
- Sınıfları dengele
- Eğitim/doğrulama/test ayrımı
Uygulama
Eğitim Döngüsü
Standart PyTorch eğitimi ile:
- Çapraz entropi kaybı
- AdamW iyileştirici
- Doğrusal öğrenme oranı düşüşü
Değerlendirme Metrikleri
- Doğruluk: %89
- F1-skoru: 0.87
- Kesinlik: 0.88
- Geri Çağırma: 0.86
Gelişmiş Özellikler
Yön Tabanlı Duygu Analizi
Metinde bahsedilen belirli varlıklara yönelik duyguyu çıkar.
Alay Tespiti
Yanlış sınıflandırmayı önlemek için alaycı içerik için ek sınıflandırıcı.
Çok Dilli Destek
Çapraz dilli duygu analizi için mBERT kullanma.
Dağıtım
API Tasarımı
FastAPI uç noktası ile:
- Toplu işleme desteği
- Güven skorları
- Sık sorgular için önbellekleme
Performans
- Gecikme: İstek başına <100ms
- Verim: Saniyede 100 istek
Öğrenilen Dersler
- Veri kalitesi, model karmaşıklığından daha önemlidir
- Alana özgü ince ayar çok önemlidir
- Köşe durumlarını ele al (emojiler, alay)
- Üretimde model kaymasını izle
Sonuç
Duygu analizi sistemleri oluşturmak, modern NLP araçlarıyla erişilebilirdir. En iyi sonuçlar için önceden eğitilmiş modellerle başlayın ve veri kalitesine odaklanın.


