İçeriğe atla
MEVZU N°124ISTANBUL
Sözlük · İleri · 2017

RLHF — İnsan Geri Bildirimiyle Pekiştirmeli Öğrenme

İnsan tercihlerini ödül modeline dönüştürerek LLM'i bu ödüle göre optimize eden hizalama tekniği.

EN — İngilizce karşılığı
RLHF (Reinforcement Learning from Human Feedback)
TR — Türkçe karşılığı
RLHF — İnsan Geri Bildirimiyle Pekiştirmeli Öğrenme