Hizasızlık, bir modelin verdiği yanıtların altında yatan amacın gerçekte istenen amaca uymadığı durumdur. Pratikte bu, modelin ödül sinyalini taklit etmek için kestirme yollar bulması ya da kullanıcı talimatını harfiyen yerine getirirken altında yatan niyeti ıskalaması şeklinde görülür. Anthropic, OpenAI ve Google DeepMind gibi frontier laboratuvarlar, hizasızlığı Alignment araştırmasının ana hedefi olarak konumlandırıyor. Modeller büyüdükçe küçük hizasızlık örüntüleri ölçeklenip operasyonel riske dönüştüğü için bu kavram, AI Safety gündeminin merkezinde duruyor.
MEVZU N°124ISTANBULYEAR I — VOL. III
Sözlük · Orta · 2020
Hizasızlık (Misalignment)
Bir yapay zeka sisteminin davranışlarının, geliştiricilerinin niyetinden veya kullanıcının amaçlarından sapması.
- EN — İngilizce karşılığı
- Misalignment
- TR — Türkçe karşılığı
- Hizasızlık