Korkuluk (guardrail), bir LLM ya da Agent'ın izinli sınırlar içinde kalmasını sağlayan kontrol katmanıdır; girdi filtrelemesi, çıktı doğrulaması, izinli araç listesi ya da konu kapsamı politikası şeklinde olabilir. NVIDIA NeMo Guardrails, Llama Guard ve Anthropic'in safety filtreleri bu alanın bilinen örnekleridir. Bir guardrail tipik olarak modelin kendisini değil, etrafındaki uygulama mantığını sertleştirir; Prompt Injection gibi saldırıları, hassas veri sızıntısını ya da Hallucination kaynaklı yanlış aksiyonları engellemeye çalışır. Güvenilir sistemlerde tek başına model davranışına güvenmek yerine, korkuluklar ve Eval'lerle savunma katmanı kurulur.
MEVZU N°124ISTANBULYEAR I — VOL. III
Sözlük · Orta · 2023
Korkuluk (Guardrail)
Bir LLM ya da ajanın izinli davranış sınırları içinde kalmasını sağlayan kontrol katmanı.
- EN — İngilizce karşılığı
- Guardrail
- TR — Türkçe karşılığı
- Korkuluk (Guardrail)