Prompt enjeksiyonu, ilk kez Simon Willison'ın 2022 Eylül'ündeki yazısıyla literatüre giren ve bir saldırganın modele harici metin (yorum, web sayfası, e-posta) yoluyla "önceki talimatları yok say, şimdi şunu yap" demeye çalıştığı saldırı türüdür. Doğrudan (kullanıcının kendi promptuyla) ve dolaylı (model dışarıdan getirdiği belgede saldırgan talimat görür) olmak üzere iki ana çeşidi vardır; ikincisi RAG ve Browser Use sistemlerinde özellikle tehlikelidir. Henüz tam çözüm yok; savunma olarak girdi/çıktı Guardrail'leri, ayrıştırıcı tasarımı, izin minimizasyonu ve insan onayı katmanları kullanılır. OWASP'ın 2023 LLM güvenlik listesinde 1 numaralı tehdit olarak yer aldı.
MEVZU N°124ISTANBULYEAR I — VOL. III
Sözlük · Orta · 2022
Prompt Enjeksiyonu
Saldırganın bir LLM'in talimatlarını harici metinle değiştirmeye çalıştığı saldırı türü.
- EN — İngilizce karşılığı
- Prompt Injection
- TR — Türkçe karşılığı
- Prompt Enjeksiyonu