RAG, ilk kez Lewis ve arkadaşlarının 2020'deki Facebook AI çalışmasıyla literatüre giren bir desendir; bir LLM cevap üretmeden önce kullanıcının sorusuyla ilgili belgeleri bir arama katmanından geri çağırır ve onları bağlamına ekler. Bu yaklaşım modeli yeniden eğitmeden güncel ya da özel veriye erişim sağlar; Hallucination'ı azaltır ve Citation üretmeyi mümkün kılar. Tipik bir RAG hattında metinler Chunking ile parçalanır, Embedding'lere dönüştürülüp bir Vector Database'e yazılır; sorgu anında Hybrid Search ya da yalnızca dense retrieval ile en alakalı parçalar çekilir. Kurumsal AI uygulamalarının açık ara en yaygın temel mimarisi haline geldi.
Dış Bağlantılar