Büyük dil modeli (LLM), milyarlarca token boyutunda metin üzerinde eğitilmiş, Transformer tabanlı büyük ölçekli sinir ağıdır. 2020'deki GPT-3 raporu kategoriyi geniş kitleye taşıdı; sonrasında ChatGPT, Claude Sonnet, Gemini ve Llama 3 gibi modeller pratik kullanımı evrenselleştirdi. Bir LLM'in eğitimi tipik olarak Pre-training, Post-training ve RLHF aşamalarından oluşur. Bugün hem üretici asistanlar hem de RAG, AI Agent ve Coding Agents gibi uygulamaların temel motoru LLM'lerdir.
MEVZU N°124ISTANBULYEAR I — VOL. III
Sözlük · Başlangıç · 2020
Büyük Dil Modeli (LLM)
Devasa metin verisiyle eğitilmiş, dili anlayıp üretebilen büyük ölçekli sinir ağı modeli.
- EN — İngilizce karşılığı
- Large Language Model (LLM)
- TR — Türkçe karşılığı
- Büyük Dil Modeli (LLM)