Meta’dan yeni yapay zeka hamlesi: Llama 4 serisi tanıtıldı

Yapay zeka ile özetle

▾

Meta, yapay zeka alanındaki en yeni gelişmelerini duyurarak, Llama 4 adını verdiği yeni nesil büyük dil modeli serisini kamuoyuyla paylaştı. Bu seri, halihazırda erişime açılmış olan Llama 4 Scout ve Llama 4 Maverick modellerinin yanı sıra, eğitimi halen devam eden Llama 4 Behemoth isimli gelişmiş bir varyantı da içeriyor. Meta, bu modellerin özellikle Meta AI asistanının yeteneklerini önemli ölçüde artırdığını ve 40 farklı ülkede WhatsApp, Messenger, Instagram ile web tabanlı platformlarda kullanıma sunulduğunu açıkladı.

İçindekiler

Llama 4 serisinin modelleri Llama 4 Scout: Hafif ama derinlemesine Llama 4 Maverick: Genel amaçlı kullanımda yeni bir standart Llama 4 Behemoth: Devasa parametrelerle gelen güç Erişim, kısıtlamalar ve geliştirmeler

Meta Kurucusu ve CEO’su Mark Zuckerberg, Instagram postunda Llama 4 serisini duyururken Meta olarak hedeflerinin dünyanın en iyi yapay zeka hizmetlerini açık kaynaklı olarak tüm dünyaya sunmak istediklerini belirtti. Bu hedef doğrultusunda atılan önemli bir adım olan Llama 4 serisi, Meta’nın yapay zeka mimarisinde önemli bir yeniliği de beraberinde getiriyor. Şirket ilk kez, yapay zeka alanında giderek daha fazla tercih edilen “mixture of experts” (MoE – “uzmanların karışımı”) adı verilen mimariyi bu modellerde uyguladı. Bu yapı, görevleri daha küçük ve uzmanlaşmış alt modellere bölerek çalışmayı mümkün kılıyor. Sonuç olarak, işlem verimliliği artarken, modelin esneklikle ve daha isabetli yanıtlar üretmesi sağlanıyor.

View this post on Instagram
A post shared by Mark Zuckerberg (@zuck)

Llama 4 serisinin modelleri

Llama 4 Scout: Hafif ama derinlemesine

Scout modeli, 109 milyar parametreye sahip olmasına rağmen, yalnızca 17 milyar parametreyi aktif olarak kullanıyor. Bu özellik MoE mimarisi kapsamında, modelin içinde birçok “uzman” alt modelin (expert) bulunduğu bir yapı olmasına rağmen, her soruda tüm uzmanların konuşmadığı — yalnızca o göreve en uygun olan birkaç tanesinin çalışması anlamına geliyor. Bu özellikle hem hesaplama yükü azaltılıyor hem de yanıtlardaki uzmanlık düzeyini artırıyor.

Bunun yanı sıra 10 milyon token uzunluğundaki bağlam penceresi sayesinde uzun belgeler, metinler ya da kapsamlı kod veri setleri üzerinde yüksek doğrulukla çalışabiliyor. Ayrıca, bu modelin tek bir Nvidia H100 GPU ile çalışacak şekilde optimize edilmiş olması, onu geliştiriciler için erişilebilir kılıyor.

Llama 4 Maverick: Genel amaçlı kullanımda yeni bir standart

Serinin bir diğer modeli olan Maverick, çok daha yüksek parametre kapasitesiyle dikkat çekiyor. Toplamda 400 milyar parametreye sahip olan bu model, 128 farklı uzmana bölüştürülmüş 17 milyar aktif parametreyle çalışıyor. Maverick, özellikle yaratıcı yazım, çok dilli içerik üretimi ve dijital asistan görevleri için tasarlandı. Meta’nın kendi testlerine göre, bazı kullanım senaryolarında Maverick; GPT-4o ve Gemini 2.0 gibi popüler modellerden daha başarılı sonuçlar üretebiliyor. Ancak GPT-4.5 ve Claude 3.7 Sonnet gibi daha gelişmiş rakiplerine kıyasla hala bazı sınırlamaları bulunuyor.

Llama 4 Behemoth: Devasa parametrelerle gelen güç

Henüz tamamlanmamış olan Llama 4 Behemoth modeli, serinin en güçlü ve en büyük üyesi olma iddiasında. 2 trilyon gibi devasa bir toplam parametreye ve 288 milyar aktif parametreye sahip olacak şekilde geliştirilen bu modelin, özellikle bilim, teknoloji, mühendislik ve matematik (STEM) alanlarındaki değerlendirmelerde üstün performans sergiliyeceği belirtiliyor. Meta’nın açıklamasına göre Behemoth, GPT-4.5, Claude Sonnet 3.7 ve Gemini 2.0 Pro gibi rakiplerini bu alanlarda geride bırakmayı başarıyor.

Erişim, kısıtlamalar ve geliştirmeler

Meta, Llama 4 Scout ve Maverick modellerini Hugging Face platformu ve Llama.com üzerinden kullanıcılarla paylaşıma açtı. Ancak bu erişim, bazı yasal ve ticari sınırlamalara tabi. Özellikle Avrupa Birliği’nde yer alan kişi ve kuruluşlar, modelleri doğrudan kullanamıyor ya da dağıtamıyor. Ayrıca, aylık 700 milyonun üzerinde aktif kullanıcıya sahip olan büyük ölçekli ticari işletmelerin, modelleri kullanabilmek için Meta’dan özel bir lisans alması gerekiyor.

Buna rağmen yeni modeller, yalnızca teknik açıdan değil, kullanım deneyimi bakımından da önceki sürümlere göre avantajlar sunuyor. Meta’nın verdiği bilgiye göre, Llama 4 modelleri daha az yanıt reddediyor, politik ve sosyal içeriklere daha çeşitli ve dengeli tepkiler verebiliyor ve içerik filtreleme sistemleri daha hassas çalışıyor. Bu özellikler, kullanıcıların yapay zekadan daha güvenilir ve kapsamlı bilgiler almasına katkı sağlıyor.

Meta, Llama 4 serisi ve gelecekteki planlarıyla ilgili daha detaylı bilgileri, 29 Nisan’da düzenleyeceği LlamaCon isimli özel etkinlikte paylaşmayı planlıyor. Yapay zeka topluluğunun öncelikli olmak üzere tüm iş dünyasının merakla beklediği bu etkinlik, Llama modellerinin hangi alanlarda nasıl bir etki yaratabileceğine dair daha net bir vizyon sunacak.

Buna da göz atın: Yapay zeka entegrasyonunda şirketlerin yaptığı 5 büyük hata