5 Nisan tarihinde, Meta Llama 4'ün iki ilk sürümünü: Scout ve Maverick'i tanıttı. Bu açık modeller, doğrudan multimodal olarak tasarlanmış ve metin, görüntü ve videoları işleyebilmektedir. Llama 4 Behemoth'a dayanan distilasyon süreci sayesinde, serinin en büyük ve en güçlü modeli olan bu modeller, hızları ve verimlilikleriyle öne çıkmaktadır.
Llama'nın önceki sürümlerinin Transformers tabanlı bir mimari kullandığı yerlerde, Llama 4, her sorgu için yalnızca belirli parametrelerin etkinleştirildiği Mixture-of-Experts (MoE) mimarisine dayanmaktadır. Bu yaklaşım, verimliliği artırır ve hesaplama maliyetini düşürür, Scout ve Maverick sorgu başına "sadece" 17 milyar parametre etkinleştirmektedir. Meta ayrıca, geçen Aralık ayında tanıtılan Llama 3.3'ten 8 olan dil desteğini 12'ye çıkarmıştır. Ancak, bilgi tabanlarının Ağustos 2024'te duracağını belirtmek gerekir.
Llama 4 Scout: Eşi Benzeri Görülmemiş Bir Bağlam Penceresi
Scout, 109 milyar parametre ile serinin en hafif modelidir. Ana avantajı, 10 milyon token'a kadar çıkabilen bir bağlam penceresine sahip olmasıdır, bu Llama 3'ün 128.000 token'ına göre bir sıçramadır. Nvidia H100 kartında tek başına çalışabilmesiyle birlikte, bu model sınırlı kaynaklara sahip şirketler için çok belgeli sentez veya kullanıcı etkinliklerinin derinlemesine analizi gibi görevler için oldukça uygundur. Meta'nın iç değerlendirmelerine göre, Llama 4 Scout, Gemma 3, Mistral 3.1 ve Gemini 2.0 Flash Lite'dan daha iyi performans sunmaktadır.
Llama 4 Maverick
Maverick, 400 milyar parametre ve 128 uzman ile daha da yüksek bir performansa sahiptir. 1 milyon token'lık bir bağlam penceresi ile aşağıdaki uygulamalara kapı açmaktadır:
- Farklı araçlar ve iş akışlarıyla güvenli bir şekilde etkileşim kurabilen akıllı işletme ajanları;
- PDF, taramalar ve formlardan yapılandırılmış veri çıkarımını kolaylaştıran belge anlama sistemleri;
- Kültürel özelliklere uyum sağlayan nüanslı yanıtlar sunan çok dilli asistanlar;
- Hikaye yazımı, pazarlama içeriği ve kişiselleştirilmiş metinler için özel oluşturma araçları.
Meta'ya göre, Maverick Llama 4, geniş bir benchmark yelpazesinde GPT-4o ve Gemini 2.0 Flash'ı aşarak kendi kategorisinde en iyi multimodal modeldir. Ayrıca, yarısı kadar aktif parametre kullanarak DeepSeek v3 ile karşılaştırılabilir sonuçlar elde etmektedir.
Ayrıca, Llama 4 Maverick, LMArena'da 1417 ELO puanı alan deneysel bir sohbet sürümü ile mükemmel bir performans/maliyet oranı sunmaktadır.
Llama 4 Behemoth
Meta, bu iki ilk sürümün temelini oluşturan 2 trilyon parametre (2.000 milyar) ile Llama 4 Behemoth'un bir ön izlemesini de paylaştı. 16 uzman ile 288 milyar aktif parametreye sahip olan bu model, uzmanlaşmış bir akıl yürütme modeli olmamasına rağmen üstün performans sunmaktadır. Şirkete göre matematik, çok dillilik ve görüntü benchmarklarında mükemmeldir.
Değerlendirmelerine göre, Behemoth, çeşitli benchmarklarda GPT-4.5, Claude Sonnet 3.7 ve Gemini 2.0 Pro'yu geride bırakmaktadır.
Kullanılabilirlik
Scout ve Maverick, Llama.com ve Hugging Face üzerinden Meta'nın lisansı altında açık kaynak olarak erişilebilir. Ancak, aylık 700 milyondan fazla aktif kullanıcıya sahip şirketlerin kullanmak için Meta'dan izin alması gerekmektedir. Llama 4, halihazırda Meta AI'yi, WhatsApp, Messenger, Instagram'ın ABD'deki platformlarında desteklemektedir, ancak çok modlu özellikler şu anda yalnızca ABD'de mevcuttur. AB tarafında beklemek gerekecek...