OpenAI, iki açık ağırlıklı modelle açıklığa geri dönüyor: GPT-OSS-120B ve GPT-OSS-20B

OpenAI, iki açık ağırlıklı modelle açıklığa geri dönüyor: GPT-OSS-120B ve GPT-OSS-20B

Publicité
Kısa : OpenAI, iki yeni açık ağırlıklı dil modeli gpt-oss-120B ve gpt-oss-20B'yi piyasaya sürdü. Bu modeller, akıl yürütme görevlerinde yüksek performans gösteriyor ve akıllı asistanlar gibi çeşitli uygulamalarla uyumlu. Önceki güvenlik endişelerine rağmen, kamuya açık kullanım risklerini en aza indirmek için gelişmiş filtreleme mekanizmaları entegre edilmiştir.

OpenAI, dün gece, Apache 2.0 lisansı altında kullanılabilir olan iki açık ağırlıklı dil modeli, gpt-oss-120B ve gpt-oss-20B'nin piyasaya sürüldüğünü duyurdu. Bu adım, şirket için bir dönüm noktası teşkil ediyor; çünkü OpenAI, GPT-2'den bu yana açık ağırlıklı bir LLM sunmamıştı. Modellerin ağırlıkları Hugging Face üzerinde herkese açık olarak erişilebilir durumda.

Akıl yürütme ve verimlilik için tasarlanan modeller

İki model de Mixture-of-Experts (MoE) mimarisi üzerine inşa edilmiştir ve sırasıyla toplamda 117 milyar ve 21 milyar parametreye sahiptir, ancak her bir token için yalnızca bir kısmını (120B için 5,1B, 20B için 3,6B) etkinleştirir. Her ikisi de 128.000 token'a kadar genişletilmiş bir bağlam uzunluğunu destekler.

OpenAI, akıl yürütme görevlerinde rekabetçi performans sergilediklerini iddia ediyor. GPT-OSS-120B, o4-mini'ye yakın sonuçlar elde edebilirken, klasik benchmark'larda (MMLU, HLE, TauBench...) yalnızca 80 GB'lık tek bir GPU üzerinde çalıştırılabilir. Daha hafif olan 20B modeli, 16 GB bellek ile çalışabileceği belirtiliyor, bu da onu yerel veya gömülü cihazlarda potansiyel olarak kullanılabilir kılıyor.

GPT-OSS burada test edilebilir

Uyumluluk ve kullanım senaryoları

Bu modeller, OpenAI'nin Responses API'si ile uyumludur ve yerel olarak Chain-of-Thought (CoT), fonksiyon çağrıları, yapılandırılmış çıktılar ve görev başına akıl yürütme çabasının ayarlanmasını destekler.

OpenAI, bu modellerin ajan tabanlı akışları, akıllı asistanların geliştirilmesi, araştırma veya veri güvenliği ya da egemenliği nedenleriyle yerel dağıtım gibi kullanım alanlarına yönelik olduğunu belirtmektedir. AI Sweden, Orange ve Snowflake gibi ortaklar, entegre kullanım senaryolarını keşfetmek için lansman öncesinde sürece dahil edilmiştir.

Güvenlik ve risk değerlendirmesi

OpenAI, uzun süredir kapalı modeller yönelimine güvenlik endişeleri nedeniyle yöneldiğini açıklamıştı. Güvenlik, şirketin düşüncelerinin merkezinde yer aldı ve bu beklenen Open Weight modellerinin teslimatındaki birkaç gecikmenin nedeni oldu. OpenAI, bugün, kamuya açık hale getirilmesiyle ilgili riskleri azaltmak için gelişmiş filtreleme ve sonradan eğitim mekanizmalarını entegre ettiğini belirtiyor. Özellikle kötü niyetli bir şekilde ince ayar yapılmış (siber güvenlik, biyoloji) sürümlere yönelik dış uzmanlar tarafından bir değerlendirme, OpenAI'nin Hazırlık Çerçevesi kapsamında gerçekleştirildi.

Şirkete göre, bu aşırı senaryolarda bile modeller endişe verici yetenek seviyelerine ulaşmıyor. Ayrıca, Kaggle üzerinde 500.000 $ ödüllü bir kırmızı takım oluşturma meydan okuması başlatıldı ve bu, savunmasızlıkların işbirlikçi tespiti için teşvik edilmektedir.

Açık kaynağa kontrollü bir dönüş mü?

Bu lansman birçok soruyu gündeme getiriyor. Bir yandan, güçlü tescilli modeller ile açık kaynak alternatifleri arasında bir denge kurma isteğini gösteriyor. Diğer yandan, OpenAI'nin teknik olarak bir adım önde kalmasına olanak tanırken, kullanımları çerçeveleyerek açık ağırlık için yeni güvenlik standartları belirlemesini sağlıyor.

Ağırlıkların izin veren bir lisans altında yayınlanması, sağlanan araçlar (optimize edilmiş çıkarımlar, harmony renderer, PyTorch ve Metal desteği...) ve Azure, Hugging Face veya Vercel gibi ortaklıklar, giderek daha parçalanmış bir ekosistemde benimsemeyi kolaylaştırmayı hedefliyor.

Bu modellerin topluluk tarafından ne ölçüde benimsenip benimsenmeyeceği, özellikle Mistral, LLaMA, Mixtral veya Yi gibi alternatiflerle karşılaştırıldığında ve gerçekten açık olup olmadıkları (özellikle serbest ince ayar yapma imkanı) araştırmacıların ve geliştiricilerin beklentilerini karşılayıp karşılamayacağı henüz belirsiz.

 

Hugging Face üzerinde model kartlarını keşfedin:

https://huggingface.co/openai/gpt-oss-20b

https://huggingface.co/openai/gpt-oss-120b

 

 

Cet article publirédactionnel est publié dans le cadre d'une collaboration commerciale