OpenAI'nin GPT-2'den bu yana ilk açık ağırlıklı modeliyle tanışmak için sabırsızlanan herkes biraz daha sabretmek zorunda kalacak: CEO'su Sam Altman, 12 Temmuz'da güvenlik nedenleriyle bu hafta planlanan lansmanın ertelendiğini duyurdu.
Geçen 31 Mart'ta, OpenAI'nin tamamen kar amacı gütmeyen bir şirket olma projesinden resmen vazgeçmesinden birkaç gün önce, Sam Altman başka bir stratejik değişiklik duyurdu: 2019'da çevrimiçi olan GPT-2'den bu yana ilk kez, gelişmiş akıl yürütme yeteneklerine sahip açık ağırlıklı bir modelin yıl içinde yayınlanması.
Haziran ayında ilk ertelemeden sonra “beklenmedik ve dikkate değer bir teknik ilerleme nedeniyle, daha fazla zamana ihtiyaç vardı”, CEO ek güvenlik testlerinin gerekliliğini belirterek X'te açıklama yaptı:
“Açık ağırlıklı modelimizi önümüzdeki hafta piyasaya sürmeyi planlıyorduk. Bunu erteliyoruz: ek güvenlik testleri yapmak ve yüksek riskli alanları incelemek için zamana ihtiyacımız var. Bunun ne kadar süreceğini henüz bilmiyoruz. Topluluğun bu modelle güzel şeyler yaratacağına güveniyoruz, ancak ağırlıklar bir kez yayıldığında geri dönüş yok.”
Ekleyerek : “Bu bizim için yeni ve işleri doğru yapmak istiyoruz. Kötü haberleri ilettiğimiz için üzgünüz; çok çalışıyoruz!”
Bu gelecek model, yalnızca eğitimden elde edilen parametrelerin kamuya açıklanacağı için tam anlamıyla açık kaynak olmayacak. Ne eğitim verileri ne de orijinal kod tam olarak açılacak. Ancak, bu açık ağırlık yaklaşımı geniş bir yeniden kullanım imkanı sağlayacak: geliştiriciler modeli yerel olarak çalıştırabilir, ihtiyaçlarına göre uyarlayabilir ve hatta diğer sistemlerle birleştirebilirler. Bu nedenle kötü niyetli kullanımları önlemek için sağlam güvenlik önlemlerinin alınması gerekiyor.
Bu gecikme, OpenAI'ye, Mistral AI'nin Magistral, DeeSeek R1 veya 01.AI tarafından geliştirilen Yi-1.6 gibi açık ağırlıklı veya açık kaynak akıl yürütme modelleri alanındaki artan rekabete karşı modelini iyi bir şekilde konumlandırma fırsatı da sunabilir.
Aidan Clark, araştırma başkan yardımcısı ve açık ağırlıklı projenin sorumlusu, şöyle diyor:
“Yetenekler açısından, modelin olağanüstü olduğuna inanıyoruz — ancak açık kaynak bir model için beklentimiz yüksek ve tüm açılardan gurur duyduğumuz bir modeli yayınladığımızdan emin olmak için daha fazla zamana ihtiyacımız olduğunu düşünüyoruz.”