OpenAI презентує GPT-5

OpenAI презентує GPT-5

У короткому : Сем Альтман презентував GPT-5, модель штучного інтелекту, яка вважається значним кроком до загального штучного інтелекту, пропонуючи можливості експерта рівня доктора наук. Ця модель, швидша та точніша, ніж її попередники, тепер є моделлю за замовчуванням у ChatGPT, доступною безкоштовно.
Як і було анонсовано на початку тижня, Сем Альтман вчора ввечері презентував GPT-5. Модель, яку він представляє як значний крок уперед та важливий етап на шляху до AGI (обіцянка, яка потребує обережності), загального штучного інтелекту, має можливості експерта рівня доктора наук. Приємний бонус: вона доступна безкоштовним користувачам, оскільки є моделлю за замовчуванням у ChatGPT.
 

У використанні: швидший, більше контексту і набагато менше галюцинацій

Важко ще викликати "ефект вау": ззовні попередні версії GPT здавались здатними на все, з певною самовпевненістю та здатністю переконувати, що може зачарувати багатьох. Тому Сем Альтман змушений був часто робити заяви останніми днями, щоб донести, що GPT-5 - це новий значний крок уперед.
Перша очевидність - це швидкість створення контенту GPT-5, ще вища, ніж у попередніх версіях. Відразу після запуску ми провели тест розробки: GPT-5 вирішив за 1 хвилину проблему конфлікту фреймворків, на якій GPT-4o та Claude 4 Sonnet застрягли. Частка ринку серед розробників, здається, є одним із пріоритетів OpenAI, про що свідчить партнерство з Cursor та безкоштовне надання GPT-5 своїм користувачам під час фази запуску.

Раціоналізація: GPT-5, нова модель за замовчуванням "все-в-одному"

На папері GPT-5 поєднує в собі швидку модель для простих питань, модель глибокого мислення для складних проблем і розумний маршрутизатор, який обирає, яку з них використовувати залежно від типу розмови. Це гарний спосіб спростити речі для користувачів та раціоналізувати витрати.
Як і у GPT-4o, різниця між безкоштовним та платним доступом до GPT-5 у ChatGPT залежить від обсягу використання. Коли безкоштовні користувачі досягають своєї квоти, вони автоматично перенаправляються на GPT-5 mini, полегшену, але дуже продуктивну модель, за даними OpenAI. Ліміт використання значно вищий для підписників Plus, тоді як у користувачів Pro - необмежений доступ до GPT-5, і вони можуть активувати GPT-5 Pro, версію з розширеними можливостями мислення.
GPT-5 також доступний через API компанії. Розробникам пропонуються три варіанти: gpt-5, gpt-5-mini та gpt-5-nano, що дозволяє збалансувати продуктивність, витрати та затримку.

Продуктивність

Модель має розширене вікно контексту до 256 000 токенів, що дозволяє обробляти великі документи або слідкувати за довгими обмінами без втрати узгодженості. Вона не лише швидша за попередників, але й має значно знижений рівень галюцинацій, що підвищує надійність її відповідей.
За словами OpenAI, вона встановлює новий рівень майстерності у галузях математики (94,6 % на AIME 2025 без інструментів), реального кодування (74,9 % на SWE-bench Verified, 88 % на Aider Polyglot), мультимодального розуміння (84,2 % на MMMU) та охорони здоров'я (46,2 % на HealthBench Hard).
Щодо безпеки, модель була ретельно протестована протягом 5000 годин у співпраці з такими спеціалізованими організаціями, як CAISI та AISI Великобританії. Компанія запровадила надійні заходи захисту:
"Хоча у нас немає кінцевих доказів того, що ця модель може суттєво допомогти новачку створити серйозну біологічну шкоду, наш встановлений поріг для високої здатності, ми застосовуємо обережний підхід і вже зараз активуємо необхідні заходи захисту, щоб бути більш підготовленими, коли такі можливості стануть доступними".
Microsoft вже інтегрував GPT-5 у більшість своїх продуктів: Copilot, Microsoft 365 Copilot (Word, Excel, Outlook...), GitHub Copilot, Visual Studio Code або Azure AI Foundry.

Надійність, яка ще далеко не бездоганна

На папері, обіцянки щодо зменшення галюцинацій здаються одним з найкращих вдосконалень GPT-5. Але на практиці не знадобилося 5 хвилин, щоб ввести в оману нову флагманську модель OpenAI. Якщо модель помиляється щодо президента Сполучених Штатів, є велика ймовірність, що відповіді все ще будуть наповнені помилками на більш специфічні питання.