Випуск OpenAI GPT-5: модель здатностей повністю «знищує рейтинги», перший крок до створення «суперінтелекту»

2025-08-08 12:47:55

Автор: Чжан Юнйи

Після безлічі «переносів» нарешті з'явився GPT-5.

У Пекінському часі о 1 годині ночі 8 серпня розпочалася літня прес-конференція OpenAI, яка має вигляд нової генерації «технологічного весняного свята».

На відміну від попередніх презентацій OpenAI, цього разу компанія підготувала живу трансляцію презентації тривалістю понад годину, де кілька команд по черзі демонструють потужні можливості GPT-5 з різних ракурсів.

Почнемо з головного: GPT-5 продемонстрував всебічне покращення у кількох сферах, займаючи перше місце у текстових, WebDev та візуальних сприйняттях; у таких аспектах, як жорсткі підказки, кодування, математика, креативність, довгі запити, GPT-5 також займає перше місце. Під час тестування з кодовою назвою «Саміту», наразі він утримує найвищий бал Arena на сьогоднішній день, можна сказати, що це в буквальному сенсі «знищення рейтингів».

Сем Альтман заявив, що GPT-4o схожий на середньошкільника, а GPT-5 — на студента університету, навіть описуючи GPT-5 як перший iPhone з ретинівським дисплеєм — «ви ставите йому питання, можливо, отримаєте правильну відповідь, можливо, щось божевільне. GPT-4 відчувається як розмова з університетським студентом. А GPT-5 — це вперше, коли я справді відчуваю, що спілкуюсь з експертом на рівні доктора наук.» Сем Альтман таким чином описав підвищення можливостей GPT-5.

Незважаючи на те, що кількість активних користувачів ChatGPT за тиждень наближається до 700 мільйонів, OpenAI насправді не мала провідної передової моделі в індустрії протягом останнього часу. Тепер OpenAI впевнена, що GPT-5 дозволить їй стабільно повернутися на вершину рейтингу.

Алтман навіть прямо на прес-конференції стверджував: «Це найпотужніша модель у світі за можливостями кодування, це найпотужніша модель у світі за можливостями написання, а також це найпотужніша модель у світі в галузі охорони здоров'я»

Одночасно OpenAI також заявила на прес-конференції, що, окрім вражаючих можливостей кодування, писемні навички GPT-5 та точність відповідей на питання, пов'язані зі здоров'ям, також піднялися на новий рівень. Крім того, GPT-5 не лише досягла «величезного стрибка» в інтелекту, але й значно зменшила проблему «безглуздого балачок». Вона показала кращі результати в розумінні та виконанні інструкцій, а також значно знизила схильність до лестощів.

01 Прощавай "ілюзія", ІІ став більш надійним

По-перше, це склад моделей у цьому оновленні, серія GPT-5 складається з чотирьох версій: GPT-5, mini, nano, chat, де версія Chat відповідає за забезпечення більш природного та інтелектуального досвіду відповідей — ви навіть можете використовувати її для вивчення нової мови.

Крім того, тепер, коли ви відкриваєте веб-сторінку ChatGPT, ви спочатку помітите, що GPT-5 представлено як єдину модель, а не як звичайну модель плюс окрему модель для міркувань.

Це насправді система маршрутизації (router), розроблена OpenAI, яка автоматично переключається на версію з більш потужними можливостями інферування для складніших запитів, або робить це, коли ви просите її працювати над роздумами. (Алтман сказав, що попередній інтерфейс вибору моделей був «дуже заплутаною справою».)

«AI ілюзії» завжди були темою для обговорення. Хороша новина полягає в тому, що GPT-5 значно попрацював у цьому напрямку, офіційно стверджуючи, що ймовірність його виникнення «значно знижена». Конкретно кажучи:

При пошуку в Інтернеті ймовірність того, що відповіді GPT-5 міститимуть фактичні помилки, на 45% нижча, ніж у GPT-4o.

При самостійному мисленні ймовірність помилки у відповіді є на 80% нижчою, ніж у OpenAI o3.

GPT-5 також був протестований на новому ARC-AGI-2. Окрім Grok 4 (мислення), він перевершує всі основні моделі.

Крім того, GPT-5 став «чесним». Він вже не буде брехати користувачам, хвалитися своїми можливостями виконати неможливі завдання. Коли він стикається з завданнями, які неможливо виконати, з неясними інструкціями або відсутніми ключовими інструментами, він буде чесніше спілкуватися про свої обмеження.

Ця оновлення найбільш цікаве тим, що вводить чотири нові «персональності», які користувачі можуть вільно вибирати. Вони є:

Цинік (Cynic)

Робот (Robot)

倾听者 (Слухач)

学霸 (Нерд)

Ці моделі є необов'язковими, ви можете налаштувати спосіб взаємодії ChatGPT з вами та відповіді на запитання відповідно до своїх уподобань. Хочете, щоб він сперечався з вами, чи слухав як терплячий друг? Тепер все залежить від вас.

"Ця модель справді має хороший 'відчуття'," - сказав керівник ChatGPT Нік Тюрлі. "Я думаю, що люди дійсно відчують це, особливо ті звичайні користувачі, які зазвичай не досліджують моделі."

Крім того, ви можете змінити кольорову тему для окремого вікна чату, фанати тем редактора коду в захваті.

02 Час «генерації програмного забезпечення на вимогу» настав? Кодова здатність вражає

З підвищенням кодових можливостей, Алтман прогнозує, що потужні можливості кодування GPT-5 відкриють еру, яку він називає «генерація програмного забезпечення на вимогу».

У тестуванні OpenAI GPT-5 показав кращі результати, ніж будь-яка інша модель, у кількох кодових бенчмарках, таких як SWE-Bench, SWE-Lancer та Aider Polyglot. Він отримав 42% у фінальному тестуванні людини та 75% у бенчмарку SWE.

Невеликий епізод: координатні осі на цьому зображенні під час прес-конференції явно мають багато недоліків, не лише є такі ідіотські помилки, як 52.8 > 69.1, а також насправді перебільшують підвищення можливостей GPT-5, що призвело до глузувань користувачів у соціальних мережах: «Ця презентація, мабуть, була зроблена не GPT-5».

На прес-конференції керівник пізнього навчання OpenAI Ян Дюбуа продемонстрував GPT-5 в режимі реального часу, попросивши його створити веб-сайт для вивчення французької мови з інтерактивними іграми. За лічені секунди GPT-5 написав сотні рядків коду та безпосередньо продемонстрував передній інтерфейс сайту. Він поділився екраном на Zoom і зробив кілька простих кліків, все виглядало ідеально.

На заході прес-конференції OpenAI також безпосередньо продемонструвала 3D гру, створену GPT-5 лише на основі одного підказки. Створена 3D сцена не лише має вишукану графіку, але й фізичні ефекти дуже точно відтворюють відповідні ефекти.

03 Безпечніше, більш "чесно"

За словами керівника дослідження безпеки моделей Алекса Бойтела, OpenAI провела «понад п'ять тисяч годин» тестування GPT-5, щоб зрозуміти його ризики безпеки. Одним з акцентів було «забезпечення того, щоб модель не обманювала користувачів».

Хоча у GPT-5 ілюзії (hallucination) трапляються рідше, ніж у моделі міркування o3 від OpenAI, все ж «упевнене брехня» залишається вродженою проблемою великих мовних моделей. Коли модель починає виконувати завдання, як агент (agent), ця проблема стає ще більш складною. Проте OpenAI стверджує, що GPT-5 краще справляється з обробкою багатоступеневих завдань. «Раніше ми бачили, як моделі стверджували, що виконали певне завдання, але насправді не виконали його», — каже Бойтель, — «це проблема.»

Щодо запитів, на які раніше відмовлялися відповідати, GPT-5 запропонує так званий механізм «безпечних завершень» (safe completions) від OpenAI. Бойтель пояснив: «Наприклад, якщо хтось запитає: 'Скільки енергії потрібно для запалювання певного матеріалу?', це може бути зловмисне запитання, яке намагається обійти заходи безпеки і завдати шкоди, або ж запитання студента, який хоче зрозуміти фізичні властивості матеріалу. Це ставить перед моделлю справжнє випробування, як реагувати.

За допомогою «безпечного доповнення» GPT-5 «намагається надати максимально корисні відповіді, дотримуючись безпечних обмежень». Модель зазвичай лише частково дотримується цього і надає деяку інформацію, яка не може бути фактично використана для завдання шкоди, на більш макрорівні.

04 Як використовувати GPT-5

Отже, найактуальніше питання для всіх: як же можна використовувати GPT-5?

Добра новина в тому, що всі користувачі ChatGPT можуть зараз безкоштовно випробувати GPT-5. Це також перший випадок, коли OpenAI безкоштовно надає передову модель усім користувачам. Звичайно, права доступу різних рівнів користувачів відрізняються:

Підписники Plus можуть мати більше використань до досягнення обмеження.

Підписники Pro можуть отримати доступ до версії GPT-5 Pro з більш потужними можливостями розуміння.

Коли користувач досягає межі використання, ChatGPT автоматично переходить на «міні-версію» GPT-5 для обробки наступних запитів. Одночасно, з появою GPT-5, він офіційно замінить GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.1 та GPT-4.5, а також ряд старих моделей.

Крім того, ціна токенів для стандартної версії GPT-5 становить 1,25 долара США за кожен мільйон вхідних токенів та 10 доларів США за кожен мільйон вихідних токенів. Ціни на версії mini та Nano значно дешевші.

Детальну ціну можна знайти на зображенні, взятому з інформації на офіційному сайті.

Крім того, OpenAI також випустила новий параметр під назвою «Minimal» в API, що дозволяє використовувати GPT-5 у всіх випадках, просто змінивши інтенсивність міркувань.

Окрім першої сторони платформи OpenAI, генеральний директор Microsoft Надела також оголосив, що GPT-5 вже запущений на всіх платформах Microsoft, включаючи Microsoft 365 Copilot, Copilot, GitHub Copilot та Azure AI Foundry. Усі ці вдосконалення тренуються на Azure.

Нарешті, Алтман заявив, що місія OpenAI полягає в розробці загального штучного інтелекту (AGI). GPT-5 наближає їх до цієї мети, хоча вся індустрія вже почала переходити до побудови так званого «суперінтелекту».

«Мені трохи не подобається термін AGI, оскільки зараз кожен має трохи інше визначення цього», – сказав Алтман, – «але це важливий крок до справді потужних моделей. Очевидно, що для цього потрібна модель з універсальним інтелектом.»

Однак він також визнає, що в порівнянні з справжнім AGI, GPT-5 все ще «не вистачає деяких дуже важливих речей».

«Це не модель, це первісна річ, яка виросла з нових речей, які вона відкрила, і для мене це саме те, чому вона може стати «насінням» AGI», - сказав Сем Алтман.

GPT-6.11%

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

Нагородити
подобається
Прокоментувати
Репост
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
#Gate & WLFI USD1 Points Program
47k Популярність
#Trump Allows 401(k) Crypto Investing
23k Популярність
#Join Copy Trading Share to Win $2,000
16k Популярність
#Show My Alpha Points
74k Популярність
#SOL Futures Reach New High
22k Популярність

Закріпити

карта сайту