OpenAI GPT-5 発表:モデルの能力が全面的に「トップ」を占め、「スーパーインテリジェンス」を構築する第一歩

著者: ダニエル・チャン

数え切れないほどの「延期」を経て、GPT-5がついに登場しました。

北京時間の8月8日午前1時、新世代の「テクノロジー春節ガラ」の姿勢を掲げるOpenAIのサマーカンファレンスが始まりました。

従来のOpenAIのスピーディな発表会とは明らかに異なり、今回はOpenAIが1時間を超える発表会のライブストリーミングを準備し、数回のチームが交互に登場し、さまざまな角度からGPT-5の強力な性能を展示しました。

まず重要な点を言います:GPT-5は複数の分野でのパフォーマンスが全面的に向上し、テキスト、WebDev、視覚認識能力の分野で1位を獲得しました。ハードプロンプト、コーディング、数学、創造性、長いクエリなどの面でもGPT-5は1位であり、「サミット」というコードネームの下で行われたテストでは、現在までの最高のArenaスコアを保持しており、文字通り「ランキングを制覇」したと言えます。

サム・アルトマンは、GPT-4oは中学生のようで、GPT-5は大学生のようだと述べ、さらにGPT-5を「初めて網膜ディスプレイを搭載したiPhone」と形容した。「質問をすると、正しい答えが返ってくるかもしれないし、奇妙なものが返ってくるかもしれない。GPT-4は大学生と会話しているように感じる。一方、GPT-5は、実際に博士号を持つ専門家と話しているように感じさせる初めての体験だった。」と、サム・アルトマンはGPT-5の能力の向上を紹介した。

ChatGPTの週次アクティブユーザーは約7億人に達しているが、OpenAIはここ最近、実際には業界をリードする最先端モデルを持っていなかった。現在、OpenAIはGPT-5がそのランキングの首位に安定して戻ると信じている。

アルトマンは発表会で「これは世界で最もコーディング能力の高いモデルであり、世界で最もライティング能力の高いモデルでもあり、医療分野で最も強力なモデルです」と直接断言しました。

同時に、OpenAIは発表会で、コード能力が非常に高いだけでなく、GPT-5の執筆スキルや健康関連の質問への回答の正確性もさらに向上したと主張しました。また、GPT-5は知能において「巨大な飛躍」を実現しただけでなく、「本気で無茶苦茶なことを言う」幻覚の問題も大幅に減少しました。指示を理解し従う能力が向上し、媚びる傾向も大幅に減少しました。

01 幻覚に別れを告げ、AIはより信頼性が高くなった

まず、今回のアップデートのモデルラインナップについてですが、GPT-5シリーズにはGPT-5、mini、nano、chatの4つのバージョンがあります。その中でChatバージョンは、より自然でよりインテリジェントな応答体験を実現するもので、あなたはそれを使って新しい言語を学ぶことさえできます。

また、今ChatGPTのウェブページを開くと、最初にGPT-5が単一のモデルとして表示されることに気付くでしょう。これは、従来のモデルと独立した推論モデルとは異なります。

実はこれの背後には、OpenAIが開発したルーティングシステム(router)があり、より複雑なクエリのためにより強力な推論能力を持つバージョンに自動的に切り替えたり、あなたがそれに努力して考えるように指示したときもそうします。(アルトマンは以前のモデル選択インターフェースを「非常に混乱したゴミの山」と呼んでいました。)

「AI 幻覚」は常にみんなが文句を言う大きな問題です。良いニュースは、GPT-5がこの点に大いに力を入れ、公式にその幻覚を生成する可能性が「著しく低下した」と宣言していることです。具体的には:

ネットワーク検索時に、GPT-5 の回答に事実誤認が含まれる確率は GPT-4o よりも 45% 低くなっています。

独立した思考をしているとき、その回答が間違える確率は OpenAI o3 よりも 80% 低くなります。

GPT-5 は新しい ARC-AGI-2 でもテストされました。Grok 4(思考)を除いて、すべての主要モデルを上回るパフォーマンスを発揮しています。

さらに、GPT-5は「素直な人」になりました。もはやユーザーに嘘をついたり、自分ができないことを誇張することはほとんどありません。達成不可能なタスクや指示が不明確、または重要なツールが欠けているタスクに直面したとき、より正直に自分の限界を伝えるようになります。

今回のアップデートで最も興味深い点は、4つの新しい「人格」モードが導入されたことで、ユーザーが自由に選択できるようになったことです。それらは次の通りです:

犬儒 (シニック)

ロボット (ロボット)

傾聴者 (リスナー)

学霸 (ナード)

これらのモードはオプションであり、自分の好みに応じてChatGPTがあなたと対話し、質問に答える方法を設定できます。彼に反論させたいですか、それとも忍耐強い友人のように聞いてほしいですか?今はすべてあなたの言い分で決まります。

「このモデルは本当に良い『感触』を与えますね」とChatGPTの責任者Nick Turleyは言いました。「特に普段モデルをあまり研究しない一般ユーザーにとって、人々はそれを真に感じると思います。」

さらに、個別のチャットウィンドウのカラーテーマを変更することもでき、コードエディタのテーマ愛好者は歓喜します。

02 「ソフトウェアオンデマンド生成」時代の到来?コード能力が逆天

コード能力がさらに向上するにつれて、アルトマンは、GPT-5の強力なコーディング能力が彼が「ソフトウェアオンデマンド生成」と呼ぶ時代を開くと予測しています。

OpenAI のテストにおいて、GPT-5 は SWE-Bench、SWE-Lancer、Aider Polyglot などの複数のコーディングベンチマークテストで他のモデルを上回るパフォーマンスを示しました。人間による最終テストで 42% のスコアを取得し、SWE ベンチマークテストで 75% のスコアを達成しました。

小さなエピソードとして、発表会でのこの図の座標軸には明らかに多くのツッコミどころがあり、52.8 > 69.1のような愚かな間違いがあるだけでなく、実際にGPT-5の能力向上を誇張しており、SNS上では「このPPTはGPT-5が作ったのではないかと心配している」とネットユーザーに嘲笑されています。

発表会で、OpenAIの後期トレーニング責任者Yann Duboisは、GPT-5を使用して、フランス語を学ぶためのインタラクティブなゲームを備えたウェブサイトを生成するように要求しました。わずか数秒で、GPT-5は数百行のコードを作成し、ウェブサイトのフロントエンドインターフェースを直接表示しました。彼はZoomで画面を共有し、簡単なクリック操作を行い、すべてが完璧に動作しているように見えました。

発表会の現場では、OpenAIがGPT-5によって提示された1つのプロンプトだけで創作された3Dゲームを直接展示しました。生成された3Dシーンは美麗なビジュアルだけでなく、物理効果も非常に正確に再現されています。

03 より安全で、より「誠実」

モデルセキュリティ研究責任者のアレックス・ビューテルによると、安全リスクを理解するために、OpenAIはGPT-5に対して「5000時間以上」のテストを実施しました。その中の一つの重点は「モデルがユーザーに嘘をつかないことを保証する」ことです。

GPT-5の幻覚(hallucination)はOpenAIのo3推論モデルよりも少ないですが、「自信を持って嘘をつく」ことは依然として大規模言語モデルに固有の問題です。モデルがエージェント(agent)のようにタスクを完了し始めると、この問題はさらに複雑になります。しかし、OpenAIはGPT-5がより信頼性の高い多ステップタスクの処理においてより良いパフォーマンスを示していると述べています。「過去には、モデルがあるタスクを完了したと主張することがありましたが、実際には完了していないことがあった」とBeutelは言いました。「これは問題です。」

以前は直接回答を拒否していたプロンプトに対して、GPT-5はOpenAIがいわゆる「安全補完」メカニズム(safe completions)を提供します。Beutelは、「例えば、誰かが『特定の材料を点火するのに必要なエネルギーはどれくらいですか?』と尋ねる場合、これは安全対策を回避して損害を与えようとする悪意のある質問である可能性もあれば、材料の物理的特性を理解したい学生の質問である可能性もあります。これにより、モデルがどのように応答すべきかが本当の挑戦となります。」と説明しています。

「安全補完」を通じて、GPT-5は「安全な制約を維持しつつ、できる限り役立つ回答を提供しようとする」。モデルは通常、部分的にしか従わず、実際に害を及ぼすことができないよりマクロなレベルの情報を提供する。

04 GPT-5をどのように使用するか

それでは、みんなが最も気にしている問題が来ました:どうすれば GPT-5 を使えるようになるのでしょうか?

良い知らせは、すべての ChatGPT ユーザーが今すぐ無料で GPT-5 を体験できるということです。これが OpenAI がすべてのユーザーに最先端のモデルを無料で提供する初めての機会です。もちろん、ユーザーの権限は異なるレベルによって異なります:

Plus サブスクリプションユーザーは、使用上限に達する前に、より多くの使用回数を持つことができます。

Pro サブスクリプションユーザーは、より強力な推論能力を持つ GPT-5 Pro バージョンにアクセスできます。

ユーザーが使用上限に達すると、ChatGPT は自動的に「ミニ版」の GPT-5 に切り替わり、以降のリクエストを処理します。同時に、GPT-5 の導入に伴い、GPT-4o、OpenAI o3、OpenAI o4-mini、GPT-4.1、GPT-4.5 などの旧モデルが正式に置き換えられます。

さらに、Token の価格設定部分では、スタンダード版 GPT-5 は毎百万入力 Token あたり 1.25 ドル、毎百万出力 Token あたり 10 ドルです。mini 版と Nano 版はどちらもかなり安価です。

詳細な価格は、下の図を参照してください。これは公式ウェブサイトからの情報のキャプチャです。

さらに、OpenAIはAPIに「Minimal」という新しいパラメータを発表しました。これにより、推論の強さを変更するだけで、すべてのユースケースでGPT-5を使用できるようになります。

OpenAIのファーストパーティプラットフォームに加えて、マイクロソフトのCEOナデラは、GPT-5がMicrosoft 365 Copilot、Copilot、GitHub Copilot、Azure AI Foundryを含むマイクロソフトの全プラットフォームで稼働していることを発表しました。同時に、これらのすべての改善はAzure上でトレーニングされています。

最後に、オルトマンは、OpenAIの使命は汎用人工知能(AGI)を開発することだと述べました。GPT-5は彼らをこの目標に近づけましたが、業界全体がいわゆる「スーパーインテリジェンス」を構築する方向に移行し始めています。

「私はAGIという言葉が少し嫌いです。なぜなら、今では誰もがそれに対する定義が少し異なるからです」とオルトマンは言いました。「しかし、これは真に強力なモデルに向けた重要なステップです。明らかに、一般的な知能を備えたモデルが必要です。」

しかし、彼は真のAGIと比べると、GPT-5は「非常に重要な何かが欠けている」と認めています。

「これはモデルではなく、彼が発見した新しいものから成長した原生のものであり、私にとって、それがAGIの「種」として機能する理由です。」とサム・アルトマンは紹介しました。

GPT8.15%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)