百度が今回発表した技術マトリクスは、AI開発における3つの主要なトレンド、すなわち、基本能力としてのマルチモダリティ(Wenxin大規模モデル)、人間と機械のコラボレーションのエージェント再構築(Xinxiang App)、MCPプロトコル統合サービスインターフェース(百度MCPエコシステム)を明らかにしている。 モデル機能が閾値を超え、ツールコールが標準化され、コンピューティングパワーコストが下がり続けると、AIアプリケーションの新時代が到来します。 Robin Li 氏が言うように、「シナリオを突き抜けて真の価値をもたらすことができる AI アプリケーションは、開発者にとって真のチャンスです」。
文心 4.5 Turbo がリリースされましたが、李彦宏はアプリケーションが王者であると言いました。
ヘッダー画像の出典:百度
2025年、AIテクノロジーの反復速度が予想よりもはるかに速いとき、開発者と企業が直面している中核的な命題は、モデルの機能が急速に変化しているときに、アプリケーションの価値がテクノロジーの波に圧倒されないようにするにはどうすればよいかということです。
Baiduは、4月25日に開催されたCreate開発者会議でその答えを発表した。 会議では、Wenxin Model 4.5 TurboとX1 Turboが正式に発表され、Cangzhou OSコンテンツフィールドオペレーティングシステムが同時にリリースされ、一般的なスーパーエージェントアプリ「Heart」も発表されました。 Baiduは、技術レベルでブレークスルーを実証する一方で、シナリオベースのアプリケーションとモデルコンテキストプロトコル(MCP)エコシステムの包括的なレイアウトにより、AIの価値の実装に対する業界の熱烈な期待に応えました。
李彦宏は現場で開発者に対して「正しいシーンを見つけ、正しい基本モデルを選び、時にはモデルを調整する方法を学ぶだけで、これを基に作り出したアプリケーションは時代遅れにはならない」と述べた。彼は「アプリケーションがなければ、チップやモデルには価値がない。モデルはたくさんあるが、未来にこの世界を真に支配するのはアプリケーションであり、アプリケーションこそが王者だ」と強調した。
文心大モデル 4.5 Turbo:マルチモーダル、低コスト、高推論
現在、AI大規模モデルの競争は白熱化しているが、モダリティの単一性、推論の幻想、高い運用コストなどの問題が依然として業界を悩ませている。これらの痛点に対処するために、百度は文心大モデル4.5 TurboとX1 Turboを発表し、それぞれ多モダリティ能力、低コスト、強力な推論をコア特性として、技術とコストパフォーマンスのバランスを示している。
文心4.5 Turboは多モーダル能力でさらなる突破を遂げ、速度は向上しながら、価格は大幅に低下しました——百万トークンの入力価格はわずか0.8元、出力は3.2元で、DeepSeek-V3の40%低下しています。複数のベンチマークテストで、4.5 Turboは77.68の平均スコアでGPT-4oの72.76を上回り、競争力を示しました。そしてX1 Turboはさらに一歩進み、4.5 Turboの深い思考最適化に基づいて、百万トークンの入力が1元、出力が4元で、DeepSeek-R1の25%に過ぎません。質問応答、創作、論理推論、ツール呼び出しなどのシーンで優れたパフォーマンスを発揮しています。
李彦宏は現場で次のように述べました:「モデルの迭代は速いですが、応用価値は覆されることはありません。適切なシーンを見つけ、適切なモデルを選び、調整をうまく活用すれば、AIアプリケーションは持続的に価値を創造できます。」この見解は開発者に強い活力を注入しました——大モデルの真の価値は、シーンとの深い結びつきにあります。
もし文心大模型が百度AIの「心臓」であるなら、新しく発表された沧舟OSはコンテンツとアプリケーションをつなぐ「神経系」である。コンテンツオペレーティングシステムとして、沧舟OSはChatfile Plusを中心に、公共知識庫、プライベート知識庫、記憶庫の「三庫」と、リーダー、エディター、プレーヤーの「三器」を統合し、大模型の動的呼び出しを通じてマルチモーダルコンテンツの解析と処理を実現する。
滄州OS|画像出典:百度(バイドゥ)
滄州OSを利用して、BaiduライブラリとBaidu Netdiskは共同で「AIノート」機能を開始しました。 ユーザーがネットワークディスクでビデオを視聴すると、構造化されたメモ、AIマインドマップ、さらにはビデオコンテンツに基づくテスト質問をワンクリックで生成して、ビデオとメモのシームレスなリンクを実現できます。 現在までに、Baidu WenkuのAI機能には4,000万人以上の有料ユーザーがおり、AIの月間アクティブユーザーは9,700万人に達しています。 Baidu Netdisk AIの月間アクティブユーザー数は8,000万人を超えています。 このデータは、滄州OSの生産性を反映しているだけでなく、コンテンツ分野におけるAIアプリケーションの大きな可能性も示しています。
マルチモーダル機能のもう一つの応用例は、バイドゥの非常に説得力のあるデジタルヒューマンです。 eコマースのライブ放送のシナリオでは、従来のデジタルヒューマンは退屈なコピーライティングと硬い動きをする傾向がありますが、Baiduの非常に説得力のあるデジタルヒューマンは、マルチモーダルな大規模モデルを通じて、超リアルな音声、プロフェッショナルなコンテンツ、柔軟なインタラクションを実現しています。 セリフに合わせて表情や口調、動作をリアルタイムに調整できる「台本生成」機能や、生放送室の人気に合わせてアシスタントアナウンサーや現場制御などの役割を動的にスケジュールできる「AI頭脳」は、まさに「1人でチーム」を実現します。 百度(バイドゥ)のHuiboxingプラットフォームは、ユーザーが2分間の動画をアップロードするだけで専用のデジタルヒューマンを生成できる「ワンクリッククローン」機能も開始し、「誰もがアンカーになれる」ことを現実のものにしている。
インテリジェントエージェントとMCP:AIアプリケーションのエコシステムエンジンに火をつける
エージェント(インテリジェントエージェント)が業界のホットトピックとなっている中、バイドゥも「心響」アプリを発表し、戦場に参入しました。
「AIタスク完了エンジン」をコアとする製品として、心響は自然言語インタラクションを通じて複雑なタスクの分解、実行、結果の提供を実現しています。現在、心響は深層研究、スマートチャート、ゲーム開発などの10のシーンを超えて200以上のタスクをカバーしており、今後は10万以上に拡張する計画です。
Xinxiangは「マルチエージェントコラボレーション」メカニズムをサポートしています。 健康相談のシナリオでは、システムは複数の「医師AIクローン」を共同相談のためにスケジュールできます。 リーガルサービスの場合は、「弁護士シンクタンク」が連携して対応します。 このメカニズムは、従来のツール呼び出しの制限を打ち破り、プロフェッショナルなシナリオに対してより効率的なソリューションを提供します。 また、Xinxiangの無料オープンとAndroid版(iOS版は近日公開予定)の発売により、より多くのユーザーがAIエージェントの魅力を体験することができます。
多エージェント協力の可能性は、百度が昨年発表したノーコードプログラミングツール「秒哒」にも現れています。「秒哒」では、1つの文でアプリケーションを生成でき、背後にはプロダクトマネージャー、アーキテクト、デザイナーなどの複数のエージェントが協力し、クラウドストレージ、データベース、地図ナビゲーションなどのツールコンポーネントを呼び出します。「秒哒」を使えば、大学生のチームはわずか数分で、従来は1週間かかっていたマーケティングツールを開発でき、モデル呼び出し料金はわずか5元です。
李彦宏は「世界には80億人がいて、技術のハードルが消えると、誰もがプログラマーの能力を持つことができる」と述べました。「秒哒」の全社会的な開放は、AIアプリケーションの開発ハードルをさらに下げました。
MCP(モデルコンテキストプロトコル)はAIエコシステムの新たなトレンドとして、開発者と大規模モデルとのインタラクションの仕方を再構築しています。百度は今回の会議でMCPを全面的に受け入れ、世界初のeコマース取引MCPや検索MCPなどのサービスを発表し、MCPタスクの計画とスケジューリングにおける文心大モデルの能力を最適化しました。
同時に、百度智能云千帆プラットフォームはMCPに先駆けて対応し、開発者がMCPサーバーを作成および発行できるようにサポートしています。百度検索はMCPサーバー発見プラットフォームを構築し、全ネットワークの優れたサービスをインデックスしています。文心快码は国内で初めてMCPサーバーをサポートするインテリジェントコーディングアシスタントとなりました。また、百度文庫、網盤、地図などのアプリケーションもMCPサーバーサービスを全面的に開放しており、百度電商が提供するMCPサービスは商品検索、取引、パラメータ比較などの機能をカバーし、国内で初めて電商取引をサポートするMCPサービスとなりました。この一連の展開は、開発者の接続ハードルを下げるだけでなく、MCPエコシステムの繁栄に新たな動力を注入しています。
百度「ウェンシンカップ」アントレプレナーシップコンペティション開始|画像出典:百度
技術と製品の突破に加えて、バイドゥはAI人材の育成と起業支援にも多くの投資を行っています。5年前に提案された500万人のAI人材計画は早期に達成され、リー・イエンホンは会議で今後5年間でバイドゥがさらに1000万人のAI人材を育成することを発表しました。さらに、第3回「文心杯」起業コンペティションでは、単一プロジェクトの最高投資額を7000万元に引き上げ、起業家により強力な支援を提供します。
ハードウェアの面では、百度は国内初の完全自社開発の三万カードクラスタを点灯させ、同時に複数の千億パラメータ大モデルの訓練をサポートし、1000の顧客が百億パラメータモデルの微調整を行うことを可能にしました。このクラスタは高性能ネットワークと革新的な冷却ソリューションを備え、訓練タスクの安定性とエネルギー効率を保障します。
百度が今回発表した技術マトリクスは、AI開発における3つの主要なトレンド、すなわち、基本能力としてのマルチモダリティ(Wenxin大規模モデル)、人間と機械のコラボレーションのエージェント再構築(Xinxiang App)、MCPプロトコル統合サービスインターフェース(百度MCPエコシステム)を明らかにしている。 モデル機能が閾値を超え、ツールコールが標準化され、コンピューティングパワーコストが下がり続けると、AIアプリケーションの新時代が到来します。 Robin Li 氏が言うように、「シナリオを突き抜けて真の価値をもたらすことができる AI アプリケーションは、開発者にとって真のチャンスです」。
「これらの発表はすべて、開発者がモデルの能力やコスト、開発ツールやプラットフォームを心配せずに、安心してアプリケーションを開発し、最高のアプリケーションを作ることができるようにするためのものです。」李彦宏は現場で述べました。
国内のAI業界にとって、百度のこの一連の動きは技術力の展示だけでなく、シーン別の応用とエコシステムの協調に対する深い洞察でもあります。この変革の中で、百度は技術革新とエコシステムの構築を通じて、開発者にモデルからアプリケーションへの「高速道路」を提供しています。文心大モデル、沧舟OS、心響の継続的なイテレーションに伴い、AIの「スーパー生産性」がより早く実際にすべての人の仕事と生活に溶け込むかもしれません。