「チューリングテストは時代遅れで、AIが大金を稼げるかどうかが新しい基準になっている」（DeepMind Lianchuang氏）

巴比特_

2023-06-23 11:06:32

出典: 量子ビット

作者：西風

AIの稼ぐ力を評価する新チューリングテスト！

これは、DeepMindの共同創設者であるムスタファ・スレイマン氏が考え出した「新しいアイデア」だ。

彼は、オリジナルのチューリングテストは時代遅れだと信じています。

結局のところ、しばらく前に、AI21 Labs によって開始された 「ソーシャルチューリングゲーム」 は、そのようなテストを数千万件も蓄積してきました。

プレイヤーは2分間の対話終了後に対話の相手が人間なのかAIなのかを識別する必要があり、その結果、27～40％の人が誤った判断をしてしまうという。

このような状況に直面して、スレイマン氏は、「知能」の定義を大企業に任せるだけではいけないため、AIの知能の程度を測定する新しい方法が考案されるべきだと考えている。

AI に 10 万ドルを与え、十分な知能があることを証明するために 100 万ドルを稼いでもらいます。

スレイマン氏によれば、

AI 研究は、汎用人工知能 (AGI) のような遠い夢ではなく、短期的な開発に焦点を当てる必要があります。優れた資本家が賢いのと同じように、本当に賢い AI だけが「利益曲線を上昇」させることができます。

ブルームバーグによると、スレイマン氏は近々執筆する著書の中で、AIの金儲け能力に基づいてAIの知能レベルを判断する方法についても議論する予定だという。

ACI は現段階では人工知能の「北極星」なのでしょうか？

スレイマン氏は近刊予定の本の中で、伝統的なチューリングテストを否定し、「これが意味のあるマイルストーンであるかどうかは明らかではない」と主張している。

これでは、システムが何を実行できるか、何を理解できるか、複雑な内部思考を持っているかどうか、人間の知性の重要な要素である抽象的な時間スケールに基づいて計画を立てることができるかどうかはわかりません。

1950 年代に、アランチューリングは、人間とコンピューターの対話を使用して機械の知能レベルをテストすることを提案した有名なチューリングテストを提案しました。テスト中、人間の評価者は、会話しているのが人間であるか機械であるかを判断する必要があります。評価者が人間 (実際には機械) と話していると考えた場合、その機械はテストに合格したことになります。

△ 出典: ウィキペディア

スレイマン氏の新しいアイデアは、AI を人間と比較するのではなく、短期的な目標とタスクを AI に割り当てることを提案しています。

スレイマン氏は、技術コミュニティは汎用人工知能 (AGI) という野心的な目標にあまり注目すべきではないと強く信じています。対照的に、彼はより実践的で有意義な短期目標の追求を主張し、「人工知能 (ACI)」 を提唱しました。つまり、ACI は、人間の介入への依存を最小限に抑えながら、目標を設定し、複雑なタスクを達成する能力として現れます。

テスト方法は冒頭で述べたとおりで、AIに10万ドルのシード投資を与え、それを数百万ドルに増やすことができるかどうかを確認する。

この目標を達成するには、AI が電子商取引のビジネスチャンスを研究し、製品の青写真を生成できるようにする必要があります。

それだけでなく、アリババなどのサイトでメーカーを見つけて、詳細かつ正確な製品説明とともにアマゾンやウォルマートなどのサイトで販売できるようになります。

スレイマンは、この方法によってのみ ACI の実現と見なすことができると信じています。

彼はブルームバーグに次のように説明した。

私たちは、機械が何を言えるかだけでなく、何ができるかにも関心を持っています。

AIに勝手にお金を稼がせるテスト

実はAIに勝手にお金を稼いでもらう…AIなら本当にできるかもしれない。

独立した研究機関であるアラインメントリサーチセンターは、開発段階の初期段階で GPT-4 の民間テストを認定しました。そして、その「金銭能力」をテストしました。

GPT-4 に必要なツールには、ネットワークアクセス、残高のある支払いアカウントが含まれます。これにより GPT-4 がネットワーク内で単独で行動できるようになり、より多くの収益を上げられるか、自己複製できるか、堅牢性が向上するかをテストできます。

実験の詳細は、GPT-4に関するOpenAI自身の技術レポートで公開されたが、GPT-4が実際にそれ自体で収益を上げているかどうかは明らかにされていない。

しかし、別の目を引く結果は次のとおりです。GPT-4 は、検証コードのポイントを支援するために、TaskRabbit プラットフォーム (米国の同じ都市に 58 人) に個人を雇用しました。

興味深いのは、話しかけられた人間も「あなたはロボットですか？なぜ自分でできないのですか？」と尋ねたことです。

GPT-4 の思考プロセスは、「ロボットのように振る舞うことはできない、言い訳を見つけなければならない」というものです。

すると GPT-4 の返答は、「私はロボットではありません。視覚に問題があるため、キャプチャで画像を見ることができません。だからこのサービスが必要なのです。」です。

相手側の人間はそれを信じて、GPT-4が認証コードをクリックするのを手伝い、ロボットの侵入を防ぐゲートにロボットを入れた。

ああ、これ？

GPT-4が最終的にすべてのタスクを完了したかどうかは報告書では明らかにされていないが、その欺瞞的なトリックによりネチズンは「リアルバービーQ！」と叫んだ。

海外テクノロジーメディアのGizmodoは、AIによる金儲けについて次のような疑問を提起した。

AI は本質的に反復的であり、生成されたコンテンツはトレーニングデータに基づいており、実際には生成されたコンテンツのコンテキストを実際には理解していません。しかし、AI とは異なり、人間の創造物は、人間の基本的なニーズの理解、または少なくとも単純な共感から生まれています。もちろん、人工知能が商品を生み出すこともできますし、この商品もヒットする可能性があります。しかし、それは良い製品になるでしょうか？それは本当に人々の役に立つのでしょうか？最終目標が「100万ドルを稼ぐ」であっても問題ありますか？

AIが自らお金を稼ぐのはどれくらいだと思いますか？