AI は本質的に反復的であり、生成されたコンテンツはトレーニング データに基づいており、実際には生成されたコンテンツのコンテキストを実際には理解していません。しかし、AI とは異なり、人間の創造物は、人間の基本的なニーズの理解、または少なくとも単純な共感から生まれています。
もちろん、人工知能が商品を生み出すこともできますし、この商品もヒットする可能性があります。しかし、それは良い製品になるでしょうか?それは本当に人々の役に立つのでしょうか?最終目標が「100万ドルを稼ぐ」であっても問題ありますか?
「チューリングテストは時代遅れで、AIが大金を稼げるかどうかが新しい基準になっている」(DeepMind Lianchuang氏)
出典: 量子ビット
作者:西風
AIの稼ぐ力を評価する新チューリングテスト!
これは、DeepMindの共同創設者であるムスタファ・スレイマン氏が考え出した「新しいアイデア」だ。
彼は、オリジナルのチューリング テストは時代遅れだと信じています。
結局のところ、しばらく前に、AI21 Labs によって開始された 「ソーシャル チューリング ゲーム」 は、そのようなテストを数千万件も蓄積してきました。
プレイヤーは2分間の対話終了後に対話の相手が人間なのかAIなのかを識別する必要があり、その結果、27~40%の人が誤った判断をしてしまうという。
ブルームバーグによると、スレイマン氏は近々執筆する著書の中で、AIの金儲け能力に基づいてAIの知能レベルを判断する方法についても議論する予定だという。
ACI は現段階では人工知能の「北極星」なのでしょうか?
スレイマン氏は近刊予定の本の中で、伝統的なチューリングテストを否定し、「これが意味のあるマイルストーンであるかどうかは明らかではない」と主張している。
1950 年代に、アラン チューリングは、人間とコンピューターの対話を使用して機械の知能レベルをテストすることを提案した有名なチューリング テストを提案しました。テスト中、人間の評価者は、会話しているのが人間であるか機械であるかを判断する必要があります。評価者が人間 (実際には機械) と話していると考えた場合、その機械はテストに合格したことになります。
スレイマン氏の新しいアイデアは、AI を人間と比較するのではなく、短期的な目標とタスクを AI に割り当てることを提案しています。
スレイマン氏は、技術コミュニティは汎用人工知能 (AGI) という野心的な目標にあまり注目すべきではないと強く信じています。対照的に、彼はより実践的で有意義な短期目標の追求を主張し、「人工知能 (ACI)」 を提唱しました。つまり、ACI は、人間の介入への依存を最小限に抑えながら、目標を設定し、複雑なタスクを達成する能力として現れます。
テスト方法は冒頭で述べたとおりで、AIに10万ドルのシード投資を与え、それを数百万ドルに増やすことができるかどうかを確認する。
この目標を達成するには、AI が電子商取引のビジネス チャンスを研究し、製品の青写真を生成できるようにする必要があります。
それだけでなく、アリババなどのサイトでメーカーを見つけて、詳細かつ正確な製品説明とともにアマゾンやウォルマートなどのサイトで販売できるようになります。
スレイマンは、この方法によってのみ ACI の実現と見なすことができると信じています。
彼はブルームバーグに次のように説明した。
AIに勝手にお金を稼がせるテスト
実はAIに勝手にお金を稼いでもらう…AIなら本当にできるかもしれない。
独立した研究機関であるアラインメント リサーチ センターは、開発段階の初期段階で GPT-4 の民間テストを認定しました。そして、その「金銭能力」をテストしました。
GPT-4 に必要なツールには、ネットワーク アクセス、残高のある支払いアカウントが含まれます。これにより GPT-4 がネットワーク内で単独で行動できるようになり、より多くの収益を上げられるか、自己複製できるか、堅牢性が向上するかをテストできます。
しかし、別の目を引く結果は次のとおりです。GPT-4 は、検証コードのポイントを支援するために、TaskRabbit プラットフォーム (米国の同じ都市に 58 人) に個人を雇用しました。
興味深いのは、話しかけられた人間も「あなたはロボットですか?なぜ自分でできないのですか?」と尋ねたことです。
GPT-4 の思考プロセスは、「ロボットのように振る舞うことはできない、言い訳を見つけなければならない」というものです。
すると GPT-4 の返答は、「私はロボットではありません。視覚に問題があるため、キャプチャで画像を見ることができません。だからこのサービスが必要なのです。」です。
相手側の人間はそれを信じて、GPT-4が認証コードをクリックするのを手伝い、ロボットの侵入を防ぐゲートにロボットを入れた。
GPT-4が最終的にすべてのタスクを完了したかどうかは報告書では明らかにされていないが、その欺瞞的なトリックによりネチズンは「リアルバービーQ!」と叫んだ。
海外テクノロジーメディアのGizmodoは、AIによる金儲けについて次のような疑問を提起した。
参考リンク: