ファーウェイは初めて大型モデルを携帯電話に統合しました。 Xiaoyi + ビッグモデル、スマートアシスタント IQ +++

出典:新志源

HUAWEI HarmonyOS Access Large Model さん、スマート アシスタントはこのようにプレイできますか?

中国語のコマンドを 1 つ入力するだけで、Huawei Xiaoyi は次のような英語のメールを作成します。

AI を使用して、自分の写真をさまざまなスタイルに変えることができます。

また、長い命令リストを話し、複雑なシーンを自動的に作成させ、平易な言語で理解することもできます。

これは HUAWEI HarmonyOS 4新しい Xiaoyi です。

これは、Huawei の Pangu L0 ベースの大規模モデルに基づいており、大量のシーン データを組み込んでモデルを微調整し、最終的に L1 レイヤー対話モデルを改良しました。

テキストの生成、知識の検索、データの要約、インテリジェントな整理、あいまい/複雑な意図の理解などのタスクを処理できます。

さらに、さまざまな APP サービスを呼び出して、システムレベルのインテリジェントなエクスペリエンスを実現することもできます。

では、新しいHuawei Xiaoyiは何ができるのでしょうか?

より賢く、より有能に、より思いやりを持って

大型モデルの能力に基づいて、Huawei Xiaoyiは今回主に3つの側面でアップグレードしました。

  • スマートなインタラクション
  • 高い生産性
  • パーソナライズされたサービス

具体的な機能強化には、より自然な言語の対話、ゲーム機に関する知識クイズ、生活サービスの検索、画面コンテンツの対話認識、要約コピーライティング画像の生成などが含まれます。

**まず第一に、インテリジェントなインタラクションのアップグレードにより、対話とインタラクションがより自然でスムーズになります。 **

Huawei Xiaoyi は 専門用語あいまいな意図複雑なコマンドを理解できます。

最新の壁紙設定機能が見つからず、機能の名前がわからない場合は、次のように直接質問できます。

天気に合わせてリアルタイムに変更できる壁紙を変更するには?

または、複数の要件を伴う複雑なコマンド:

松山湖近くの高評価の海鮮料理レストランを探します。できれば 4 人分のセット料理が割引されています。

Xiaoyi は、このサービスに電話して、要件を満たすレストランを見つけることもできます。

同時に、Xiaoyi にはマルチモーダル機能もあり、画像コンテンツを理解できます。このようにして、ユーザーが読んで手動で操作しなければならなかった手順も Xiaoyi に引き継ぐことができます。

たとえば、招待状を見て次のように言わせます。

地図上の住所に移動します。

地図上の住所情報を抽出し、ナビゲーション用の地図サービスを呼び出すことができます。

または、招待状に連絡先情報を保存すると、画像内のテキスト情報を非常によく理解できることがわかります。

さらに一歩進んで、Xiaoyi を通じて 複雑なタスクの配置 を実行できるため、手動で繰り返し設定する必要がありません。

たとえば、朝のランニングシーンを設定させることができます。

朝のランニングシーンの作成を手伝ってください。毎週月曜日から金曜日の朝6時30分に、その日の天気を放送します。 Bluetooth ヘッドフォンを装着するときは、お気に入りの曲を再生し、携帯電話をサイレント モードにします。

Xiaoyi は、この長い要件のリストを理解して、さまざまな関数を呼び出すことができます。また、携帯電話の状態 (Bluetooth ヘッドセットが接続されているかどうか) に基づいて、特定の操作を実行するかどうかを判断できます。

第 2 に、大規模モデルなどの機能のおかげで、Xiaoyi はより効率的な生産性ツールを提供できるようになりました

見る、読む、書くのに役立ちます。

たとえば、英語の記事を見せて、この記事には何が書かれているのかを尋ねます。

Xiaoyiは中国語で簡単かつ簡潔に説明できます。

ユーザーが過去に何らかの情報を思い出すように要求した場合は、対応するコンテンツを生成するために呼び出すこともできます。

数日後、このプロジェクトについて話し合うためにデイビッドとアポイントを取ります。前回の会議の情報を組み合わせて、英語の会議アポイントメールを書きます。

冒頭で述べたことも含め、Xiaoyi は AI の視覚能力を利用して写真をさまざまなスタイルに作成することもできます。

**最後に、Xiaoyi はスマート アシスタントとして、よりパーソナライズされたサービスをサポートし、ユーザーをよりよく理解できるようになりました。 **

メモ帳や備忘録としても使えますし、ちょっとしたことを口頭で記録することもできます。

ファーウェイは、**すべてのメモリコンテンツはユーザーの許可の下で完成され、ユーザーのプライバシーを完全に保護すると述べています。 **

さらに、Xiaoyi Suggestion はユーザーのより高頻度のシーンを認識できるようになり、ワンストップでスマートな組み合わせの提案を積極的に提供できるようになり、手動の検索プロセスを大幅に節約できます。

たとえば、海外旅行のシナリオでは、Xiaoyi は出発前に最新の為替レートをリアルタイムで通知したり、外貨を両替したり、ユーザーが目的地での旅行戦略をリアルタイムで入手できるように支援したり、リアルタイム翻訳ツールなどを提供したりできます。

レポートによると、新しい Xiaoyi スマート シーンは 3 倍に増加し、POI の数は 7 倍に増加しました。これにより、主要なケータリングおよびショッピング ストア、ビジネス街、空港の高速鉄道駅などをカバーできるようになります。シナリオ。

要約すると、新しい Xiaoyi は最新の AIGC 機能を獲得しただけでなく、過去によく批判されていた携帯電話の音声アシスタントのいくつかの欠点も改善しました。

記憶力の欠如、会話が鈍い、言葉が理解できないなど...

もちろん、これらすべてはビッグモデルの恩恵を受けていますが、Xiaoyi はどのようにしてそれを実現したのでしょうか?

Xiaoyi は大きなモデルを受け入れます

Xiaoyi が依存している基礎モデルは Huawei Pangu シリーズ です。

今年7月、ファーウェイはPangu Large Model 3.0を正式にリリースし、3層モデルアーキテクチャを提案した。

  • L0: 自然言語、ビジョン、マルチモダリティ、予測、科学技術コンピューティングを含む基本的な大規模モデル。
  • L1: 政府、金融、製造、鉱業、気象などの N 産業の大規模モデル。
  • L2: シーンのより詳細なモデル。「すぐに使える」モデル サービスを提供します。

このうち、最大バージョンの L0 層基本大規模モデルには 1,000 億個のパラメータが含まれており、事前トレーニングでは 3 兆個以上のトークンが使用されます。

Xiaoyi は、ファーウェイの Pangu L0 ベースの大規模モデルに基づいて、エンドコンシューマー シナリオ向けに大量のシーン データを構築し、モデルを微調整し、最終的に L1 レイヤー対話モデルを改良しました。

Xiaoyiは、微調整の中で、会話、旅行ガイド、機器制御、食品、衣類、住居、交通機関など、エンド消費者をカバーする主流のデータタイプを追加しました。

これにより、通常のユーザーの日常会話の知識範囲を十分にカバーでき、モデルの対話プロセスにおける事実性、リアルタイム パフォーマンス、セキュリティ コンプライアンスなどを強化できます。

ただし、ご存知のとおり、大規模モデルはその大規模な特性により、展開と迅速な対応が非常に困難です。

導入の面では、ファーウェイは大規模モデルデバイスとクラウドのコラボレーションの機能を継続的に強化しています。デバイス側の大規模モデルは、ユーザーのリクエストとコンテキスト情報に対して前処理の層を実行し、前処理されたリクエストを送信できます。クラウド側へ。

これを行う利点は、エンドサイド モデルの高速応答を活用できるだけでなく、クラウド モデルを通じて Q&A と応答の品質を向上させることができ、同時にユーザーのプライバシーをさらに保護できることです。データ。

推論遅延の削減に関して、Huawei Xiaoyi は、基盤となるチップ、推論フレームワーク、モデル演算子、入力と出力の長さからのリンク全体を含む 体系的なエンジニアリング最適化を実行しました。

研究開発チームは各モジュールの遅延時間を解体することで各部分の最適化目標を明確にし、オペレーターフュージョン、メモリ最適化、パイプライン最適化により遅延時間を削減しました。

同時に、長さと出力の長さも大規模モデルの推論速度に影響します。

この点で、ファーウェイはさまざまなシナリオや出力形式に合わせて単語ごとの分析と圧縮を行い、最終的に推論遅延の半減を実現しました。

全体的な技術アーキテクチャの観点から見ると、Huawei Xiaoyiと大型モデルの統合は、単にチャット、AIGC、返信などのタスクを強化するだけでなく、大型モデルを核としてシステムレベルの強化を実行することになります。

**言い換えれば、大きなモデルをシステムの「頭脳」にします。 **

その基礎となるロジックは、ユーザー タスクを適切なシステムに割り当て、各システムが独自の義務を実行し、同時に複雑なシナリオでのエクスペリエンスを向上させるというものです。

Xiaoyi の典型的な対話プロセスを具体的に見ると、次の 3 つのステップに分けることができます。

最初のステップは、ユーザーの質問を受け取り、文脈の理解/Xiaoyi の記憶能力に基づいて質問に対処する方法を分析することです。

2 番目のステップでは、メタサービスの取得、アイデアの生成、ナレッジの取得など、リクエストの種類に応じてさまざまな機能を呼び出します。

ユーザーが開始したリクエストにメタサービスが含まれる場合、たとえば、待ち合わせ可能な近くのレストランについて尋ねる場合、これにはグルメ APP サービスの呼び出しが含まれます。システムは API を生成する必要があり、最後にサービス当事者は、推奨メカニズムに基づいて応答を返します。

ユーザーが知識に関する質問をした場合 (Pangu モデルにあるパラメーターの数を尋ねるなど)。このとき、システムは検索エンジン、対応するドメイン知識、ベクトル知識を呼び出して問い合わせを行い、融合して回答を生成します。

ユーザーのリクエストが生成タスクの場合、大規模モデルは独自の能力で応答を返すことができます。

最後のステップでは、生成されたすべての回答がリスク管理によって評価され、ユーザーに返されます。

さらに、Xiaoyi は詳細をさらに管理し、質疑応答とタスクの実行の効果を確保するために一連の低レベルの開発を実行しました。

データの側面を確認できます

Xiaoyi は 2017 年に HarmonyOS でオンラインになって以来、一般ユーザー向けにある程度の対話習慣を蓄積してきました。これに加えて、ファーウェイは、大規模なモデルが事前トレーニング段階でさまざまな表現に習熟できるように、できるだけ多くの書き言葉と話し言葉をカバーするために、さまざまな種類の表現の大規模なコーパスを構築しました。

Xiaoyi の能力をより適切に評価し、改善するために、Huawei は完全なテストデータセットを構築しました。

これにより、既存のオープンな大規模モデルの機能を評価できるだけでなく、Xiaoyi が評価結果に基づいてデータと機能を構築できるようになります。

Xiaoyi にはツール呼び出しをマスターしてもらいたいのですが、これは非常に難しいです

機器制御には、数百のトークンを含む複雑な形式のテキストを生成する大規模なモデルが必要です。形式エラーがあってはなりません。そうでないと、中央制御システムが解析して接続できなくなります。

大型モデルがそのような世代標準を満たすことを可能にするために、ファーウェイは一方で大型モデルの「気質」を理解し、同時に大型モデルのコード機能を強化し、フォーマットを強化しました。モデルの準拠能力を検証し、最終的に ** 形式がほぼ 100% 準拠している ** ことがわかりました。

複雑なシナリオの場合、Xiaoyi の方法は、大規模モデルの機能を利用してツールのシナリオを完全に学習して理解し、推論することです。

チームは、モデル機器の制御効果を、まったく使用できない状態から 80% 以上の可用性まで最適化したことがわかります。

さらに、ネイティブ HarmonyOS では既存の API を最適化することも可能であり、この逆適応を通じて、大規模モデルの利点もより有効に活用できます。

モバイル端末に限らずシーン全体と向き合う

では、なぜファーウェイは大規模なモデル機能をスマートアシスタントにこれほど迅速に展開できるのでしょうか?

その根底にある基礎研究開発の蓄積と研究は不可欠だが、もう一つ注目すべき点がある――。

ファーウェイは、大型モデルとスマートアシスタント、さらにはオペレーティングシステム全体をどのように組み合わせるかを決定するために、実際の現場から始めることを選択しました。

ファーウェイ自身の言葉では次のようになります。

話は安いです。デモを見せてください。

上記の経験の多くは、ファーウェイの研究開発チームメンバーの日々の認識からもたらされています。

例えば、仕事の行き帰りにニュースを知ることに慣れている人もいますが、あまり長い情報を読んだり聞いたりするのは不便なので、Huawei Xiaoyiには情報要約機能が登場します。

ショッピングのレビューや誕生日の願いを書くときにいつも言葉が足りないと感じる人もいるかもしれません。そこで、Huawei Xiaoyi はコピーライティング機能を提供します。

そして、このシーン体験への重点は、HarmonyOS の当然の利点です。

HarmonyOSは誕生以来、携帯電話にとどまらず、さまざまな端末、あらゆるシーンを志向してきました。

現在、「1+8+N」のフルシナリオエコロジーが構築されています。

Huawei Xiaoyi は 1+8 デバイスにも展開されています。将来的には、フルシナリオ デバイスのビジネス形態を組み合わせ、大規模モデル機能を備えた Xiaoyi を消費者のフルシナリオ体験に段階的に展開する予定です。

AI 駆動のスマート アシスタントとして、Xiaoyi は誕生以来、AI 字幕や Xiaoyi の読み上げなど、さまざまな AI 機能を統合してきました。その背後にある研究開発チームは、AI とスマート アシスタントのさらなる可能性に常に注意を払ってきました。

レポートによると、チームは昨年、プロンプトテクノロジーと組み合わせた数百億の事前トレーニングモデルがすでに非常に優れたテキスト理解と生成機能をもたらし、雑談、質疑応答、タスクに使用できることに気づきました。ベースの対話。

AI トレンドの最新ラウンドの勃発により、RLHF は大型モデルに大幅な改善をもたらし、産業着陸への扉が正式に開かれました。

今年生成 AI トレンドが出現して以来、多くのアプリケーションが大規模なモデル機能と組み込みのスマート アシスタントにアクセスすることを選択しました。

しかし、世界で最も多くのオペレーティングシステムメーカーの1つであるファーウェイは、OSを再構築するために下位レベルから参入し、大規模なモデルを使用することを選択しました。

下位レベルは、より徹底的で包括的なことを意味します

しかし、研究開発の場合、課題はさらに大きくなります。

これには、十分に強固なモデル ベースが必要なだけでなく、システム レベルの融合の最適化も必要であり、シーンの理解とユーザーの需要の認識に関する要件も提示されます。

同様に、ファーウェイは大規模なモデル機能を備えた最も初期の国内メーカーの 1 つであり、フルスタックの AI 開発機能を構築し、HarmonyOS は 7 億台以上のデバイスをカバーしています...

したがって、Huawei Xiaoyi が大型モデルの機能にすぐにアクセスし、HarmonyOS 4 が大型モデルに完全にアクセスできる最初のオペレーティング システムになっている理由を理解するのは難しくありません。

世界で最も懸念されているオペレーティング システムの 1 つである HarmonyOS は、大規模モデルを初めて採用しており、誰もが携帯電話を開いて大規模モデルの機能を体験できるようにする、新しいパラダイムを開く可能性があります。もはや想像力に限定されています。

現在、ファーウェイはXiaoyiテスト計画を発表しています:

新しいXiaoyiは今年8月末にテストに招待され、その後HarmonyOS 4.0以降を搭載した一部のモデルでOTAを通じてアップグレードされる予定で、具体的なアップグレード計画は追って発表される。

子供靴に興味があれば、ぜひ見に来てください〜

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)