Cette révolution côté terminal, plus proche des utilisateurs, est la clé pour démocratiser l’IA générative.

Source originale : Cœur de la Machine

À l’heure où l’IA générative devient de plus en plus prometteuse et largement répandue, sa mise en œuvre à plus grande échelle nécessite de la rendre plus grande, meilleure et plus forte côté terminal.

Source de l'image : générée par Unbounded AI‌

Aujourd'hui, cela fait près de 10 mois qu'OpenAI a publié ChatGPT. La vague d'IA générative qu'elle a déclenchée a permis aux gens ordinaires de ressentir « plus près » le charme de l'intelligence artificielle. Qu'il s'agisse d'un moteur de recherche en temps réel de type chat alimenté par de grands modèles ou d'un outil de peinture qui génère des images en saisissant du texte, l'IA générative est lentement entrée et a subtilement modifié le travail quotidien, les divertissements et les habitudes créatives des gens.

Parallèlement aux grands modèles et à l'IA générative, les fabricants de téléphones mobiles et de puces mènent en grande pompe une « révolution côté appareil ». En mai de cette année, Google a publié le grand modèle de langage PaLM 2, comprenant une version allégée de Gecko pouvant fonctionner sur des appareils mobiles. Également en mai, Qualcomm a publié le livre blanc « L'IA hybride est l'avenir de l'IA ». En août, Xiaomi Lei Jun a annoncé son adoption complète des grands modèles et a d'abord exécuté avec succès un grand modèle de 1,3 milliard de paramètres sur son téléphone mobile. Xiao Ai a également reçu une mise à niveau des capacités des grands modèles.

Nous ne pouvons nous empêcher de nous demander pourquoi les grands fabricants se précipitent-ils pour intégrer de grands modèles d’IA généraux et génératifs dans les terminaux, en particulier les téléphones mobiles ? Nous savons que les terminaux intelligents tels que les smartphones, les PC, le XR et les voitures sont les plus proches des gens ordinaires, en particulier les téléphones mobiles, et nous y consacrons de plus en plus de temps. En avril 2023, l'organisme d'études de marché Electronics Hub a publié un rapport montrant que les utilisateurs de certains pays regardent les écrans de leurs téléphones portables plus de 7 heures par jour. Les téléphones mobiles évoluent progressivement vers le cœur de la vie intelligente, préparant un « foyer » pour le développement de l’IA générative côté terminal.

Cependant, l'orientation actuelle des grands modèles d'IA générative vers le côté terminal ne s'est pas produite du jour au lendemain : la méthode de déploiement est en train de passer du cloud à la collaboration terminal-cloud.

La tendance de l'IA générative basée sur les terminaux et dans le cloud allant de pair devient de plus en plus importante

Nous savons que les paramètres des grands modèles d’IA générative se chiffrent souvent en milliards, centaines, voire centaines de milliards, ce qui impose des exigences extrêmement élevées à l’infrastructure en termes d’optimisation de la formation des modèles et d’inférence d’exécution. Au début, seul le cloud pouvait fournir une telle puissance de calcul en matière d'IA, c'est pourquoi les fabricants choisissaient souvent de déployer et d'exécuter leurs propres grands modèles dans le cloud.

En prenant ChatGPT comme exemple, sa formation et son fonctionnement nécessitent une grande quantité de stockage de données et de ressources informatiques, et les demandes massives des utilisateurs génèrent des coûts de puissance de calcul élevés, ce qui nécessite une puissante plateforme de services cloud. Les utilisateurs peuvent accéder à ChatGPT et à d'autres produits d'IA générative (tels que CodeX) via le service cloud Microsoft Azure OpenAI. Amazon, un autre grand fournisseur de services cloud, a également lancé un service d'hébergement cloud d'IA générative similaire. Les utilisateurs peuvent accéder à des modèles de base pré-entraînés de startups telles que AI21Labs, Anthropic et Stability AI via des API.

De toute évidence, les plates-formes de services cloud ont accéléré cette vague de technologies d’IA générative qui déferle sur le monde, fournissant aux grands fabricants de modèles la puissance de calcul nécessaire à la formation et à l’inférence des modèles. Cependant, l'inférence cloud à grande échelle nécessite des coûts élevés, et avec le nombre croissant d'utilisateurs et de demandes d'utilisation, le coût devient de plus en plus élevé. En conséquence, face à des coûts d’exploitation en constante augmentation, les fabricants doivent trouver une autre solution en dehors du cloud.

Au fil du temps, d'une part, les technologies de compression de grands modèles (telles que la quantification, l'élagage des réseaux et la distillation des connaissances) deviennent de plus en plus abondantes et efficaces. D'autre part, les terminaux intelligents tels que les téléphones mobiles, les PC, les XR , et les automobiles ont l'IA La puissance de calcul continue d'augmenter et les conditions techniques pour déployer l'IA générative sur les terminaux évoluent rapidement. La tendance selon laquelle les terminaux et les cloud vont de pair devient de plus en plus évidente.

Les grandes entreprises technologiques ont parfaitement saisi ces changements et ont entrepris une série de tentatives pour déployer de grands modèles d’IA générative sur les smartphones et autres terminaux. Par exemple, le lancement des versions ChatGPT iOS et Android permet aux utilisateurs ordinaires de vivre des conversations de chat génératives simplement en décrochant leur téléphone portable. Il y aura des moments plus importants comme celui-ci à l'avenir.

De plus, par rapport au cloud, le déploiement et l'exécution de l'IA générative côté terminal présentent également des avantages en termes de coût, de sécurité, de confidentialité et de fiabilité de fonctionnement.

Le premier est l’avantage en termes de coût. Auparavant, les médias avaient rapporté qu'OpenAI dépensait environ 700 000 dollars par jour simplement pour faire fonctionner ChatGPT, ce qui signifie que près de 200 millions de dollars pourraient avoir été dépensés pour ChatGPT. Un coût aussi élevé est trop élevé même pour OpenAI, ce qui rend difficile le seuil de rentabilité, et encore moins la réalisation de bénéfices. Le côté terminal est différent. Le coût est considérablement réduit. Le déploiement du modèle léger compressé ne doit payer que le coût du matériel, sans tenir compte d'autres problèmes tels que la bande passante, la consommation d'énergie et la transmission réseau.

Deuxièmement, l’exécution d’une IA générative côté terminal peut protéger les données privées avec une plus grande confiance, contrairement au risque potentiel de fuite d’informations dans le cloud. Ce n'est pas sans fondement : en avril de cette année, il a été révélé que des employés du département des semi-conducteurs téléchargeaient des données sur le cloud lorsqu'ils utilisaient ChatGPT, entraînant une fuite de données confidentielles, et ont ensuite annoncé une interdiction. Le fonctionnement du terminal ne nécessite pas de télécharger du texte, des images, des vidéos et d'autres informations sur le cloud, ce qui évite ce risque et garantit que la confidentialité n'est pas divulguée et que la sécurité est renforcée.

La faible latence est également un avantage majeur côté terminal. Le cloud doit transmettre les données au cloud pour traitement avant que les résultats puissent être renvoyés. Au cours du processus, la transmission réseau entraînera inévitablement des retards. Le côté terminal n'a pas besoin de télécharger des informations sur le serveur cloud ou le centre de données, la vitesse de réponse est améliorée et le délai est réduit. Dans le même temps, le fonctionnement local est plus fiable et peut parfois être exécuté hors ligne, ce qui réduit dans une certaine mesure la dépendance aux services cloud et aux connexions réseau.

Le côté terminal propose également des scénarios d’application et des informations situationnelles plus riches que le cloud, apportant une interaction et une expérience plus personnalisées. Les utilisateurs peuvent affiner et personnaliser les paramètres et les fonctions du modèle pour différents scénarios d'application ou différents besoins dans le même scénario, leur offrant ainsi une flexibilité totale.

Grâce à ces avantages, la voie à suivre pour déployer l’IA générative côté terminal devient de plus en plus claire, et elle occupe de plus en plus une position tout aussi importante que le cloud. Comme l'a déclaré Hou Mingjuan, vice-président mondial de Qualcomm, lors de la conférence de presse hors ligne du livre blanc « L'IA hybride est l'avenir de l'IA », « l'IA côté terminal est la clé pour réaliser une architecture d'IA hybride et étendre l'IA générative à un plus large éventail de domaines. monde."

Hou Mingjuan

Qualcomm l'a dit et l'a fait. Dans cette révolution côté terminal liée à l'IA générative, Qualcomm a pris les devants en klaxonnant et est devenu l'un des principaux promoteurs de la révolution de l'IA côté terminal, et a formé une voie de développement d'IA hybride dans laquelle le cloud et les terminaux travaillent ensemble. la disposition. Ce choix d'itinéraire reflète en outre la clairvoyance et le leadership de Qualcomm en matière de capacités technologiques d'IA côté terminal et d'IA générative.

Développez l'IA générative côté terminal avec une longueur d'avance

L’IA dite hybride fonctionne principalement de deux manières : premièrement, dans certains scénarios, l’informatique est principalement centrée sur le terminal et transfère les tâches vers le cloud lorsque cela est nécessaire. Deuxièmement, dans un scénario centré sur le cloud, les terminaux partagent une partie de la charge de travail du cloud lorsque cela est possible en fonction de leurs propres capacités. Le cloud et le terminal remplissent chacun leurs propres fonctions et s'entraident.

Par rapport au cloud, le plus grand avantage de l'IA hybride est d'allouer et de coordonner plus efficacement les charges de travail d'IA dans différents scénarios et moments, d'améliorer l'efficacité de l'utilisation des ressources et de réduire les coûts d'exploitation.

Dans la conception de l'IA hybride de Qualcomm, qu'elle soit centrée sur le terminal, basée sur la perception du terminal ou sur le traitement collaboratif du terminal et du cloud, il est souligné que les capacités d'IA côté terminal sont la clé pour renforcer l'IA hybride et permettre à l'IA générative de parvenir à une expansion à l'échelle mondiale. . . En particulier pour l’IA générative, l’IA hybride signifie utiliser pleinement la puissance de calcul côté terminal pour prendre en charge les applications d’IA générative, tout comme ChatGPT sur les téléphones mobiles.

Cependant, il est plus facile à dire qu'à faire de déployer et d'exécuter avec succès de grands modèles d'IA générative sur des terminaux. La condition préalable à la mise en œuvre est de solides capacités d'IA côté terminal. En tant que fabricant de puces en amont, Qualcomm a toujours été le leader de l'IA côté terminal.Il a formé une optimisation complète de l'IA, des puces aux logiciels en passant par les algorithmes et l'écosystème, de sorte que ni les logiciels ni le matériel ne soient entravés, et que le côté terminal L’accélération de l’inférence de l’IA peut être obtenue.

Optimisation de l'IA full stack Qualcomm

Tout d'abord, au niveau des puces matérielles, de la plate-forme phare précédente Snapdragon 888 et du Snapdragon 8 de première génération au Snapdragon 7 haut de gamme de deuxième génération et au Snapdragon 8 phare de deuxième génération lancés l'année dernière, les capacités d'IA se poursuivent. pour évoluer, avec l'amélioration, les capacités d'IA côté terminal seront améliorées en conséquence. Parmi eux, le moteur Qualcomm AI Engine (actuellement la huitième génération), constamment mis à niveau, joue un rôle important. Son processeur Hexagon, son GPU Qualcomm Adreno et son processeur Qualcomm Kryo sont conçus pour exécuter efficacement les applications d'IA côté terminal et optimiser les utilisateurs d'IA côté terminal grâce à méthodes de calcul hétérogènes.

La puissance de calcul de l'IA du Snapdragon 8 de troisième génération, qui sera lancé en octobre de cette année, devrait encore être améliorée.Nous sommes encore plus enthousiasmés par le type de fonctions d'IA côté terminal qu'il peut prendre en charge.

Outre l'accélération matérielle continue, le plus grand défi de l'IA côté terminal réside dans le logiciel : il doit garantir l'exécution de différents modèles de traitement neuronal et les calculs doivent être suffisamment rapides et efficaces. La pile logicielle Qualcomm AI aide les développeurs à créer, optimiser et déployer plus efficacement des applications IA sur le matériel, obtenant ainsi l'effet d'un développement unique et d'un déploiement multiple d'applications. Comme vous pouvez le voir sur la figure ci-dessous, cette pile logicielle améliore l'efficacité du développement à plusieurs niveaux, notamment les cadres d'IA pris en charge, les kits de développement de logiciels d'inférence, les bibliothèques et services de développement, les logiciels système et les systèmes d'exploitation.

Pile logicielle Qualcomm AI

De plus, en termes de développement d'algorithmes et de modèles, il s'engage à améliorer l'efficacité sans sacrifier la précision. À cet égard, il existe des algorithmes basés sur le modèle Q-SRNet, des solutions de quantification INT4, etc. Par exemple, Snapdragon 8 Gen2 prend en charge pour la première fois le format de précision INT4 AI, ce qui apporte une amélioration de 60 % de l'efficacité énergétique et une amélioration de 90 % des performances d'inférence de l'IA par rapport à INT8.

Qualcomm continue également de faire des efforts sur le plan écologique, et ses avantages techniques dans le domaine des téléphones mobiles peuvent être étendus à d'autres terminaux comme les voitures, les PC, le XR et l'Internet des objets. Dans le même temps, sur la base de la propriété intellectuelle et de la technologie distribuée dans divers domaines, Qualcomm est en mesure de mener une coopération approfondie dans plusieurs écosystèmes, tels que le domaine PC et Microsoft, le domaine XR et Meta, et de réaliser rapidement une expansion à grande échelle grâce à bonne coopération écologique.

On peut dire que les capacités d'IA puissantes et complètes de Qualcomm côté terminal, en particulier l'architecture d'accélération matérielle de l'IA et la pile logicielle capable de faire face aux changements potentiels dans l'architecture du modèle d'IA générative, ont ouvert la voie au raisonnement de l'IA côté terminal et a posé une base solide pour l'expansion de l'IA générative aux terminaux. La base technique permet aux applications d'IA générative de fonctionner sur des terminaux tels que les téléphones mobiles. Dans le même temps, Qualcomm est également tourné vers l’avenir en termes d’exploration de l’IA générative.

Depuis les premières recherches sur la méthode de compression des modèles d'IA générative, utilisant VAE pour créer des codecs vidéo et vocaux pour contrôler la taille du modèle en dessous de 100 millions de paramètres, jusqu'à l'utilisation de l'IA générative pour remplacer les modèles de canaux dans le domaine sans fil afin d'améliorer l'efficacité de la communication des téléphones mobiles, Qualcomm a toujours été ciblé pour faire progresser l’IA générative.

Bien entendu, les résultats sont également très significatifs. Au cours des six derniers mois, la nouvelle selon laquelle Qualcomm exécutait de grands modèles d'IA générative sur les téléphones mobiles a déclenché des discussions animées, notamment l'exécution du modèle graphique Vincent à 1 milliard de paramètres Stable Diffusion et du modèle de graphe Vincent à 1,5 milliard de paramètres. génération d'image modèle d'image ControlNet. En plus de démontrer les capacités de peinture de l'IA sur les appareils mobiles, Qualcomm explore également l'extension des capacités de l'IA générative dans d'autres directions techniques telles que les humains numériques.

*ControlNet sur le téléphone mobile termine le rendu en 12 secondes. *

À l'avenir, sur la base de l'expérience accumulée par Qualcomm en matière d'exploitation de téléphones mobiles et de l'amélioration continue de la puissance de calcul des puces SoC, le fonctionnement des terminaux avec davantage de modèles de paramètres approche à grands pas. Ziad Asghar, vice-président senior de la gestion des produits et responsable de l'IA chez Qualcomm, a déclaré dans une interview que des modèles d'IA génératifs pouvant prendre en charge 10 milliards de paramètres seront exécutés sur les téléphones mobiles cette année. De plus, il coopérera avec Meta pour lancer une version mobile de Llama 2 l'année prochaine. Cela rend l’avenir de l’IA générative plus prometteur.

À notre avis, la plus grande importance de l'IA côté terminal est de mettre de grands modèles d'IA générative entre les mains de tous, ce qui est plus bénéfique pour l'expansion et la vulgarisation à grande échelle de l'IA générative et peut également créer des avantages commerciaux. En prenant comme exemple la peinture par IA générative, si elle peut ressembler à la caméra Miaoya qui est devenue populaire sur WeChat Moments il y a quelque temps, l'exécution de l'IA générative sur les téléphones mobiles produira des effets de trafic incommensurables.

Cependant, la conception de l'IA générative de Qualcomm n'est certainement pas destinée à un effet de trafic temporaire, mais à l'aide de téléphones mobiles, d'ordinateurs portables, d'appareils portables XR, de maisons intelligentes, de voitures et d'autres supports possibles d'applications d'IA générative, d'une manière plus proche. aux utilisateurs. , permettant à davantage de personnes de profiter de la nouvelle expérience d'IA rapidement et facilement. Comme le dit la couverture de son livre blanc, « rendre l’IA à portée de main ». Qualcomm fait en sorte que cela ne soit plus loin.

Conclusion

Depuis ChatGPT, l’IA générative est devenue une tendance de développement imparable. Compte tenu de la grande commodité qu'elle apportera à nos vies, il est impératif d'accélérer la vulgarisation de l'IA générative. Heureusement, Qualcomm a jeté les bases. Nous avons appris que Qualcomm est profondément impliqué dans le domaine de l'IA depuis plus de 15 ans, en particulier dans le domaine de l'informatique mobile, et qu'il a acquis un leadership technique approfondi. Il existe actuellement des milliards de terminaux intelligents équipés de plates-formes Snapdragon et Qualcomm dans le monde, ce qui porte les capacités d'essai et d'erreur de l'IA côté terminal et le potentiel des applications d'IA générative à des sommets sans précédent.

Dans le même temps, en élargissant et en approfondissant l'autonomisation de l'IA côté terminal et en étendant l'IA générative à davantage de domaines et de scénarios, elle peut non seulement offrir aux utilisateurs ordinaires une expérience d'IA plus diversifiée, plus amusante et plus pratique, mais elle peut également créer plus de possibilités. opportunités de marché pour ses partenaires de l’écosystème de terminaux intelligents et libérer véritablement sa valeur.

Pour Qualcomm, l’IA générative côté terminal revêt une importance considérable. Lors du Forum sur les tendances de développement du commerce numérique et le Sommet sur les frontières du Salon chinois des services, Meng Pu, président de Qualcomm Chine, a prononcé un discours liminaire, mettant l'accent sur une coopération étroite avec l'écosystème mondial pour explorer conjointement des technologies telles que la 5G, l'IA et Internet. des choses. De toutes nouvelles applications et expériences mobiles. En tant que technologie d’IA générative actuellement à l’avant-garde, sa force, sa quantité et sa difficulté détermineront en grande partie si celles-ci peuvent être mises en œuvre avec succès.

L’exploitation de l’IA générative côté terminal est impérative, et les entreprises écologiques et axées sur l’utilisateur telles que Qualcomm se démarqueront également par leur force.

Lien de référence :

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)