Le GPT-5 arrive ? Quels changements drastiques se produiront dans l'industrie de l'IA

Depuis l'avènement de chatGPT, l'IA évolue rapidement sur une base mensuelle. Avec autant de modèles et d'itérations rapides, beaucoup de gens ne peuvent s'empêcher de réaliser que les humains semblent vraiment se tenir au bord de la porte AGI.

Récemment, un document divulgué par l'Office américain des brevets et des marques (USPTO) montre qu'OpenAI a déposé une demande de marque pour "GPT-5" le 18 juillet. et a été accepté.

Capture d'écran du fichier USPTO

Bien qu'au cours du premier semestre de cette année, divers experts et universitaires en IA aient publié plusieurs fois conjointement des lettres ouvertes, appelant les gens à prêter attention aux risques potentiels de l'IA générative, et OpenAI a également annoncé à l'époque qu'il n'aurait pas de plan former GPT-5 à court terme.

Cependant, la tentation de la science et de la technologie a finalement permis à l'être humain de briser les frontières taboues.

Dans l'application divulguée cette fois, OpenAI a mentionné que le GPT-5 inédit aura de nombreuses fonctionnalités que GPT-4 n'a pas, et presque chaque élément fait référence à AGI.

Capture d'écran du fichier USPTO

Alors, que signifie un tel changement pour l'IA et les humains ?

Aujourd'hui, cet article tentera de mener une analyse simple des fonctions, des changements et de l'impact possibles de GPT-5 à partir des informations limitées divulguées dans les documents d'application d'OpenAI.

01 La route vers AGI

Dans le document dévoilé cette fois, l'un des premiers changements évoqués par OpenAI est l'enrichissement des fonctions multimodales.

Plus précisément, les fonctions de GPT-5 incluent la traduction de texte ou de parole d'une langue à une autre, la reconnaissance vocale, la génération de texte et de parole, etc.

Bien que dans le GPT-4 actuel, les utilisateurs puissent également réaliser une traduction entre différentes langues, mais puisque la fonction de traduction est ici pointée du doigt, elle a dû être ré-optimisée.

Pourquoi OpenAI met-il autant en avant la capacité de traduction de GPT-5 ?

Cela peut être dû au fait que l'une des conditions préalables pour que GPT devienne universel est de minimiser l'écart de coût lié à l'utilisation de grands modèles dans différentes langues.

Auparavant, les résultats de la recherche de l'Université d'Oxford ont montré qu'en raison des méthodes de mesure et de facturation des coûts de serveur adoptées par des services tels que OpenAI, le coût de l'entrée et de la sortie en anglais est bien inférieur à celui des autres langues.

Parmi eux, le coût du chinois simplifié est environ le double de celui de l'anglais, l'espagnol est 1,5 fois celui de l'anglais et la langue Shan au Myanmar est 15 fois celle de l'anglais.

Parce que les langues comme le chinois ont des structures différentes et plus complexes, elles nécessitent un taux de lemmatisation plus élevé.

Par exemple, selon le tokenizer GPT3 d'OpenAI, le jeton pour "votre affection" ne nécessite que deux jetons en anglais, mais huit jetons en chinois simplifié.

Cela signifie que pour les langues autres que l'anglais, il est beaucoup plus coûteux d'utiliser et de former des modèles.

Et une fois le seuil de la "barrière de la langue" franchi, cette barrière universelle devant GPT sera sans doute directement franchie.

De plus, la fonction de reconnaissance vocale proéminente dans le document semble n'être qu'un changement discret, mais dans une certaine mesure, il s'agit d'un autre élément du pavage d'OpenAI de GPT-5 sur la route de la brique AGI.

Comme nous le savons tous, dans l'orientation future du développement des grands modèles, il est devenu une tendance de plus en plus évidente que les modèles deviennent marginalisés et terminalisés.

Depuis que Qualcomm a lancé un grand modèle avec 1 milliard de paramètres pouvant fonctionner sur les téléphones mobiles en juillet de cette année, des fabricants tels que Honor et Apple ont également annoncé qu'ils lanceraient leurs propres téléphones mobiles "grand modèle".

À partir des téléphones mobiles, les données de l'IA à l'avenir seront de plus en plus traitées côté terminal, comme les caméras, les capteurs et la conduite autonome.

Dans un tel scénario d'application, la reconnaissance vocale est sans aucun doute plus pratique et efficace.

Par exemple, le modèle de langage AI permet au conducteur de contrôler le véhicule par la voix. Convertissez les commandes vocales du conducteur en commandes exécutables, telles que le démarrage, l'arrêt, l'accélération, le freinage et d'autres opérations.

Les assistants intelligents qui existent dans le système de téléphonie mobile comme SIri donneront également la priorité au contrôle par commandes vocales.

On peut voir que la reconnaissance vocale n'est pas seulement la cerise sur le gâteau, mais une "configuration standard" lorsque GPT-5 entre du côté du terminal.

Et grâce au naufrage de chaque terminal, GPT-5 obtiendra également des structures de données plus marginalisées et non linguistiques.

Après tout, depuis le développement du grand modèle, les données textuelles pouvant être absorbées sont presque les mêmes. Si nous voulons faire un pas de plus vers l'AGI, ce type de données "non textuelles" est très important.

02 Modèle d'expert du défi

En plus des caractéristiques ci-dessus, le document soumis par OpenAI mentionnait également : "GPT-5 peut également avoir la capacité d'apprendre, d'analyser, de classer et de répondre aux données".

À en juger par la tendance actuelle du développement de l'intelligence artificielle, cela signifie probablement que GPT-5 a la capacité d'apprentissage actif similaire à celle d'un corps intelligent.

Et cette capacité rendra GPT-5 fondamentalement différent des modèles précédents qui ne peuvent apprendre de nouvelles connaissances que passivement grâce aux données d'alimentation humaine.

Plus précisément, la capacité d'apprentissage actif signifie que le modèle peut sélectionner, acquérir et traiter de manière indépendante des données en fonction de ses propres objectifs et besoins, plutôt que de se fier uniquement aux données fournies par les humains.

Cela permet au modèle d'utiliser plus efficacement les informations et les connaissances contenues dans les données, et de s'adapter de manière plus flexible à différents environnements de données et scénarios de tâches, plutôt que de se contenter de recevoir et de produire passivement des données.

Et une telle capacité est particulièrement importante lorsque GPT-5 fait face à des champs verticaux relativement peu familiers.

Certains domaines spécifiques, tels que la médecine, le droit, la finance, etc., ont généralement leurs propres termes, règles et systèmes de connaissances spécifiques, qui peuvent être difficiles à comprendre et à traiter pour les modèles de langage ordinaire.

Si GPT-5 a la capacité d'apprentissage actif, il peut automatiquement collecter et mettre à jour les données pertinentes dans ces domaines à partir d'Internet, analyser et classer les concepts de base, les principes importants et les derniers développements dans ces domaines, et répondre aux problèmes courants dans ces domaines. , Cas typiques et applications pratiques.

De cette manière, GPT-5 peut maîtriser plus rapidement l'expertise dans ces domaines et accomplir les tâches correspondantes dans ces domaines avec plus de précision et d'efficacité.

Et tout cela est la clé du vrai modèle général.

Car si GPT a toujours besoin d'être connecté à un "modèle expert" spécifique pour résoudre des tâches professionnelles, on ne peut pas dire qu'il soit vraiment "universel".

Étant donné que cela conduira aux différences et à la dépendance de GPT vis-à-vis des capacités de renseignement de différents domaines et scénarios, et augmentera également les coûts de communication et de coordination entre GPT et le "modèle expert", et ne peut garantir que des services de haute qualité peuvent être obtenus sous n'importe quel circonstances.

Auparavant, Semianalysis, un média étranger, avait révélé les secrets du GPT-4 publié en mars de cette année, révélant qu'OpenAI utilise un modèle expert mixte pour créer le GPT-4.

Selon les nouvelles, GPT-4 utilise 16 modèles experts mixtes (mélange d'experts), chacun avec 111 milliards de paramètres, et chaque route de passage passe par deux modèles experts.

Cependant, des modèles plus experts signifient qu'il est plus difficile de généraliser et d'atteindre la convergence.

En effet, chaque modèle expert a ses propres paramètres et stratégies, souvent difficiles à coordonner, ce qui rend difficile pour GPT d'équilibrer et de "prendre en compte la situation globale".

Après avoir eu la capacité d'apprentissage actif, GPT-5 pourra utiliser des capacités de compréhension et de raisonnement multimodales, ainsi que des cartes de connaissances et des bases de données, pour analyser et comprendre les données acquises, et grâce à des algorithmes de regroupement et des classificateurs, Relier et résumer les données connexes .

De cette manière, GPT-5 peut utiliser efficacement les informations et les connaissances contenues dans les données selon différents environnements de données et scénarios de tâches.

03 remplacer plus de travail

Comme mentionné ci-dessus, après avoir franchi la barrière de la langue et être entré dans le terminal avec une fonction de reconnaissance vocale pratique, GPT-5 continuera d'absorber les connaissances dans différents scénarios, domaines et modes grâce à des capacités d'apprentissage actif continu, puis se dirigera vers la route vers l'AGI. se déplace à grande vitesse.

Il est prévisible que lorsque le GPT-5 avec une "universalité" aussi forte commencera à se répandre dans divers domaines, à l'exception de quelques industries avec des barrières de données (comme les soins médicaux), les grands modèles dans la plupart des domaines verticaux seront progressivement éclipsés.

Parce qu'en fin de compte, pas mal d'experts ou de grands modèles verticaux sont essentiellement le produit de certaines entreprises à la puissance de calcul et aux données insuffisantes, incapables de gravir le "modèle général à grande échelle", et doivent se contenter du meilleur suivant (c'est particulièrement évident en Chine).

Si un grand modèle à usage général peut être compétent dans la plupart des industries en raison de sa forte capacité d'apprentissage, alors qui serait prêt à passer fastidieusement d'un modèle à l'autre et à supporter plusieurs coûts de formation et d'utilisation pour différents modèles ?

De ce point de vue, le modèle expert est progressivement remplacé par le modèle général, qui est un processus historique inévitable pour les êtres humains sur la voie de l'IAG.

Un autre phénomène qui accompagne cela est que des tâches plus subdivisées et triviales sont remplacées.

Parce qu'avec un modèle général plus puissant, les gens trouveront qu'en fait, le contenu de travail de plusieurs postes peut être fusionné et intégré.

Les chefs de produit et les analystes de données en sont un exemple possible.

Par exemple, dans un nouveau projet de développement de produit, GPT-5 peut rechercher des études de marché pertinentes, des analyses de produits concurrentiels, des portraits d'utilisateurs et d'autres données sur Internet en fonction d'un concept ou d'une demande de produit donné, et les télécharger dans sa propre mémoire.

Après cela, il analysera et comprendra les données acquises grâce à ses propres capacités de compréhension multimodale et de raisonnement logique, ainsi qu'à des graphes de connaissances et à des bases de données.

Après avoir obtenu les données correspondantes, les classer et les organiser, GPT-5 apprendra les stratégies de marketing pertinentes, les commentaires des utilisateurs et d'autres informations à partir des commentaires du système de dialogue grâce à la capacité de compréhension de la langue, et les comparera avec les concepts de produits donnés ou les besoins sont comparés et évalué.

De cette manière, les deux postes de chef de produit et d'analyste de données sont effectivement "fusionnés".

Sur la route inachevée vers AGI, il y a d'innombrables emplois qui sont fusionnés et remplacés.

Par conséquent, un GPT-5 plus polyvalent est non seulement une aubaine pour les progrès de la productivité, mais également un prélude à un tremblement de terre majeur dans l'industrie.

À ce moment-là, de nombreuses entreprises qui n'ont pas encore la capacité d'utiliser des modèles à grande échelle et qui manquent de barrières industrielles s'effondreront fragilement comme des châteaux de sable.

Et les individus plus ordinaires, face aux postes qui sont constamment remplacés, ressentiront plus profondément l'incertitude des temps...

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)