Nouvelle Paradigme d'Évaluation AI : Comment Yupp utilise Blockchain et Mécanismes d'Incitation pour Redéfinir l'Évaluation des Modèles
Avec le développement rapide de la technologie AI, évaluer avec précision la performance des modèles et améliorer la confiance des utilisateurs est devenu un problème urgent à résoudre. Les méthodes d'évaluation centralisées traditionnelles peinent à couvrir des scénarios diversifiés et ne peuvent pas refléter fidèlement les préférences des utilisateurs. Parallèlement, le problème des "illusions" des modèles AI survient fréquemment, et les utilisateurs se retrouvent souvent piégés dans des chambres d'écho d'information lors de leurs choix.
Dans ce contexte, Yupp, en tant que nouvelle plateforme, tente de redéfinir la découverte, la comparaison et l'utilisation des modèles d'IA grâce à un mode de financement participatif unique et à des mécanismes d'incitation, apportant ainsi une révolution dans le domaine de l'évaluation de l'IA.
Modèle d'évaluation innovant
Yupp s'engage à construire un marché de feedback AI "sans confiance", permettant à des retours d'utilisateurs diversifiés de circuler librement sous la protection de la blockchain et des incitations économiques liées aux cryptomonnaies, formant ainsi une couche d'évaluation de modèle évolutive, équitable et transparente. Grâce à la distribution incitative de données annotées manuellement de haute qualité, Yupp peut capturer rapidement les besoins et préférences réels des utilisateurs dans différents scénarios, aidant les développeurs d'IA à optimiser en continu les performances des modèles.
Le projet a été fondé en juin 2024 par Pankaj Gupta et Gilad Mishne, avec la participation du directeur scientifique Jimmy Lin. Les trois ont travaillé ensemble chez Twitter, où ils ont construit et optimisé des systèmes de recommandation et de recherche à grande échelle, avant d'acquérir une riche expérience chez Google et Coinbase.
Financement et soutien
Yupp a récemment terminé un tour de financement de 33 millions de dollars, recevant une reconnaissance élevée de la part de personnalités bien connues de l'industrie technologique et de grands investisseurs en capital-risque. Les investisseurs comprennent Chris Dixon, partenaire d'A16z, Jeff Dean, scientifique en chef de Google, Biz Stone, cofondateur de Twitter, Evan Sharp, cofondateur de Pinterest, Aravind Srinivas, PDG de Perplexity et 45 autres anges et dirigeants d'entreprises bien connus, ainsi que Coinbase Ventures.
Expérience utilisateur et fonctionnalités
Yupp adhère au concept d'"IA partagée par tous", permettant aux utilisateurs de découvrir, comparer et utiliser facilement les derniers modèles d'IA. La particularité de la plateforme réside dans le fait qu'elle renvoie les réponses de plusieurs modèles simultanément pour chaque invite, formant ainsi une "assemblée d'IA". Ce design satisfait non seulement le besoin de choix diversifiés des utilisateurs, mais permet également d'identifier efficacement les "hallucinations" que les modèles peuvent présenter, aidant ainsi les utilisateurs à prendre des décisions plus éclairées par la comparaison.
Actuellement, Yupp prend en charge plus de 500 modèles d'IA, couvrant les domaines de la génération de texte et d'images. La plateforme a également lancé la fonction "QuickTake", qui permet de résumer des réponses longues en un résumé concis. En termes de protection de la vie privée, Yupp définit par défaut tous les historiques de chat comme privés, et les utilisateurs peuvent complètement contrôler le contenu et l'étendue du partage.
Modèle économique et mécanismes d'incitation
Yupp utilise le système "Yupp积分" pour évaluer l'utilisation des modèles et la contribution des utilisateurs. Les nouveaux utilisateurs reçoivent 5000 points à l'inscription, puis peuvent en gagner davantage en notant les réponses du modèle, en choisissant des préférences et en expliquant leurs raisons. Plus la qualité des retours est élevée, plus les récompenses sont généreuses, garantissant ainsi aux utilisateurs une utilisation gratuite et durable des modèles haut de gamme.
Les points peuvent être échangés contre plusieurs monnaies, chaque 1000 points équivalant à 1 dollar. Les utilisateurs peuvent retirer jusqu'à 10 dollars par jour, avec un maximum de 50 dollars par mois. La plateforme intègre également Base Ethernet L2 et des stablecoins Solana, offrant aux utilisateurs du monde entier des récompenses instantanées et sans frais.
Système de notation Yupp VIBE
Pour résoudre les problèmes de transparence et d'équité des classements existants, Yupp a lancé la version bêta du classement AI et du système de notation "Yupp VIBE (Vibe Intelligence Benchmark) Score". Ce système regroupe les données de préférence générées par les utilisateurs du monde entier lors d'interactions naturelles, dans le but de fournir des résultats d'évaluation robustes et fiables.
Les principes d'évaluation de Yupp incluent la robustesse (couvrir une variété de scénarios, refléter les préoccupations réelles des utilisateurs, résister aux comportements malveillants) et la fiabilité (équité, neutralité, transparence, rigueur scientifique). La plateforme ne se contente pas de recueillir des préférences binaires, mais encourage également les utilisateurs à indiquer les avantages et les inconvénients des réponses, et effectue une analyse de segmentation basée sur les informations démographiques des utilisateurs pour montrer les différences de préférences entre différents groupes.
Sur le plan technique, Yupp explore l'utilisation de la Blockchain, des primitives cryptographiques et des preuves à divulgation nulle de connaissance pour garantir l'équité, la transparence et la vérifiabilité du processus d'évaluation. Parallèlement, la plateforme a collaboré avec des fournisseurs de données AI professionnels pour calibrer les évaluateurs par le biais de contrôles de qualité en plusieurs étapes, éliminant ainsi les données malveillantes.
 Score". Ce système regroupe les données de préférence générées par les utilisateurs du monde entier lors d'interactions naturelles, dans le but de fournir des résultats d'évaluation robustes et fiables.
Les principes d'évaluation de Yupp incluent la robustesse (couvrir une variété de scénarios, refléter les préoccupations réelles des utilisateurs, résister aux comportements malveillants) et la fiabilité (équité, neutralité, transparence, rigueur scientifique). La plateforme ne se contente pas de recueillir des préférences binaires, mais encourage également les utilisateurs à indiquer les avantages et les inconvénients des réponses, et effectue une analyse de segmentation basée sur les informations démographiques des utilisateurs pour montrer les différences de préférences entre différents groupes.
Sur le plan technique, Yupp explore l'utilisation de la Blockchain, des primitives cryptographiques et des preuves à divulgation nulle de connaissance pour garantir l'équité, la transparence et la vérifiabilité du processus d'évaluation. Parallèlement, la plateforme a collaboré avec des fournisseurs de données AI professionnels pour calibrer les évaluateurs par le biais de contrôles de qualité en plusieurs étapes, éliminant ainsi les données malveillantes.
![a16z a conduit un tour de table de 33 millions de dollars, comment Yupp redéfinit-il le modèle d'évaluation de l'IA basé sur Blockchain et l'incitation ?](https://img-cdn.gateio.im/webp-social/moments-72ec1eb4ea4b0853690939a455fd9194.webp01
Histoire et perspectives d'avenir
Yupp sera officiellement lancé le 13 juin 2025, après six mois de tests internes. Depuis son lancement, le produit a continué à évoluer, ajoutant des fonctionnalités telles que le support multimodal, l'interaction vocale, la recherche d'informations en temps réel, et en introduisant constamment de nouveaux modèles d'IA.
La mission de Yupp est "d'autonomiser l'humanité à façonner l'avenir de l'IA". Grâce à des réponses AI multi-perspectives et aux retours des utilisateurs, Yupp aide non seulement les utilisateurs à prendre de meilleures décisions, mais fournit également l'énergie pour l'évolution continue de l'IA.
Cependant, Yupp fait encore face à certains défis. Comment garantir en continu la qualité des données avec une participation massive des utilisateurs, résister aux comportements frauduleux potentiels, et trouver un équilibre entre commercialisation et incitation des utilisateurs, sera une direction qu'il faudra constamment explorer et optimiser dans son développement futur.
Dans l'ensemble, Yupp ouvre de nouvelles voies pour l'évaluation de l'IA grâce à un modèle de crowdsourcing innovant, un mécanisme d'incitation et un système d'évaluation basé sur les préférences réelles des utilisateurs. Il offre non seulement aux utilisateurs une expérience d'interaction avec l'IA gratuite et variée, mais transforme également les retours des utilisateurs en données d'entraînement à haute valeur ajoutée, favorisant ainsi l'optimisation continue des modèles. Grâce à une équipe expérimentée et à un soutien financier de premier ordre, Yupp est appelé à jouer un rôle important dans l'écosystème de l'IA à venir, réalisant la vision "Chacun profite de l'IA, chacun façonne l'IA".