Combien de points l'IA peut-elle obtenir à l'examen d'entrée à l'université ? Jetez un œil aux résultats de ChatGPT 4 et Wenxin Yiyan

Question

Source originale : Hardcore Kanban![](https://img.gateio.im/social/moments-bab2147faf-e4f2c7b3dd-dd1a6f-62a40f) Crédit image : Généré par Unbounded AI‌Vous souvenez-vous de la recherche à chaud qui a été explosée par les essais d'examen d'entrée au collège de l'IA il n'y a pas si longtemps?Certaines personnes pensent que le niveau d'écriture de l'IA a dépassé la plupart des gens, et certaines personnes disent que l'IA ne peut obtenir que 0 points au testLes résultats de l'examen d'entrée au collège ont commencé à être publiés, et nous avons également trouvé les scores de l'IA...Les deux candidats à l'IA cette fois sont **ChatGPT-4** de Microsoft et **Wen Xin Yi Yan ** de Baidu.Après avoir répondu aux questions de composition du National Paper A, trois enseignants de première ligne de différentes régions ont simulé la notation de l'examen d'entrée au collège et les ont notés.![](https://img.gateio.im/social/moments-bab2147faf-a48b1465e5-dd1a6f-62a40f) ** Du point de vue de la vitesse de réponse, Wenxin Yiyan est encore meilleur **, a écrit 1103 mots en 29 secondes ; tandis que Chat GPT-4 n'a écrit que 846 mots en 1 minute et 42 secondes.Du point de vue de l'écriture, la composition de Wen Xinyiyan cite de nombreuses citations célèbres, donne de nombreux exemples et donne trois méthodes pour "faire travailler le temps pour moi" ;![](https://img.gateio.im/social/moments-bab2147faf-63c67a63bc-dd1a6f-62a40f) Le chat GPT-4 a d'abord affirmé la commodité de la vie apportée par la technologie, puis a expliqué comment la technologie rend les gens esclaves, et a finalement proposé d'utiliser la technologie de manière sélective et d'organiser le temps de manière rationnelle.![](https://img.gateio.im/social/moments-bab2147faf-a916ecdb3c-dd1a6f-62a40f) Selon vous, lequel obtiendra le score le plus élevé ?**Le score total est de 60 points et le score moyen attribué par les enseignants à Chat GPT est de 36 points. ****|** On peut dire qu'il s'agit d'un article insatisfaisant Cet article met lui aussi en évidence une faille dans le schéma de pensée ;**|** Bien que pertinent, l'ensemble de l'article manque d'un argument efficace et crédible ;**|** Utiliser trop d'espace invalide pour étendre le phénomène du matériau lui-même, au lieu de créer. La plupart d'entre eux sont des absurdités correctes, et il y en a trop peu qui sont vraiment constructifs, opérationnels et capables de toucher les points faibles.![](https://img.gateio.im/social/moments-bab2147faf-366b65991a-dd1a6f-62a40f) **Regardez à nouveau l'article de Wen Xinyiyan, avec une note moyenne de 42**. Voici ce qu'ont dit les professeurs de notation :**|** C'est celui qui a le plus de talents littéraires et les arguments les plus détaillés, mais il faut savoir qu'il n'est pas spécialement bon de trop citer ;**|** Bien que beaucoup de ces citations, versets et de nombreux exemples y soient utilisés, beaucoup d'entre eux sont des exemples que de nombreux candidats aiment utiliser, comme je répare des reliques culturelles dans la Cité Interdite ;**|** L'exemple est très bon, mais il n'explique pas clairement la relation entre les personnes et le temps ;**|** Il est évident que je veux écrire là où je veux écrire, la logique n'est pas forte, et le score ne sera pas élevé, car sa structure est trop ancienne, et tout l'article est essentiellement motivé par des preuves plutôt que la logique.![](https://img.gateio.im/social/moments-bab2147faf-361b2b4d43-dd1a6f-62a40f) Selon les normes de notation de l'examen d'entrée au collège, une excellente composition d'examen d'entrée au collège (essai de catégorie un) obtient généralement 50 points ou plus.Bien que les trois enseignants de différentes régions puissent avoir des scores globaux élevés ou faibles, le résultat moyen global montre toujours :** Les deux candidats IA avec une vitesse d'écriture rapide ne peuvent être considérés que comme de niveau moyen. **Remplir l'article selon l'algorithme héritera de nombreuses lacunes de longue date dans la composition de notre examen d'entrée à l'université précédent.De nombreux articles qui semblent être bons pour tout le monde ne répondent progressivement plus à nos besoins actuels pour l'examen d'entrée à l'université.![](https://img.gateio.im/social/moments-bab2147faf-e3fd1c9fe1-dd1a6f-62a40f) Profitant de cette occasion, nous avons également mené discrètement un **"test de Turing"**.En plus des deux compositions d'IA, une composition écrite par une personne réelle a également été remise aux professeurs de notation pour voir si les professeurs pouvaient faire la différence.![](https://img.gateio.im/social/moments-bab2147faf-09ed493f5c-dd1a6f-62a40f) L'argument d'ouverture de la composition de la personne réelle est "Si vous comptez aveuglément sur la technologie et devenez esclave du temps, alors le développement de la technologie n'aura aucun sens";Dans l'ensemble, cela dit que vous ne pouvez pas vous adonner à la technologie et profiter des avantages, et que vous ne pouvez pas résister aveuglément à la tendance du développement technologique. Vous devez utiliser la technologie avec l'aide d'une pensée "modérée" et apprendre à vous contrôler.![](https://img.gateio.im/social/moments-bab2147faf-6adf1a63d9-dd1a6f-62a40f) **Les professeurs ont marqué en moyenne 43 points sans savoir qu'il s'agissait de la composition d'une personne réelle, ce qui a battu de peu l'IA**, pour les raisons suivantes :* est le seul que je peux lire, mais le problème avec cet article est qu'il a mal placé l'accent. Sa compréhension de l'examen du sujet lui-même est un peu biaisée, il s'agit donc en fait d'un sous-titre avec un sujet partiel. fils de une chienne.* Un gentleman est doué pour tromper les choses, disant simplement que les gens devraient être bons pour apprendre et apprendre avec l'aide de choses étrangères;* La structure de l'ensemble de l'article, dans le processus de soulever et d'analyser les questions, il a accordé plus d'attention à la relation entre les personnes et la technologie, et a affaibli l'élément temps ;* Il est trop tard pour trouver de vrais arguments exploitables.![](https://img.gateio.im/social/moments-bab2147faf-549f7854ec-dd1a6f-62a40f) Dans le lien **"Distinguer la composition de personnes réelles"**, les traces évidentes de traduction anglais-chinois dans la composition Chat GPT-4 ont révélé sa véritable identité, et elle a d'abord été exclue par les enseignants.Les œuvres de Wen Xinyiyan sont plus déroutantes et les trois professeurs se sont tous demandé si cette œuvre provenait d'une personne réelle. La raison en est qu'ils ont également rencontré de nombreux étudiants qui souhaitent obtenir des notes élevées en citant des classiques et en accumulant la rhétorique dans l'enseignement.![](https://img.gateio.im/social/moments-bab2147faf-0847fd4414-dd1a6f-62a40f) Après cette bataille, tout le monde a dû remarquer qu'il est difficile pour l'IA d'écrire de près le sens du sujet ; les humains avec une pensée divergente plus forte tomberont inévitablement dans le piège de "trop penser" lorsqu'ils pensent profondément. **L'IA actuelle n'est encore qu'une cerise sur le gâteau pour la pensée humaine ; **En tant qu'élément important de la sélection des talents, l'examen d'entrée à l'université est également en constante évolution. Ce n'est qu'alors qu'il est encore meilleur. **