AI có thể đạt bao nhiêu điểm trong kỳ thi tuyển sinh đại học? Hãy xem kết quả của ChatGPT 4 và Wenxin Yiyan

Nguồn gốc: Hardcore Kanban

Tín dụng hình ảnh: Được tạo bởi AI‌ không giới hạn

Bạn còn nhớ cụm từ tìm kiếm nóng hổi đã bùng nổ bởi các bài luận về kỳ thi tuyển sinh đại học AI cách đây không lâu?

Một số người cho rằng trình độ viết của AI đã vượt qua hầu hết mọi người, và một số người nói rằng AI chỉ có thể đạt 0 điểm trong bài kiểm tra

Kết quả của kỳ thi tuyển sinh đại học bắt đầu được công bố, và chúng tôi cũng tìm thấy điểm của AI...

Hai thí sinh AI lần này là ChatGPT-4 của Microsoft và Wen Xin Yi Yan của Baidu.

Sau khi họ trả lời các câu hỏi thành phần của Bài thi Quốc gia A, ba giáo viên hàng đầu từ các khu vực khác nhau đã mô phỏng cách chấm điểm của kỳ thi tuyển sinh đại học và chấm điểm cho họ.

Từ góc độ tốc độ trả lời, Wenxin Yiyan thậm chí còn tốt hơn, đã viết 1103 từ trong 29 giây; trong khi Chat GPT-4 chỉ viết 846 từ trong 1 phút 42 giây.

Từ quan điểm viết lách, sáng tác của Wen Xinyiyan trích dẫn rất nhiều câu nói nổi tiếng, đưa ra nhiều ví dụ và đưa ra ba phương pháp "làm cho thời gian làm việc cho tôi";

Trò chuyện GPT-4 đầu tiên khẳng định sự tiện lợi trong cuộc sống do công nghệ mang lại, sau đó nói về việc công nghệ biến con người thành nô lệ như thế nào, cuối cùng là đề xuất sử dụng công nghệ có chọn lọc và sắp xếp thời gian hợp lý.

Bạn nghĩ cái nào sẽ đạt điểm cao hơn?

** Điểm đầy đủ là 60 điểm và điểm trung bình mà giáo viên cho Chat GPT là 36 điểm. **

*| Có thể nói đây là một bài viết chưa đạt yêu cầu, bài viết này quá nêu ra một lỗ hổng trong tư duy;

*| Mặc dù có liên quan nhưng toàn bộ bài viết thiếu một lập luận hiệu quả và đáng tin cậy;

*| Sử dụng quá nhiều không gian không hợp lệ để mở rộng hiện tượng của chính vật liệu, thay vì sáng tạo. Hầu hết trong số chúng là những điều vô nghĩa đúng đắn và có quá ít thứ thực sự mang tính xây dựng, hoạt động và có thể đánh trúng điểm đau.

Xem lại bài của Wen Xinyiyan, điểm trung bình là 42.Đây là lời của các giáo viên chấm bài:

*| Đó là bài có tài văn chương nhất, lập luận chi tiết nhất, nhưng phải biết rằng trích dẫn nhiều quá cũng không hẳn hay;

*| Mặc dù rất nhiều trích dẫn, câu thơ và nhiều ví dụ được sử dụng trong đó, nhưng nhiều ví dụ trong số đó là những ví dụ mà nhiều thí sinh thích sử dụng, chẳng hạn như Tôi đang sửa chữa các di tích văn hóa trong Tử Cấm Thành;

*| Ví dụ rất hay nhưng chưa giải thích rõ mối quan hệ giữa con người và thời gian;

*| Rõ ràng là muốn viết đâu viết đấy, logic không chặt, điểm sẽ không cao, bởi vì cấu trúc của anh ấy quá cũ, cả bài về cơ bản đều dựa vào dẫn chứng chứ không phải hơn logic.

Theo tiêu chuẩn chấm điểm của kỳ thi tuyển sinh đại học, một bài thi tuyển sinh đại học xuất sắc (bài luận loại một) thường đạt từ 50 điểm trở lên.

Mặc dù ba giáo viên đến từ các khu vực khác nhau có thể có điểm tổng thể cao hoặc thấp nhưng kết quả trung bình chung vẫn cho thấy:

**Hai ứng cử viên AI có tốc độ viết nhanh chỉ có thể được coi là ở mức trung bình. **

Việc hoàn thiện bài viết theo thuật toán sẽ kế thừa nhiều thiếu sót lâu nay trong cách soạn đề thi tuyển sinh đại học trước đây của chúng ta, nhiều bài văn tưởng chừng hay đối với mọi người đã dần không còn đáp ứng được nhu cầu ôn thi đại học hiện nay của chúng ta.

Nhân cơ hội này, chúng tôi cũng lặng lẽ tiến hành "Thử nghiệm Turing".

Ngoài hai bài sáng tác AI, một bài sáng tác do người thật viết cũng được chuyển cho giáo viên chấm bài để xem giáo viên có phân biệt được không.

Lập luận mở đầu của sáng tác Người thật là "Nếu bạn mù quáng dựa vào công nghệ và trở thành nô lệ của thời gian, thì sự phát triển của công nghệ sẽ trở nên vô nghĩa";

Nói chung, nó nói rằng bạn không thể đam mê công nghệ và tận hưởng những lợi ích, và bạn không thể mù quáng chống lại xu hướng phát triển của công nghệ, bạn phải sử dụng tư duy "ôn hòa" để sử dụng công nghệ và học cách kiểm soát bản thân.

Các giáo viên cho điểm trung bình là 43 điểm mà không biết rằng đó là sáng tác của người thật, điều này đã đánh bại AI một cách suýt soát, vì những lý do sau:

  • là người duy nhất tôi có thể đọc, nhưng vấn đề của bài viết này là nó đã đặt sai trọng tâm, toàn bộ sự hiểu biết của anh ấy về chủ đề này có chút thiên vị, vì vậy nó thực sự là một phụ đề có chủ đề một phần. .
  • Quân tử giỏi gạt người, chỉ nói người nên học giỏi, học nhờ ngoại vật;
  • Cấu trúc toàn bài, trong quá trình nêu và phân tích câu hỏi, ông đã chú ý nhiều hơn đến mối quan hệ giữa con người và công nghệ, đồng thời làm yếu đi yếu tố thời gian;
  • Các đối số có thể hành động thực sự đã quá muộn để đưa ra.

Trong liên kết của "Phân biệt sáng tác của người thật", dấu vết dịch thuật tiếng Anh-Trung rõ ràng trong thành phần Trò chuyện GPT-4 đã phơi bày danh tính thực sự của nó và lần đầu tiên nó bị giáo viên loại trừ.

Tác phẩm của Wen Xinyiyan khó hiểu hơn, và ba giáo viên đều tự hỏi liệu tác phẩm này có phải của người thật hay không. Lý do là họ cũng đã gặp phải nhiều sinh viên muốn đạt điểm cao bằng cách trích dẫn kinh điển và chồng chất khoa trương trong giảng dạy.

Sau trận chiến này, chắc hẳn ai cũng nhận thấy AI khó viết sát với ý nghĩa của chủ đề, con người với tư duy phân hóa mạnh hơn chắc chắn sẽ rơi vào bẫy “nghĩ quá nhiều” khi nghĩ sâu. **Trí thông minh nhân tạo hiện tại vẫn chỉ là lớp kem phủ cho tư duy của con người; **Là một phần quan trọng trong việc tuyển chọn nhân tài, kỳ thi tuyển sinh đại học cũng không ngừng phát triển, chỉ có như vậy mới càng tốt hơn. **

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)