Kể từ khi chatGPT ra đời, AI đã phát triển nhanh chóng hàng tháng, với rất nhiều mô hình và tốc độ lặp lại nhanh chóng, nhiều người không khỏi nhận ra rằng con người dường như đang thực sự đứng ngoài rìa của cổng AGI.
Gần đây, một tài liệu được tiết lộ bởi Văn phòng Bằng sáng chế và Nhãn hiệu Hoa Kỳ (USPTO) cho thấy OpenAI đã gửi đơn đăng ký nhãn hiệu cho "GPT-5" vào ngày 18 tháng 7. và đã được chấp nhận.
Ảnh chụp màn hình tệp USPTO
Mặc dù trong nửa đầu năm nay, nhiều chuyên gia và học giả về AI đã nhiều lần cùng nhau đưa ra những bức thư ngỏ, kêu gọi mọi người chú ý đến những rủi ro tiềm ẩn của AI sinh sản, và OpenAI cũng đã tuyên bố vào thời điểm đó rằng họ sẽ không có kế hoạch. để đào tạo GPT-5 trong thời gian ngắn.
Tuy nhiên, sự cám dỗ của khoa học và công nghệ cuối cùng đã cho phép con người vượt qua ranh giới cấm kỵ.
Trong ứng dụng được tiết lộ lần này, OpenAI đã đề cập rằng GPT-5 chưa được phát hành sẽ có nhiều khả năng mà GPT-4 không có và hầu hết mọi mục đều đề cập đến AGI.
Ảnh chụp màn hình tệp USPTO
Vậy, sự thay đổi như vậy có ý nghĩa gì đối với AI và con người?
Hôm nay, bài viết này sẽ cố gắng tiến hành phân tích đơn giản về các chức năng, thay đổi và tác động có thể có của GPT-5 từ thông tin hạn chế được tiết lộ trong tài liệu ứng dụng của OpenAI.
01 Con đường đến với AGI
Trong tài liệu được tiết lộ lần này, một trong những thay đổi đầu tiên được OpenAI đề cập đến là việc tăng cường các chức năng đa phương thức.
Cụ thể, các chức năng của GPT-5 bao gồm dịch văn bản hoặc lời nói từ ngôn ngữ này sang ngôn ngữ khác, nhận dạng giọng nói, tạo văn bản và giọng nói, v.v.
Mặc dù trong GPT-4 hiện tại, người dùng cũng có thể đạt được bản dịch giữa các ngôn ngữ khác nhau, nhưng vì chức năng dịch được chỉ ra ở đây nên nó phải được tối ưu hóa lại.
Tại sao OpenAI lại đề cao khả năng dịch thuật của GPT-5 đến vậy?
Điều này có thể là do một trong những điều kiện tiên quyết để GPT trở nên phổ biến là giảm thiểu chênh lệch chi phí khi sử dụng các mô hình lớn bằng các ngôn ngữ khác nhau.
Trước đó, kết quả nghiên cứu của Đại học Oxford cho thấy do các phương thức tính toán và đo lường chi phí máy chủ được áp dụng bởi các dịch vụ như OpenAI, chi phí đầu vào và đầu ra của tiếng Anh thấp hơn nhiều so với các ngôn ngữ khác.
Trong số đó, chi phí của tiếng Trung giản thể gấp đôi tiếng Anh, tiếng Tây Ban Nha gấp 1,5 lần tiếng Anh và tiếng Shan ở Myanmar gấp 15 lần tiếng Anh.
Bởi vì các ngôn ngữ như tiếng Trung Quốc có cấu trúc khác, phức tạp hơn nên chúng yêu cầu tỷ lệ từ vựng hóa cao hơn.
Ví dụ: theo mã thông báo GPT3 của OpenAI, mã thông báo cho "tình cảm của bạn" chỉ yêu cầu hai mã thông báo bằng tiếng Anh nhưng tám mã thông báo bằng tiếng Trung giản thể.
Điều này có nghĩa là đối với các ngôn ngữ không phải tiếng Anh, việc sử dụng và đào tạo các mô hình sẽ tốn kém hơn nhiều.
Và một khi vượt qua ngưỡng "rào cản ngôn ngữ", rào cản chung trước GPT chắc chắn sẽ bị xóa bỏ ngay lập tức.
Ngoài ra, chức năng nhận dạng giọng nói nổi bật trong tài liệu dường như chỉ là một thay đổi không rõ ràng, nhưng ở một mức độ nào đó, đây là một phần khác của việc OpenAI mở đường cho GPT-5 trên con đường trở thành viên gạch AGI.
Như chúng ta đã biết, trong hướng phát triển trong tương lai của các mô hình lớn, xu hướng ngày càng rõ ràng là các mô hình trở nên bị gạt ra ngoài lề và cuối cùng.
Kể từ khi Qualcomm phát hành một mô hình lớn với 1 tỷ thông số có thể chạy trên điện thoại di động vào tháng 7 năm nay, các nhà sản xuất như Honor và Apple cũng đã thông báo rằng họ sẽ ra mắt điện thoại di động "mô hình lớn" của riêng mình.
Bắt đầu từ điện thoại di động, dữ liệu AI trong tương lai sẽ được xử lý ngày càng nhiều ở phía thiết bị đầu cuối như máy ảnh, cảm biến và lái xe tự động.
Trong một kịch bản ứng dụng như vậy, nhận dạng giọng nói chắc chắn sẽ thuận tiện và hiệu quả hơn.
Ví dụ, mô hình ngôn ngữ AI cho phép người lái điều khiển phương tiện thông qua giọng nói. Chuyển đổi khẩu lệnh của người lái xe thành các lệnh có thể thực thi được, chẳng hạn như khởi động, dừng, tăng tốc, phanh và các thao tác khác.
Các trợ lý thông minh tồn tại trong hệ thống điện thoại di động như SIri cũng sẽ ưu tiên điều khiển thông qua khẩu lệnh.
Có thể thấy rằng tính năng nhận dạng giọng nói không chỉ là lớp kem trên mặt bánh mà còn là một "cấu hình tiêu chuẩn" khi GPT-5 bước vào giai đoạn cuối.
Và thông qua việc đánh chìm từng thiết bị đầu cuối, GPT-5 cũng sẽ thu được nhiều cấu trúc dữ liệu phi ngôn ngữ và bị hạn chế hơn.
Xét cho cùng, kể từ khi phát triển mô hình lớn, dữ liệu văn bản có thể được hấp thụ gần như giống nhau, nếu chúng ta muốn tiến thêm một bước trên con đường dẫn đến AGI, thì loại dữ liệu "phi văn bản" này rất quan trọng.
02 Mô hình chuyên gia thử thách
Ngoài các đặc điểm trên, tài liệu do OpenAI đệ trình cũng đề cập: "GPT-5 cũng có thể có khả năng học, phân tích, phân loại và phản hồi dữ liệu".
Đánh giá từ xu hướng phát triển trí tuệ nhân tạo hiện nay, điều này có thể có nghĩa là GPT-5 có khả năng học tập tích cực tương tự như khả năng của một cơ thể thông minh.
Và khả năng này sẽ làm cho GPT-5 khác biệt cơ bản so với các mô hình trước đó chỉ có thể học kiến thức mới một cách thụ động thông qua dữ liệu cho ăn của con người.
Cụ thể, khả năng học chủ động nghĩa là mô hình có thể lựa chọn, thu thập và xử lý dữ liệu một cách độc lập theo mục tiêu và nhu cầu của chính nó, thay vì chỉ dựa vào dữ liệu do con người cung cấp.
Điều này cho phép mô hình sử dụng hiệu quả hơn thông tin và kiến thức trong dữ liệu, đồng thời thích ứng linh hoạt hơn với các môi trường dữ liệu và kịch bản nhiệm vụ khác nhau, thay vì chỉ nhận và xuất dữ liệu một cách thụ động.
Và khả năng như vậy đặc biệt quan trọng khi GPT-5 phải đối mặt với một số trường dọc và tương đối xa lạ.
Một số lĩnh vực cụ thể như y học, luật, tài chính, v.v. thường có các thuật ngữ, quy tắc và hệ thống kiến thức riêng, có thể khó hiểu và khó xử lý đối với các mô hình ngôn ngữ thông thường.
Nếu GPT-5 có khả năng học tích cực, nó có thể tự động thu thập và cập nhật dữ liệu liên quan trong các lĩnh vực này từ Internet, phân tích và phân loại các khái niệm cơ bản, nguyên tắc quan trọng và những phát triển mới nhất trong các lĩnh vực này cũng như phản hồi các vấn đề phổ biến trong các lĩnh vực này , Các trường hợp điển hình và ứng dụng thực tế.
Bằng cách này, GPT-5 có thể nắm vững kiến thức chuyên môn trong các lĩnh vực này nhanh hơn và hoàn thành các nhiệm vụ tương ứng trong các lĩnh vực này một cách chính xác và hiệu quả hơn.
Và tất cả những điều này là chìa khóa cho mô hình chung thực sự.
Bởi nếu GPT luôn cần được kết nối với một “mô hình chuyên gia” cụ thể để giải quyết các công việc chuyên môn thì chưa thể nói nó “phổ cập” thực sự.
Bởi vì điều này sẽ dẫn đến sự khác biệt và phụ thuộc của GPT vào khả năng thông minh của các lĩnh vực và kịch bản khác nhau, đồng thời sẽ làm tăng chi phí liên lạc và phối hợp giữa GPT và "mô hình chuyên gia" và không thể đảm bảo rằng có thể đạt được các dịch vụ chất lượng cao theo bất kỳ trường hợp.
Trước đây, phương tiện truyền thông nước ngoài Semianalysis đã tiết lộ những bí mật của GPT-4 được phát hành vào tháng 3 năm nay, tiết lộ rằng OpenAI sử dụng mô hình chuyên gia hỗn hợp để xây dựng GPT-4.
Theo tin tức, GPT-4 sử dụng 16 mô hình chuyên gia hỗn hợp (hỗn hợp các chuyên gia), mỗi mô hình có 111 tỷ tham số và mỗi tuyến đường chuyển tiếp đi qua hai mô hình chuyên gia.
Tuy nhiên, nhiều mô hình chuyên gia hơn có nghĩa là khó khái quát hóa và đạt được sự hội tụ hơn.
Điều này là do mỗi mô hình chuyên gia có các tham số và chiến lược riêng, thường khó phối hợp, khiến GPT khó cân bằng và "tính đến tình hình chung".
Sau khi có khả năng học tích cực, GPT-5 sẽ có thể sử dụng khả năng hiểu và lý luận đa phương thức, cũng như cơ sở dữ liệu và bản đồ tri thức, để phân tích và hiểu dữ liệu thu được, đồng thời thông qua thuật toán phân cụm và phân loại, Liên kết và tóm tắt dữ liệu liên quan .
Bằng cách này, GPT-5 có thể sử dụng hiệu quả thông tin và kiến thức trong dữ liệu theo các môi trường dữ liệu và kịch bản tác vụ khác nhau.
03 thay thế nhiều việc hơn
Như đã đề cập ở trên, sau khi vượt qua rào cản ngôn ngữ và bước vào thiết bị đầu cuối với chức năng nhận dạng giọng nói tiện lợi, GPT-5 sẽ tiếp tục tiếp thu kiến thức trong các tình huống, lĩnh vực và chế độ khác nhau thông qua khả năng học tập tích cực liên tục, sau đó tiến tới Con đường đến với AGI đang di chuyển với tốc độ cao.
Có thể thấy trước rằng khi GPT-5 với "tính phổ quát" mạnh mẽ như vậy bắt đầu lan rộng ra nhiều lĩnh vực, ngoại trừ một số ngành có rào cản về dữ liệu (chẳng hạn như chăm sóc sức khỏe), các mô hình lớn trong hầu hết các lĩnh vực dọc sẽ dần bị lu mờ.
Bởi vì trong phân tích cuối cùng, khá nhiều chuyên gia hoặc mô hình quy mô lớn theo chiều dọc thực chất là sản phẩm của một số doanh nghiệp không đủ năng lực tính toán và dữ liệu, không thể leo lên "mô hình quy mô lớn chung" và phải giải quyết cho tốt nhất tiếp theo (điều này đặc biệt rõ ràng ở Trung Quốc).
Nếu một mô hình lớn có mục đích chung có thể thành thạo trong hầu hết các ngành nhờ khả năng học hỏi mạnh mẽ của nó, thì ai sẽ sẵn sàng chuyển đổi giữa các mô hình khác nhau một cách tẻ nhạt và chịu nhiều chi phí đào tạo và sử dụng cho các mô hình khác nhau?
Từ quan điểm này, mô hình chuyên gia dần được thay thế bằng mô hình chung, đây là một quá trình lịch sử tất yếu của loài người trên con đường tiến tới AGI.
Một hiện tượng khác đi kèm với điều này là các nhiệm vụ nhỏ hơn và được chia nhỏ hơn được thay thế.
Bởi với một mô hình tổng hợp mạnh mẽ hơn, người ta sẽ thấy rằng, trên thực tế, nội dung công việc của nhiều vị trí có thể được hợp nhất và tích hợp.
Người quản lý sản phẩm và nhà phân tích dữ liệu là một ví dụ có thể.
Ví dụ: trong một dự án phát triển sản phẩm mới, GPT-5 có thể tìm kiếm nghiên cứu thị trường có liên quan, phân tích sản phẩm cạnh tranh, chân dung người dùng và dữ liệu khác từ Internet theo nhu cầu hoặc khái niệm sản phẩm nhất định và tải chúng xuống bộ nhớ của chính nó.
Sau đó, nó sẽ phân tích và hiểu dữ liệu thu được thông qua sự hiểu biết đa phương thức và khả năng suy luận logic của chính nó, cũng như các biểu đồ tri thức và cơ sở dữ liệu.
Sau khi thu thập dữ liệu tương ứng, phân loại và sắp xếp dữ liệu đó, GPT-5 sẽ tìm hiểu các chiến lược tiếp thị có liên quan, phản hồi của người dùng và các thông tin khác từ phản hồi của hệ thống đối thoại thông qua khả năng hiểu ngôn ngữ và so sánh dữ liệu đó với các khái niệm hoặc nhu cầu của Sản phẩm đã cho. và đánh giá.
Bằng cách này, hai vị trí giám đốc sản phẩm và chuyên viên phân tích dữ liệu được “sáp nhập” một cách hiệu quả.
Trên con đường dẫn đến AGI còn dang dở, có vô số công việc được sáp nhập và thay thế.
Do đó, một GPT-5 linh hoạt hơn không chỉ là một lợi ích cho sự tiến bộ về năng suất mà còn là khúc dạo đầu cho một cơn địa chấn lớn trong ngành.
Khi đó, nhiều công ty chưa có năng lực sử dụng mô hình quy mô lớn, thiếu rào cản ngành sẽ sụp đổ mong manh như lâu đài xây bằng cát.
Còn những cá nhân bình thường hơn, đối mặt với những vị trí không ngừng bị thay thế, sẽ càng cảm nhận sâu sắc hơn sự bấp bênh của thời đại...
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
GPT-5 sắp ra mắt? Những thay đổi mạnh mẽ nào sẽ xảy ra với ngành AI
Kể từ khi chatGPT ra đời, AI đã phát triển nhanh chóng hàng tháng, với rất nhiều mô hình và tốc độ lặp lại nhanh chóng, nhiều người không khỏi nhận ra rằng con người dường như đang thực sự đứng ngoài rìa của cổng AGI.
Gần đây, một tài liệu được tiết lộ bởi Văn phòng Bằng sáng chế và Nhãn hiệu Hoa Kỳ (USPTO) cho thấy OpenAI đã gửi đơn đăng ký nhãn hiệu cho "GPT-5" vào ngày 18 tháng 7. và đã được chấp nhận.
Ảnh chụp màn hình tệp USPTO
Mặc dù trong nửa đầu năm nay, nhiều chuyên gia và học giả về AI đã nhiều lần cùng nhau đưa ra những bức thư ngỏ, kêu gọi mọi người chú ý đến những rủi ro tiềm ẩn của AI sinh sản, và OpenAI cũng đã tuyên bố vào thời điểm đó rằng họ sẽ không có kế hoạch. để đào tạo GPT-5 trong thời gian ngắn.
Tuy nhiên, sự cám dỗ của khoa học và công nghệ cuối cùng đã cho phép con người vượt qua ranh giới cấm kỵ.
Trong ứng dụng được tiết lộ lần này, OpenAI đã đề cập rằng GPT-5 chưa được phát hành sẽ có nhiều khả năng mà GPT-4 không có và hầu hết mọi mục đều đề cập đến AGI.
Ảnh chụp màn hình tệp USPTO
Vậy, sự thay đổi như vậy có ý nghĩa gì đối với AI và con người?
Hôm nay, bài viết này sẽ cố gắng tiến hành phân tích đơn giản về các chức năng, thay đổi và tác động có thể có của GPT-5 từ thông tin hạn chế được tiết lộ trong tài liệu ứng dụng của OpenAI.
01 Con đường đến với AGI
Trong tài liệu được tiết lộ lần này, một trong những thay đổi đầu tiên được OpenAI đề cập đến là việc tăng cường các chức năng đa phương thức.
Cụ thể, các chức năng của GPT-5 bao gồm dịch văn bản hoặc lời nói từ ngôn ngữ này sang ngôn ngữ khác, nhận dạng giọng nói, tạo văn bản và giọng nói, v.v.
Mặc dù trong GPT-4 hiện tại, người dùng cũng có thể đạt được bản dịch giữa các ngôn ngữ khác nhau, nhưng vì chức năng dịch được chỉ ra ở đây nên nó phải được tối ưu hóa lại.
Tại sao OpenAI lại đề cao khả năng dịch thuật của GPT-5 đến vậy?
Điều này có thể là do một trong những điều kiện tiên quyết để GPT trở nên phổ biến là giảm thiểu chênh lệch chi phí khi sử dụng các mô hình lớn bằng các ngôn ngữ khác nhau.
Trước đó, kết quả nghiên cứu của Đại học Oxford cho thấy do các phương thức tính toán và đo lường chi phí máy chủ được áp dụng bởi các dịch vụ như OpenAI, chi phí đầu vào và đầu ra của tiếng Anh thấp hơn nhiều so với các ngôn ngữ khác.
Trong số đó, chi phí của tiếng Trung giản thể gấp đôi tiếng Anh, tiếng Tây Ban Nha gấp 1,5 lần tiếng Anh và tiếng Shan ở Myanmar gấp 15 lần tiếng Anh.
Bởi vì các ngôn ngữ như tiếng Trung Quốc có cấu trúc khác, phức tạp hơn nên chúng yêu cầu tỷ lệ từ vựng hóa cao hơn.
Ví dụ: theo mã thông báo GPT3 của OpenAI, mã thông báo cho "tình cảm của bạn" chỉ yêu cầu hai mã thông báo bằng tiếng Anh nhưng tám mã thông báo bằng tiếng Trung giản thể.
Điều này có nghĩa là đối với các ngôn ngữ không phải tiếng Anh, việc sử dụng và đào tạo các mô hình sẽ tốn kém hơn nhiều.
Và một khi vượt qua ngưỡng "rào cản ngôn ngữ", rào cản chung trước GPT chắc chắn sẽ bị xóa bỏ ngay lập tức.
Ngoài ra, chức năng nhận dạng giọng nói nổi bật trong tài liệu dường như chỉ là một thay đổi không rõ ràng, nhưng ở một mức độ nào đó, đây là một phần khác của việc OpenAI mở đường cho GPT-5 trên con đường trở thành viên gạch AGI.
Như chúng ta đã biết, trong hướng phát triển trong tương lai của các mô hình lớn, xu hướng ngày càng rõ ràng là các mô hình trở nên bị gạt ra ngoài lề và cuối cùng.
Kể từ khi Qualcomm phát hành một mô hình lớn với 1 tỷ thông số có thể chạy trên điện thoại di động vào tháng 7 năm nay, các nhà sản xuất như Honor và Apple cũng đã thông báo rằng họ sẽ ra mắt điện thoại di động "mô hình lớn" của riêng mình.
Bắt đầu từ điện thoại di động, dữ liệu AI trong tương lai sẽ được xử lý ngày càng nhiều ở phía thiết bị đầu cuối như máy ảnh, cảm biến và lái xe tự động.
Trong một kịch bản ứng dụng như vậy, nhận dạng giọng nói chắc chắn sẽ thuận tiện và hiệu quả hơn.
Ví dụ, mô hình ngôn ngữ AI cho phép người lái điều khiển phương tiện thông qua giọng nói. Chuyển đổi khẩu lệnh của người lái xe thành các lệnh có thể thực thi được, chẳng hạn như khởi động, dừng, tăng tốc, phanh và các thao tác khác.
Các trợ lý thông minh tồn tại trong hệ thống điện thoại di động như SIri cũng sẽ ưu tiên điều khiển thông qua khẩu lệnh.
Có thể thấy rằng tính năng nhận dạng giọng nói không chỉ là lớp kem trên mặt bánh mà còn là một "cấu hình tiêu chuẩn" khi GPT-5 bước vào giai đoạn cuối.
Và thông qua việc đánh chìm từng thiết bị đầu cuối, GPT-5 cũng sẽ thu được nhiều cấu trúc dữ liệu phi ngôn ngữ và bị hạn chế hơn.
Xét cho cùng, kể từ khi phát triển mô hình lớn, dữ liệu văn bản có thể được hấp thụ gần như giống nhau, nếu chúng ta muốn tiến thêm một bước trên con đường dẫn đến AGI, thì loại dữ liệu "phi văn bản" này rất quan trọng.
02 Mô hình chuyên gia thử thách
Ngoài các đặc điểm trên, tài liệu do OpenAI đệ trình cũng đề cập: "GPT-5 cũng có thể có khả năng học, phân tích, phân loại và phản hồi dữ liệu".
Đánh giá từ xu hướng phát triển trí tuệ nhân tạo hiện nay, điều này có thể có nghĩa là GPT-5 có khả năng học tập tích cực tương tự như khả năng của một cơ thể thông minh.
Và khả năng này sẽ làm cho GPT-5 khác biệt cơ bản so với các mô hình trước đó chỉ có thể học kiến thức mới một cách thụ động thông qua dữ liệu cho ăn của con người.
Cụ thể, khả năng học chủ động nghĩa là mô hình có thể lựa chọn, thu thập và xử lý dữ liệu một cách độc lập theo mục tiêu và nhu cầu của chính nó, thay vì chỉ dựa vào dữ liệu do con người cung cấp.
Điều này cho phép mô hình sử dụng hiệu quả hơn thông tin và kiến thức trong dữ liệu, đồng thời thích ứng linh hoạt hơn với các môi trường dữ liệu và kịch bản nhiệm vụ khác nhau, thay vì chỉ nhận và xuất dữ liệu một cách thụ động.
Và khả năng như vậy đặc biệt quan trọng khi GPT-5 phải đối mặt với một số trường dọc và tương đối xa lạ.
Một số lĩnh vực cụ thể như y học, luật, tài chính, v.v. thường có các thuật ngữ, quy tắc và hệ thống kiến thức riêng, có thể khó hiểu và khó xử lý đối với các mô hình ngôn ngữ thông thường.
Nếu GPT-5 có khả năng học tích cực, nó có thể tự động thu thập và cập nhật dữ liệu liên quan trong các lĩnh vực này từ Internet, phân tích và phân loại các khái niệm cơ bản, nguyên tắc quan trọng và những phát triển mới nhất trong các lĩnh vực này cũng như phản hồi các vấn đề phổ biến trong các lĩnh vực này , Các trường hợp điển hình và ứng dụng thực tế.
Bằng cách này, GPT-5 có thể nắm vững kiến thức chuyên môn trong các lĩnh vực này nhanh hơn và hoàn thành các nhiệm vụ tương ứng trong các lĩnh vực này một cách chính xác và hiệu quả hơn.
Và tất cả những điều này là chìa khóa cho mô hình chung thực sự.
Bởi nếu GPT luôn cần được kết nối với một “mô hình chuyên gia” cụ thể để giải quyết các công việc chuyên môn thì chưa thể nói nó “phổ cập” thực sự.
Bởi vì điều này sẽ dẫn đến sự khác biệt và phụ thuộc của GPT vào khả năng thông minh của các lĩnh vực và kịch bản khác nhau, đồng thời sẽ làm tăng chi phí liên lạc và phối hợp giữa GPT và "mô hình chuyên gia" và không thể đảm bảo rằng có thể đạt được các dịch vụ chất lượng cao theo bất kỳ trường hợp.
Trước đây, phương tiện truyền thông nước ngoài Semianalysis đã tiết lộ những bí mật của GPT-4 được phát hành vào tháng 3 năm nay, tiết lộ rằng OpenAI sử dụng mô hình chuyên gia hỗn hợp để xây dựng GPT-4.
Theo tin tức, GPT-4 sử dụng 16 mô hình chuyên gia hỗn hợp (hỗn hợp các chuyên gia), mỗi mô hình có 111 tỷ tham số và mỗi tuyến đường chuyển tiếp đi qua hai mô hình chuyên gia.
Tuy nhiên, nhiều mô hình chuyên gia hơn có nghĩa là khó khái quát hóa và đạt được sự hội tụ hơn.
Điều này là do mỗi mô hình chuyên gia có các tham số và chiến lược riêng, thường khó phối hợp, khiến GPT khó cân bằng và "tính đến tình hình chung".
Sau khi có khả năng học tích cực, GPT-5 sẽ có thể sử dụng khả năng hiểu và lý luận đa phương thức, cũng như cơ sở dữ liệu và bản đồ tri thức, để phân tích và hiểu dữ liệu thu được, đồng thời thông qua thuật toán phân cụm và phân loại, Liên kết và tóm tắt dữ liệu liên quan .
Bằng cách này, GPT-5 có thể sử dụng hiệu quả thông tin và kiến thức trong dữ liệu theo các môi trường dữ liệu và kịch bản tác vụ khác nhau.
03 thay thế nhiều việc hơn
Như đã đề cập ở trên, sau khi vượt qua rào cản ngôn ngữ và bước vào thiết bị đầu cuối với chức năng nhận dạng giọng nói tiện lợi, GPT-5 sẽ tiếp tục tiếp thu kiến thức trong các tình huống, lĩnh vực và chế độ khác nhau thông qua khả năng học tập tích cực liên tục, sau đó tiến tới Con đường đến với AGI đang di chuyển với tốc độ cao.
Có thể thấy trước rằng khi GPT-5 với "tính phổ quát" mạnh mẽ như vậy bắt đầu lan rộng ra nhiều lĩnh vực, ngoại trừ một số ngành có rào cản về dữ liệu (chẳng hạn như chăm sóc sức khỏe), các mô hình lớn trong hầu hết các lĩnh vực dọc sẽ dần bị lu mờ.
Bởi vì trong phân tích cuối cùng, khá nhiều chuyên gia hoặc mô hình quy mô lớn theo chiều dọc thực chất là sản phẩm của một số doanh nghiệp không đủ năng lực tính toán và dữ liệu, không thể leo lên "mô hình quy mô lớn chung" và phải giải quyết cho tốt nhất tiếp theo (điều này đặc biệt rõ ràng ở Trung Quốc).
Nếu một mô hình lớn có mục đích chung có thể thành thạo trong hầu hết các ngành nhờ khả năng học hỏi mạnh mẽ của nó, thì ai sẽ sẵn sàng chuyển đổi giữa các mô hình khác nhau một cách tẻ nhạt và chịu nhiều chi phí đào tạo và sử dụng cho các mô hình khác nhau?
Từ quan điểm này, mô hình chuyên gia dần được thay thế bằng mô hình chung, đây là một quá trình lịch sử tất yếu của loài người trên con đường tiến tới AGI.
Một hiện tượng khác đi kèm với điều này là các nhiệm vụ nhỏ hơn và được chia nhỏ hơn được thay thế.
Bởi với một mô hình tổng hợp mạnh mẽ hơn, người ta sẽ thấy rằng, trên thực tế, nội dung công việc của nhiều vị trí có thể được hợp nhất và tích hợp.
Người quản lý sản phẩm và nhà phân tích dữ liệu là một ví dụ có thể.
Ví dụ: trong một dự án phát triển sản phẩm mới, GPT-5 có thể tìm kiếm nghiên cứu thị trường có liên quan, phân tích sản phẩm cạnh tranh, chân dung người dùng và dữ liệu khác từ Internet theo nhu cầu hoặc khái niệm sản phẩm nhất định và tải chúng xuống bộ nhớ của chính nó.
Sau đó, nó sẽ phân tích và hiểu dữ liệu thu được thông qua sự hiểu biết đa phương thức và khả năng suy luận logic của chính nó, cũng như các biểu đồ tri thức và cơ sở dữ liệu.
Sau khi thu thập dữ liệu tương ứng, phân loại và sắp xếp dữ liệu đó, GPT-5 sẽ tìm hiểu các chiến lược tiếp thị có liên quan, phản hồi của người dùng và các thông tin khác từ phản hồi của hệ thống đối thoại thông qua khả năng hiểu ngôn ngữ và so sánh dữ liệu đó với các khái niệm hoặc nhu cầu của Sản phẩm đã cho. và đánh giá.
Bằng cách này, hai vị trí giám đốc sản phẩm và chuyên viên phân tích dữ liệu được “sáp nhập” một cách hiệu quả.
Trên con đường dẫn đến AGI còn dang dở, có vô số công việc được sáp nhập và thay thế.
Do đó, một GPT-5 linh hoạt hơn không chỉ là một lợi ích cho sự tiến bộ về năng suất mà còn là khúc dạo đầu cho một cơn địa chấn lớn trong ngành.
Khi đó, nhiều công ty chưa có năng lực sử dụng mô hình quy mô lớn, thiếu rào cản ngành sẽ sụp đổ mong manh như lâu đài xây bằng cát.
Còn những cá nhân bình thường hơn, đối mặt với những vị trí không ngừng bị thay thế, sẽ càng cảm nhận sâu sắc hơn sự bấp bênh của thời đại...