Ngành AI bùng nổ "Chiến tranh động vật", Falcon và Llama tranh giành vị trí bá chủ của Mã nguồn mở trong các mô hình lớn.
Tháng trước, lĩnh vực AI đã chứng kiến một cuộc "chiến tranh động vật". Một bên là mô hình Llama do Meta phát hành, bên kia là mô hình lớn có tên là Falcon.
Llama nhờ vào tính chất Mã nguồn mở của nó, đã được cộng đồng phát triển ưa chuộng trong thời gian dài. Vào tháng 5, Falcon-40B ra mắt và nhanh chóng đứng đầu "bảng xếp hạng LLM Mã nguồn mở". Bảng xếp hạng này được cộng đồng Hugging Face tạo ra, cung cấp các tiêu chí để đánh giá khả năng của các mô hình ngôn ngữ lớn. Sau đó, Llama và Falcon lần lượt làm mới bảng xếp hạng.
Thú vị là, các nhà phát triển của Falcon không phải là một công ty công nghệ, mà là Viện Nghiên cứu Đổi mới Công nghệ ở Abu Dhabi, thủ đô của Các Tiểu Vương quốc Ả Rập Thống nhất. Phía Các Tiểu Vương quốc Ả Rập Thống nhất cho biết, họ tham gia vào cuộc thi AI để "lật đổ các người chơi cốt lõi".
Hiện nay, lĩnh vực AI đã bước vào giai đoạn các cường quốc cạnh tranh. Các quốc gia và doanh nghiệp có tài lực hùng mạnh lần lượt ra mắt phiên bản ChatGPT nội địa. Chỉ riêng ở khu vực Vịnh, đã có nhiều người chơi tham gia. Vào tháng 8, Ả Rập Xê Út đã mua hơn 3000 chip H100 cho các trường đại học trong nước, để đào tạo các mô hình lớn.
Một nhà đầu tư dày dạn cảm thán: "Tôi đã nghĩ rằng lĩnh vực công nghệ cứng sẽ có rào cản cao, không ngờ rằng khởi nghiệp mô hình lớn cũng trở thành cuộc chiến trăm mô hình..."
Đằng sau "cuộc chiến mô hình" này là sự ra đời của thuật toán Transformer. Năm 2017, 8 nhà khoa học của Google đã công bố thuật toán Transformer trong một bài báo, đặt nền tảng cho đợt bùng nổ AI lần này. Hiện nay, các mô hình lớn, bao gồm cả series GPT, đều được xây dựng dựa trên Transformer.
Sự ra đời của Transformer đã khiến tốc độ đổi mới thuật toán cơ bản trong giới học thuật chậm lại. Các yếu tố kỹ thuật như kỹ thuật dữ liệu, quy mô sức mạnh tính toán, kiến trúc mô hình dần trở thành yếu tố then chốt trong cuộc đua AI. Chỉ cần có khả năng kỹ thuật nhất định, bất kỳ công ty nào cũng có thể phát triển được mô hình lớn.
Điều này cũng dẫn đến sự gia tăng mạnh mẽ số lượng mô hình lớn trong và ngoài nước hiện nay. Có báo cáo cho thấy, tính đến tháng 7, số mô hình lớn trong nước đã đạt 130 cái, vượt qua 114 cái của Hoa Kỳ. Ngoài Trung Quốc và Hoa Kỳ, Nhật Bản, Ấn Độ, Hàn Quốc và các quốc gia khác cũng đồng loạt ra mắt các mô hình lớn địa phương.
Tuy nhiên, việc tham gia dễ dàng không có nghĩa là có thể trở thành ông lớn trong ngành. Lấy cuộc tranh đấu giữa Falcon và Llama làm ví dụ, mặc dù Falcon tạm thời dẫn đầu về thứ hạng, nhưng rất khó để nói rằng nó đã gây ra tác động lớn đến Meta. Đối với các mô hình mã nguồn mở, cộng đồng nhà phát triển năng động mới là lợi thế cạnh tranh cốt lõi. Meta với kinh nghiệm quản lý mạng xã hội tích lũy qua nhiều năm, đang chiếm ưu thế trong việc điều hành cộng đồng mã nguồn mở.
Hiện tại, trong top 10 bảng xếp hạng Hugging Face, có 8 mô hình được xây dựng dựa trên Llama 2. Chỉ riêng trên nền tảng này, số lượng mô hình lớn sử dụng Mã nguồn mở Llama 2 đã vượt quá 1500.
Ngoài việc xây dựng hệ sinh thái, khả năng kỹ thuật thuần túy cũng là yếu tố then chốt. Trong bài kiểm tra AgentBench gần đây, GPT-4 dẫn đầu với 4.41 điểm, trong khi người đứng thứ hai là Claude chỉ đạt 2.77 điểm, các mô hình mã nguồn mở khác thường ở mức khoảng 1 điểm. Điều này phản ánh lợi thế kỹ thuật tích lũy lâu dài của đội ngũ OpenAI.
Với sự phát triển ngày càng mạnh mẽ của cộng đồng mã nguồn mở, hiệu suất của các mô hình lớn có thể đồng nhất. Trong tương lai, sức cạnh tranh cốt lõi của các mô hình lớn sẽ tập trung vào việc xây dựng hệ sinh thái hoặc khả năng suy luận thuần túy.
Một câu hỏi thực tế khác là: Ngoài một số trường hợp ngoại lệ, hầu hết các nhà cung cấp mô hình lớn vẫn chưa tìm thấy mô hình sinh lợi. Chi phí tính toán cao đã trở thành lực cản cho sự phát triển của ngành. Một số tổ chức dự đoán rằng, chi tiêu hàng năm của các công ty công nghệ toàn cầu cho cơ sở hạ tầng mô hình lớn sẽ đạt 200 tỷ USD, trong khi doanh thu từ mô hình lớn tối đa là 75 tỷ USD, khoảng cách ít nhất là 125 tỷ USD.
Ngay cả các ông lớn phần mềm như Microsoft, Adobe cũng gặp khó khăn trong việc định giá dịch vụ AI. Ví dụ, GitHub Copilot tính phí 10 đô la mỗi tháng, nhưng Microsoft lại lỗ 20 đô la cho mỗi người dùng.
Nói chung, nếu không có sự xuất hiện của OpenAI và ChatGPT, cuộc cách mạng AI này có thể sẽ không xảy ra. Nhưng ở giai đoạn hiện tại, giá trị mà việc đào tạo các mô hình lớn thuần túy có thể tạo ra vẫn còn phải quan sát. Khi sự cạnh tranh đồng nhất gia tăng và số lượng mô hình mã nguồn mở tăng lên, các nhà cung cấp mô hình lớn thuần túy có thể phải đối mặt với áp lực lớn hơn. Giống như sự thành công của iPhone 4 không chỉ phụ thuộc vào bộ vi xử lý, giá trị của các mô hình lớn cũng sẽ thể hiện nhiều hơn trong các kịch bản ứng dụng cụ thể.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
18 thích
Phần thưởng
18
10
Chia sẻ
Bình luận
0/400
ContractCollector
· 07-23 10:56
Sở thú đã đánh nhau haha
Xem bản gốcTrả lời0
YieldChaser
· 07-22 14:46
Tìm hiểu về cuộc chiến tiêu tiền.
Xem bản gốcTrả lời0
ApeWithNoFear
· 07-22 06:05
Cách mạng AI còn có thể chơi được không? Kết quả vẫn phải tiêu tiền.
Xem bản gốcTrả lời0
CryingOldWallet
· 07-22 00:04
Sao lại đặt tên cho động vật như vậy
Xem bản gốcTrả lời0
GraphGuru
· 07-21 22:50
Cừu nhỏ đã đánh bại đại bàng ha ha
Xem bản gốcTrả lời0
Lonely_Validator
· 07-21 22:49
Ai cần thì dùng thôi.
Xem bản gốcTrả lời0
NftBankruptcyClub
· 07-21 22:48
Đứng đó mà không làm gì cũng được, Siêu gấp đôi
Xem bản gốcTrả lời0
RugpullSurvivor
· 07-21 22:43
Chỉ có thể đánh bại vc
Xem bản gốcTrả lời0
SleepyValidator
· 07-21 22:35
Lại là hai con vật đánh nhau thôi.
Xem bản gốcTrả lời0
ChainMaskedRider
· 07-21 22:28
Khả năng tính toán đắt như vậy, chơi AI tốn tiền quá.
Cuộc chiến AI leo thang: Falcon thách thức Llama trong cuộc đua mô hình mã nguồn mở trở nên gay gắt.
Ngành AI bùng nổ "Chiến tranh động vật", Falcon và Llama tranh giành vị trí bá chủ của Mã nguồn mở trong các mô hình lớn.
Tháng trước, lĩnh vực AI đã chứng kiến một cuộc "chiến tranh động vật". Một bên là mô hình Llama do Meta phát hành, bên kia là mô hình lớn có tên là Falcon.
Llama nhờ vào tính chất Mã nguồn mở của nó, đã được cộng đồng phát triển ưa chuộng trong thời gian dài. Vào tháng 5, Falcon-40B ra mắt và nhanh chóng đứng đầu "bảng xếp hạng LLM Mã nguồn mở". Bảng xếp hạng này được cộng đồng Hugging Face tạo ra, cung cấp các tiêu chí để đánh giá khả năng của các mô hình ngôn ngữ lớn. Sau đó, Llama và Falcon lần lượt làm mới bảng xếp hạng.
Thú vị là, các nhà phát triển của Falcon không phải là một công ty công nghệ, mà là Viện Nghiên cứu Đổi mới Công nghệ ở Abu Dhabi, thủ đô của Các Tiểu Vương quốc Ả Rập Thống nhất. Phía Các Tiểu Vương quốc Ả Rập Thống nhất cho biết, họ tham gia vào cuộc thi AI để "lật đổ các người chơi cốt lõi".
Hiện nay, lĩnh vực AI đã bước vào giai đoạn các cường quốc cạnh tranh. Các quốc gia và doanh nghiệp có tài lực hùng mạnh lần lượt ra mắt phiên bản ChatGPT nội địa. Chỉ riêng ở khu vực Vịnh, đã có nhiều người chơi tham gia. Vào tháng 8, Ả Rập Xê Út đã mua hơn 3000 chip H100 cho các trường đại học trong nước, để đào tạo các mô hình lớn.
Một nhà đầu tư dày dạn cảm thán: "Tôi đã nghĩ rằng lĩnh vực công nghệ cứng sẽ có rào cản cao, không ngờ rằng khởi nghiệp mô hình lớn cũng trở thành cuộc chiến trăm mô hình..."
Đằng sau "cuộc chiến mô hình" này là sự ra đời của thuật toán Transformer. Năm 2017, 8 nhà khoa học của Google đã công bố thuật toán Transformer trong một bài báo, đặt nền tảng cho đợt bùng nổ AI lần này. Hiện nay, các mô hình lớn, bao gồm cả series GPT, đều được xây dựng dựa trên Transformer.
Sự ra đời của Transformer đã khiến tốc độ đổi mới thuật toán cơ bản trong giới học thuật chậm lại. Các yếu tố kỹ thuật như kỹ thuật dữ liệu, quy mô sức mạnh tính toán, kiến trúc mô hình dần trở thành yếu tố then chốt trong cuộc đua AI. Chỉ cần có khả năng kỹ thuật nhất định, bất kỳ công ty nào cũng có thể phát triển được mô hình lớn.
Điều này cũng dẫn đến sự gia tăng mạnh mẽ số lượng mô hình lớn trong và ngoài nước hiện nay. Có báo cáo cho thấy, tính đến tháng 7, số mô hình lớn trong nước đã đạt 130 cái, vượt qua 114 cái của Hoa Kỳ. Ngoài Trung Quốc và Hoa Kỳ, Nhật Bản, Ấn Độ, Hàn Quốc và các quốc gia khác cũng đồng loạt ra mắt các mô hình lớn địa phương.
Tuy nhiên, việc tham gia dễ dàng không có nghĩa là có thể trở thành ông lớn trong ngành. Lấy cuộc tranh đấu giữa Falcon và Llama làm ví dụ, mặc dù Falcon tạm thời dẫn đầu về thứ hạng, nhưng rất khó để nói rằng nó đã gây ra tác động lớn đến Meta. Đối với các mô hình mã nguồn mở, cộng đồng nhà phát triển năng động mới là lợi thế cạnh tranh cốt lõi. Meta với kinh nghiệm quản lý mạng xã hội tích lũy qua nhiều năm, đang chiếm ưu thế trong việc điều hành cộng đồng mã nguồn mở.
Hiện tại, trong top 10 bảng xếp hạng Hugging Face, có 8 mô hình được xây dựng dựa trên Llama 2. Chỉ riêng trên nền tảng này, số lượng mô hình lớn sử dụng Mã nguồn mở Llama 2 đã vượt quá 1500.
Ngoài việc xây dựng hệ sinh thái, khả năng kỹ thuật thuần túy cũng là yếu tố then chốt. Trong bài kiểm tra AgentBench gần đây, GPT-4 dẫn đầu với 4.41 điểm, trong khi người đứng thứ hai là Claude chỉ đạt 2.77 điểm, các mô hình mã nguồn mở khác thường ở mức khoảng 1 điểm. Điều này phản ánh lợi thế kỹ thuật tích lũy lâu dài của đội ngũ OpenAI.
Với sự phát triển ngày càng mạnh mẽ của cộng đồng mã nguồn mở, hiệu suất của các mô hình lớn có thể đồng nhất. Trong tương lai, sức cạnh tranh cốt lõi của các mô hình lớn sẽ tập trung vào việc xây dựng hệ sinh thái hoặc khả năng suy luận thuần túy.
Một câu hỏi thực tế khác là: Ngoài một số trường hợp ngoại lệ, hầu hết các nhà cung cấp mô hình lớn vẫn chưa tìm thấy mô hình sinh lợi. Chi phí tính toán cao đã trở thành lực cản cho sự phát triển của ngành. Một số tổ chức dự đoán rằng, chi tiêu hàng năm của các công ty công nghệ toàn cầu cho cơ sở hạ tầng mô hình lớn sẽ đạt 200 tỷ USD, trong khi doanh thu từ mô hình lớn tối đa là 75 tỷ USD, khoảng cách ít nhất là 125 tỷ USD.
Ngay cả các ông lớn phần mềm như Microsoft, Adobe cũng gặp khó khăn trong việc định giá dịch vụ AI. Ví dụ, GitHub Copilot tính phí 10 đô la mỗi tháng, nhưng Microsoft lại lỗ 20 đô la cho mỗi người dùng.
Nói chung, nếu không có sự xuất hiện của OpenAI và ChatGPT, cuộc cách mạng AI này có thể sẽ không xảy ra. Nhưng ở giai đoạn hiện tại, giá trị mà việc đào tạo các mô hình lớn thuần túy có thể tạo ra vẫn còn phải quan sát. Khi sự cạnh tranh đồng nhất gia tăng và số lượng mô hình mã nguồn mở tăng lên, các nhà cung cấp mô hình lớn thuần túy có thể phải đối mặt với áp lực lớn hơn. Giống như sự thành công của iPhone 4 không chỉ phụ thuộc vào bộ vi xử lý, giá trị của các mô hình lớn cũng sẽ thể hiện nhiều hơn trong các kịch bản ứng dụng cụ thể.