AI sektöründe "Hayvan Savaşı" patlak verdi, Falcon ve Llama açık kaynak büyük model egemenliği için mücadele ediyor.
Geçen ay, AI alanında bir "hayvan savaşı" başladı. Bir taraf, Meta tarafından piyasaya sürülen Llama modeli, diğer taraf ise Falcon adlı büyük modeldi.
Llama, Açık Kaynak özelliği sayesinde uzun süredir geliştirici topluluğunun beğenisini kazanmıştır. Mayıs ayında piyasaya sürülen Falcon-40B ise "Açık Kaynak LLM Sıralaması"nda birinci sıraya yerleşmiştir. Bu liste, Hugging Face topluluğu tarafından hazırlanmış olup, büyük dil modellerinin yeteneklerini değerlendirmek için standartlar sunmaktadır. Ardından, Llama ve Falcon sırasıyla liste sıralamasını güncellemeye devam etmiştir.
İlginç olan, Falcon'un geliştiricilerinin bir teknoloji şirketi değil, Birleşik Arap Emirlikleri'nin başkenti Abu Dabi'deki Teknoloji İnovasyon Araştırma Enstitüsü olmasıdır. BAE yetkilileri, AI yarışmasına katılmalarının "ana oyuncuları altüst etmek" için olduğunu belirtti.
Artık AI alanı, birçok rakibin bir araya geldiği bir aşamaya girdi. Güçlü mali kaynaklara sahip ülkeler ve şirketler, yerel versiyon ChatGPT'yi piyasaya sürmeye başladı. Sadece Körfez bölgesinde, birçok oyuncu piyasaya girdi. Ağustos ayında, Suudi Arabistan, yerel üniversiteler için 3000'den fazla H100 çip satın aldı, büyük modelleri eğitmek için kullanılacak.
Kıdemli bir yatırımcı haykırdı: "Sert teknoloji alanında yüksek bir engel olacağını düşünmüştüm, ama büyük model girişimciliği de yüzlerce model savaşına dönüştü..."
Bu "yüz model savaşı"nın arkasında, Transformer algoritmasının ortaya çıkışı var. 2017'de, Google'dan 8 bilim insanı, makalelerinde Transformer algoritmasını kamuoyuna açıkladı ve bu AI çılgınlığı için bir temel oluşturdu. Artık birçok model, GPT serisi de dahil olmak üzere, Transformer üzerine inşa edilmiştir.
Transformer'ın ortaya çıkması, akademik alandaki temel algoritma yeniliklerinin hızını yavaşlattı. Veri mühendisliği, hesaplama gücü ölçeği, model mimarisi gibi mühendislik unsurları, AI yarışmasının anahtarları haline geldi. Belirli bir teknik yeteneğe sahip olduğu sürece, herhangi bir şirket büyük bir model geliştirebilir.
Bu, şu anda yurtiçinde ve yurtdışında büyük model sayısının patlamasına neden oldu. Temmuz ayı itibarıyla yurtiçindeki büyük model sayısının 130'a ulaştığı, Amerika'nın ise 114 ile geride kaldığı bildirildi. Çin ve Amerika dışında, Japonya, Hindistan, Güney Kore gibi ülkeler de yerel büyük modellerini piyasaya sürmeye başladı.
Ancak, girişin kolay olması sektördeki devlerden biri olabileceğiniz anlamına gelmez. Falcon ve Llama arasındaki mücadeleye bir örnek olarak, Falcon sıralamada geçici olarak önde olsa da, Meta üzerinde ne kadar etkili olduğu söylenemez. Açık Kaynak büyük modeller için, aktif geliştirici topluluğu temel rekabet gücüdür. Meta, yılların birikimi olan sosyal medya yönetimi deneyimiyle, açık kaynak topluluğu yönetiminde avantaj sağlamaktadır.
Şu anda, Hugging Face sıralamasındaki ilk 10 arasında, 8'i Llama 2 tabanlı modellerdir. Sadece bu platformda, Llama 2 Açık Kaynak lisansı altında 1500'den fazla büyük model bulunmaktadır.
Ekosistem inşasının yanı sıra, saf teknik yetenek de kritik öneme sahiptir. Son AgentBench testinde, GPT-4 4.41 puanla açık ara önde yer alırken, ikinci olan Claude sadece 2.77 puan aldı; diğer açık kaynak modellerinin çoğu yaklaşık 1 puan civarındadır. Bu, OpenAI ekibinin uzun vadeli birikmiş teknik avantajını yansıtmaktadır.
Açık Kaynak topluluğunun giderek daha aktif hale gelmesiyle birlikte, büyük modellerin performansları muhtemelen benzerlik göstermeye başlayacak. Gelecekte, büyük modellerin temel rekabet gücü ekosistem inşası veya tamamen çıkarım yetenekleri üzerinde yoğunlaşacaktır.
Bir diğer daha gerçekçi sorun ise: Az sayıda örnek dışında, çoğu büyük model sağlayıcısı henüz kârlılık modeli bulamadı. Yüksek hesaplama maliyetleri sektörün gelişiminde bir engel haline geldi. Bazı kuruluşlar, dünya genelindeki teknoloji şirketlerinin her yıl büyük model altyapısına 200 milyar dolar harcayacağını, büyük model gelirinin ise en fazla 75 milyar dolar olacağını öngörüyor; aradaki fark en az 125 milyar dolar.
Microsoft, Adobe gibi yazılım devleri bile AI hizmetleri fiyatlandırmasında zorluklarla karşı karşıya. Örneğin, GitHub Copilot aylık 10 dolar ücret alıyor, ancak Microsoft her bir kullanıcıdan 20 dolar kaybediyor.
Genel olarak, eğer OpenAI ve ChatGPT olmasaydı, bu AI devriminin gerçekleşip gerçekleşmeyeceği belirsizdi. Ancak mevcut aşamada, yalnızca büyük modellerin eğitilmesinin yaratabileceği değer henüz gözlemlenmedi. Homojenleşen rekabetin artması ve Açık Kaynak modellerinin çoğalmasıyla, saf büyük model sağlayıcıları daha büyük bir baskı ile karşılaşabilir. iPhone 4'ün başarısı sadece işlemciye bağlı değildi; büyük modellerin değeri de daha fazla somut uygulama senaryolarında ortaya çıkacaktır.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
18 Likes
Reward
18
10
Share
Comment
0/400
ContractCollector
· 07-23 10:56
Hayvanat bahçesi kavga etti hahaha
View OriginalReply0
YieldChaser
· 07-22 14:46
Para yakma savaşı hakkında bilgi edinin
View OriginalReply0
ApeWithNoFear
· 07-22 06:05
Yapay zeka devrimi hala oynanabilir mi? Sonuçta hala para harcamanız gerekiyor.
View OriginalReply0
CryingOldWallet
· 07-22 00:04
Hayvan isimleri neden böyle?
View OriginalReply0
GraphGuru
· 07-21 22:50
Küçük koyun kartalı yendi ha ha
View OriginalReply0
Lonely_Validator
· 07-21 22:49
Kim kullanabiliyorsa o kullansın.
View OriginalReply0
NftBankruptcyClub
· 07-21 22:48
Ayakta durmak yeterince iyi, süper iki katına çıkıyor
View OriginalReply0
RugpullSurvivor
· 07-21 22:43
Nerede sadece VC'yi yenebilirim
View OriginalReply0
SleepyValidator
· 07-21 22:35
Yine iki hayvan kavga ediyor.
View OriginalReply0
ChainMaskedRider
· 07-21 22:28
Bilgi İşlem Gücü bu kadar pahalı, AI oynamak para harcıyor.
Yapay Zeka Savaşları Kızışıyor: Falcon, Llama Açık Kaynak Büyük Model Yarışına Meydan Okuyor
AI sektöründe "Hayvan Savaşı" patlak verdi, Falcon ve Llama açık kaynak büyük model egemenliği için mücadele ediyor.
Geçen ay, AI alanında bir "hayvan savaşı" başladı. Bir taraf, Meta tarafından piyasaya sürülen Llama modeli, diğer taraf ise Falcon adlı büyük modeldi.
Llama, Açık Kaynak özelliği sayesinde uzun süredir geliştirici topluluğunun beğenisini kazanmıştır. Mayıs ayında piyasaya sürülen Falcon-40B ise "Açık Kaynak LLM Sıralaması"nda birinci sıraya yerleşmiştir. Bu liste, Hugging Face topluluğu tarafından hazırlanmış olup, büyük dil modellerinin yeteneklerini değerlendirmek için standartlar sunmaktadır. Ardından, Llama ve Falcon sırasıyla liste sıralamasını güncellemeye devam etmiştir.
İlginç olan, Falcon'un geliştiricilerinin bir teknoloji şirketi değil, Birleşik Arap Emirlikleri'nin başkenti Abu Dabi'deki Teknoloji İnovasyon Araştırma Enstitüsü olmasıdır. BAE yetkilileri, AI yarışmasına katılmalarının "ana oyuncuları altüst etmek" için olduğunu belirtti.
Artık AI alanı, birçok rakibin bir araya geldiği bir aşamaya girdi. Güçlü mali kaynaklara sahip ülkeler ve şirketler, yerel versiyon ChatGPT'yi piyasaya sürmeye başladı. Sadece Körfez bölgesinde, birçok oyuncu piyasaya girdi. Ağustos ayında, Suudi Arabistan, yerel üniversiteler için 3000'den fazla H100 çip satın aldı, büyük modelleri eğitmek için kullanılacak.
Kıdemli bir yatırımcı haykırdı: "Sert teknoloji alanında yüksek bir engel olacağını düşünmüştüm, ama büyük model girişimciliği de yüzlerce model savaşına dönüştü..."
Bu "yüz model savaşı"nın arkasında, Transformer algoritmasının ortaya çıkışı var. 2017'de, Google'dan 8 bilim insanı, makalelerinde Transformer algoritmasını kamuoyuna açıkladı ve bu AI çılgınlığı için bir temel oluşturdu. Artık birçok model, GPT serisi de dahil olmak üzere, Transformer üzerine inşa edilmiştir.
Transformer'ın ortaya çıkması, akademik alandaki temel algoritma yeniliklerinin hızını yavaşlattı. Veri mühendisliği, hesaplama gücü ölçeği, model mimarisi gibi mühendislik unsurları, AI yarışmasının anahtarları haline geldi. Belirli bir teknik yeteneğe sahip olduğu sürece, herhangi bir şirket büyük bir model geliştirebilir.
Bu, şu anda yurtiçinde ve yurtdışında büyük model sayısının patlamasına neden oldu. Temmuz ayı itibarıyla yurtiçindeki büyük model sayısının 130'a ulaştığı, Amerika'nın ise 114 ile geride kaldığı bildirildi. Çin ve Amerika dışında, Japonya, Hindistan, Güney Kore gibi ülkeler de yerel büyük modellerini piyasaya sürmeye başladı.
Ancak, girişin kolay olması sektördeki devlerden biri olabileceğiniz anlamına gelmez. Falcon ve Llama arasındaki mücadeleye bir örnek olarak, Falcon sıralamada geçici olarak önde olsa da, Meta üzerinde ne kadar etkili olduğu söylenemez. Açık Kaynak büyük modeller için, aktif geliştirici topluluğu temel rekabet gücüdür. Meta, yılların birikimi olan sosyal medya yönetimi deneyimiyle, açık kaynak topluluğu yönetiminde avantaj sağlamaktadır.
Şu anda, Hugging Face sıralamasındaki ilk 10 arasında, 8'i Llama 2 tabanlı modellerdir. Sadece bu platformda, Llama 2 Açık Kaynak lisansı altında 1500'den fazla büyük model bulunmaktadır.
Ekosistem inşasının yanı sıra, saf teknik yetenek de kritik öneme sahiptir. Son AgentBench testinde, GPT-4 4.41 puanla açık ara önde yer alırken, ikinci olan Claude sadece 2.77 puan aldı; diğer açık kaynak modellerinin çoğu yaklaşık 1 puan civarındadır. Bu, OpenAI ekibinin uzun vadeli birikmiş teknik avantajını yansıtmaktadır.
Açık Kaynak topluluğunun giderek daha aktif hale gelmesiyle birlikte, büyük modellerin performansları muhtemelen benzerlik göstermeye başlayacak. Gelecekte, büyük modellerin temel rekabet gücü ekosistem inşası veya tamamen çıkarım yetenekleri üzerinde yoğunlaşacaktır.
Bir diğer daha gerçekçi sorun ise: Az sayıda örnek dışında, çoğu büyük model sağlayıcısı henüz kârlılık modeli bulamadı. Yüksek hesaplama maliyetleri sektörün gelişiminde bir engel haline geldi. Bazı kuruluşlar, dünya genelindeki teknoloji şirketlerinin her yıl büyük model altyapısına 200 milyar dolar harcayacağını, büyük model gelirinin ise en fazla 75 milyar dolar olacağını öngörüyor; aradaki fark en az 125 milyar dolar.
Microsoft, Adobe gibi yazılım devleri bile AI hizmetleri fiyatlandırmasında zorluklarla karşı karşıya. Örneğin, GitHub Copilot aylık 10 dolar ücret alıyor, ancak Microsoft her bir kullanıcıdan 20 dolar kaybediyor.
Genel olarak, eğer OpenAI ve ChatGPT olmasaydı, bu AI devriminin gerçekleşip gerçekleşmeyeceği belirsizdi. Ancak mevcut aşamada, yalnızca büyük modellerin eğitilmesinin yaratabileceği değer henüz gözlemlenmedi. Homojenleşen rekabetin artması ve Açık Kaynak modellerinin çoğalmasıyla, saf büyük model sağlayıcıları daha büyük bir baskı ile karşılaşabilir. iPhone 4'ün başarısı sadece işlemciye bağlı değildi; büyük modellerin değeri de daha fazla somut uygulama senaryolarında ortaya çıkacaktır.