Resim kaynağı: Unbounded AI aracı tarafından oluşturulmuştur
JD.com'dan ayrıldıktan sonra Zhou Bowen uzun zamandır bu kadar heyecanlanmamıştı.
ChatGPT'nin, hayatın her kesiminden uygulayıcıları uyandıran bir bahar gök gürültüsü gibi dünyayı harekete geçirdiği ortaya çıktı, böylece hepsi AGI'nin gerçeğe dönüşen ayak seslerini duydu.
Yükseliş altında, insanlar Wang Huiwen ve Wang Xiaochuan'ın kendi işlerini kurduklarını ve ayrıca Baidu ve Alibaba'nın piyasaya hakim olduğunu gördüler. IBM ve JD.com'un AI Araştırma Enstitüsü'nün eski dekanı olan Zhou Bowen, 25 yılı aşkın bir süredir yapay zekanın temel teorisini ve çekirdek en son teknolojileri, uygulamaları ve sanayileşmeyi inceledi ve Lianyuan Technology'yi kurdu. 2021'in sonu gibi erken bir tarihte. Üretken yapay zeka, çok yönlü diyalog ve insan-bilgisayar işbirliği teknolojisine sahip Model, işletmelerin ve tüketicilerin yeni yapay zeka çağında ürün yeniliğini ve dijital zeka dönüşümünü tamamlamasına yardımcı olur. "Bu alanda bir iş kurmaya pek karar vermedim, bu işin beni bulduğunu söylemek daha iyi." Zhou Bowen, sanki bir görev duygusu onu harekete geçmeye zorluyormuş gibi, bunu yapılması gereken bir şey olarak nitelendirdi.
Zhou Bowen, Çin Bilim ve Teknoloji Üniversitesi'nden mezun oldu ve ardından doktora yapmak için Boulder'daki Colorado Üniversitesi'ne gitti. IBM Research'ün ABD genel merkezi yapay zeka temel araştırma enstitüsünün eski başkanı olarak, uzun yıllar yapay zeka ile ilgili çalışmalara başkanlık ettikten sonra Çin'e döndü ve art arda JD Group'un kıdemli başkan yardımcısı, grup teknik komitesi başkanı, grup başkanı olarak görev yaptı. JD Cloud ve AI ve JD Yapay Zeka Araştırma Enstitüsü'nün kurucu başkanı ve diğer pozisyonlar. JD AI'nin kurucusu olarak, JD AI'nin teknik araştırma ve iş geliştirmesinden sorumludur. Akıllı tedarik zinciri yapay zekası için ulusal bir açık platform oluşturmak üzere 0'dan JD AI Bölümü, AI Araştırma Enstitüsü ve JD AI Accelerator'ı kurdu. , günlük arama hacmini 0'dan on milyarlara çıkardı, Jingdong yapay zeka müşteri hizmetlerinin teknik olarak yeniden yapılandırılmasına öncülük etti ve harici ürünleştirmeyi başlattı, milyarlarca teknik servis işini ve binlerce entegre teknoloji, ürün, pazarlama ve satış ekibini yönetti.
2021'de Zhou Bowen, üretken yapay zekanın yakın gelecekte patlayacağını tahmin etti ve bu nedenle JD.com'dan ayrılarak dikey işletmelerin genel büyük ölçekli modelle ürün inovasyonu ve dijital zeka dönüşümü gerçekleştirmesine yardımcı olmayı taahhüt eden Lianyuan Technology'yi kurmaya karar verdi. 2022'de Tsinghua Üniversitesi'nde Huiyan Kürsüsü Profesörü ve Elektronik Mühendisliği Bölümü'nde kadrolu profesör olarak görev yapacak ve aynı yılın Mayıs ayında Collaborative Interactive Intelligence Research'ü kuracak. Tsinghua Üniversitesi'nin merkezi Tesadüfen. **
ChatGPT gelmek üzere ve Zhou Bowen ayrıca Moments'ta şunları yazdı: "Çin'in OpenAI'sinin yeni bir yol keşfetmesi gerektiğine inanıyorum!" Gururunun altında yetenekler aramaya can atıyor. Ancak diğer girişimcilerden farklı olarak, Zhou Bowen ve Lianyuan Technology, genel yetenekler temelinde insanlar ve mallar arasındaki ilişkiyi anlamada büyük modeli daha iyi hale getirmek için on milyarlarca parametreye ve benzersiz eğitim yöntemlerine güvenmeyi seçti. ürün içgörüsü, konumlandırma, tasarım, Ar-Ge'den pazarlamaya kadar tam bağlantılı inovasyon sistemi.
Zhou Bowen bir keresinde, girişimcilik yönünün, kurumsal dijital zeka inovasyonuna daha yüksek değer getirmek için yapay zekayı geleneksel endüstrilerle entegre etmede liderliği ele geçirmek, yani dikey senaryolarda genel büyük modellerin yeteneğinde bir atılım gerçekleştirmek olduğunu kamuoyuna açıklamıştı.
Geçenlerde, AI Technology Review'dan bir muhabir Zhou Bowen ile bir konuşma yaptı. Aşağıda, konuşmanın dökümü yer almaktadır. AI Technology Review, orijinal anlamını değiştirmeden içeriği düzenledi:
Yapay zekanın yeni bir etkileşim ve işbirliği paradigması olan insan bilgeliğini öğrenmesine izin verin
**AI Teknoloji İncelemesi: ChatGPT bu etkileşim yöntemini getirdi, sizce önceki etkileşim yönteminden farkı nedir? **
Zhou Bowen: Araştırma yönlerimden biri, yapay zeka ile insanlar arasındaki etkileşim ve etkileşim içinde öğrenme. İnsan-bilgisayar etkileşimi, insan-bilgisayar diyaloğundan farklıdır.İnsan-bilgisayar etkileşimi yoluyla, AI süreçteki şeyleri öğrenebilir, bu nedenle bu, gerçekleştirilmesi basit bir görev değil, öğrenmeyi başarmanın bir yoludur.
"The Analects of Confucius"ta kaydedildiği gibi, Konfüçyüs ve yetmiş iki öğrencisinin etkileşim yoluyla öğrenmelerinin hikayesidir. Batı'da, Platon ve Aristoteles'in Atina Akademisi'ne benzer şekilde, en eski bilgi ve bilgeliğin mirası, insanlar arasındaki diyalog yoluyla sağlanır ve öğretmenler, öğrencilerle etkileşim yoluyla öğrencilerin çalışmalarını daha iyi tamamlamalarına yardımcı olur.
Örneğin, öğretmen öğrencilerden bir bardak su dökmelerini isterse, bu kadar basit "emir-yürütme" eylemlerinin bilgeliği artırması zordur; Zorlukların üstesinden nasıl gelinir, bilgeliği artırabilecek etkileşim budur ve aynı zamanda yansıtır insanlar ve yapay zeka arasındaki işbirlikçi etkileşime ilişkin temel bakış açım.
AI'nın özü, insanlarla işbirliği ve etkileşimdir. Etkileşimlerden sürekli olarak öğrenir ve ardından sorunları daha iyi çözmek için insanlarla işbirliği yapar. Bu bakış açısı yakın gelecekte giderek daha fazla önem kazanacak ve aynı zamanda daha teknik ve etik zorluklarla karşılaşacak ve sonuçta kârlılığı korumak kolay olmayacaktır. Herkesin söylediği AI Hizalaması gibi, insanlar iradelerini AI'ya aktarabilir ve ardından AI ile görevleri parçalayarak AI'nın bu süreçte insan iradesini öğrenmesine ve gerçekleştirmesine izin verebilir. Bu, yeni bir işbirliği yöntemi, yani işbirliğine dayalı etkileşimli zekadır.
**Yapay Zeka Teknoloji İncelemesi: Etkileşim yoluyla değer uyumu sağlamanın insan beyni ve GPT için işbirliği yapması için etkili bir yol olduğunu düşünüyor musunuz? İnsanlar ve yapay zeka birlikte nasıl daha iyi çalışmalıdır? **
**Zhou Bowen: **Üretken yapay zekanın patlamasından sonra, insanlarla işbirlikçi etkileşim yoluyla öğrenen yapay zeka giderek daha da güçlenecek.
2002'de Nobel Ekonomi Ödülü sahibi Daniel Kahneman, çok satan Hızlı ve Yavaş Düşünmek adlı kitabında insan düşüncesinin iki modu olduğunu öne sürdü: 1. sistem ve 2. sistem ve 1. sistem hızlıdır.Düşünme, sezgisel muhakeme; Sistem 2, çok fazla muhakeme ve hesaplama gerektiren yavaş düşünmedir.
Başlangıçta, insanlar yapay zekanın "sistem 1"in örüntü tanımaya dayalı yüz tanıma ve kalite denetimi gibi "sistem 1" çalışmaları için daha uygun olduğunu düşündüler. Ancak yapay zekanın gerçek değerinin, insanların karmaşık mantıksal akıl yürütme görevlerini daha iyi tamamlamasına yardımcı olmak olan 2'de yattığı konusunda ısrar ediyorum. ChatGPT'nin ortaya çıkışı, AI'nın Sistem 2 olarak fizibilitesini doğrulamıştır; bu, AI'nın yeni bilgiler keşfedebileceği ve yeni bilgilerin keşfedilmesinin insanların daha iyi AI tasarlamasına yardımcı olacağı anlamına gelir, örneğin beyin bilimi ve hesaplama optimizasyonu Discovery ve yeni bilgi yaratmak için bir volan ortaya çıkıyor. Volan etkisi, AI'nın tüm sistemin yeni bilgileri daha iyi keşfetmesini sağlayabileceği ve bu yeni bilginin daha iyi AI sistemleri tasarlamaya yardımcı olabileceği ve böylece bir erdemli döngü oluşturabileceği anlamına gelir. Bu nedenle, yapay zeka, bilgi ve yenilik arasında karşılıklı olarak güçlendirici bir ilişki kuruldu ve bu da yapay zeka ile insanların işbirliği yapma biçiminin dönüştürülmesini gerektiriyor.
Daha önce bir "3+1" araştırma yönü önermiştim, yani güvenilir yapay zekayı araştırma temeli ve uzun vadeli hedef olarak kullanmak, çok modlu temsil etkileşimi, insan-bilgisayar işbirlikçi yorumlama ve çevresel işbirlikçi evrime odaklanmak. İşin özü insan olmaktır Makinelerin işbirliği ve birlikte yaratılması, insanların yapay zekanın yenilik yapmasına yardım etmesi ve yapay zekanın da insanların yenilik yapmasına yardım etmesi hedefini gerçekleştirebilir.
Bunlardan biri, büyük bir birleşik teorinin olabileceği çok modlu temsil etkileşimidir. 2022'de insanlar buna hala şüpheyle bakıyor, ancak GPT-4'ün ortaya çıkmasıyla bu çok modlu birleşik temsil etkileşimi daha inandırıcı hale geldi; Başka bir nokta da insan-bilgisayar işbirlikçi etkileşimidir. 2022'de insanlar da buna şüpheyle yaklaşıyordu, ancak şimdi bu etkileşim yöntemi daha inandırıcı hale geldi ve insanlar bunun olma ihtimalinin yüksek olduğuna inanmaya başladı; Üçüncü nokta, yapay zeka ve çevrenin birlikte evrimidir, Bu AI'nın yalnızca insanlarla işbirliği yapması değil, aynı zamanda çevredeki ortama da uyum sağlaması gerektiği anlamına gelir. Bu konsepti ilk olarak 2022'nin başlarında önerdik ve şimdiye kadar OpenAI dahil bu yönde başarılı bir vaka görmedik.
OpenAI öğrenemiyorsanız, ancak Microsoft'u öğrenemiyorsanız, büyük ölçekli yerel işletme girişimleri için çıkarmanız gerekir
**Yapay Zeka Teknoloji İncelemesi: Transformer modelinin özelliği, metni modellemek için bir dikkat mekanizması (Dikkat) kullanmasıdır. Yapay zeka dikkat mekanizmasıyla ilgili çok erken bir araştırma yaptığınızı fark ettik. **
**Zhou Bowen:**Transformer'ın temel özellikleri, kişisel dikkat mekanizması ve çok kafalı mekanizmadır. Haziran 2017'de Google Brain tarafından yayınlanan "Attention is All You Need", öz-dikkat (öz-dikkat) mekanizması ve Transformer kavramını tanıttı. Daha sonra, OpenAI'nin GPT'si de bu makaleden derinden etkilendi.
Bundan önce, kodlayıcıyı geliştirmek için çok sekmeli bir öz-dikkat mekanizmasını tanıtmak için ilgili yazar olarak ilk makaleyi yayınladım - "Yapılandırılmış Öz-Dikkatli Cümle Gömme". Bu makale 2016'da tamamlanıp arXiv'e yüklendi ve 2017'nin başlarında ICLR'de resmi olarak yayınlandı. Ayrıca bu mekanizmayı öneren ilk ekibiz ve daha da önemlisi bu, aşağı yönlü görevleri dikkate almayan ilk doğal dil temsil modelidir. hiç. Herkes daha önce bazı durumlarda dikkatini veya kişisel dikkatini kullanmıştır, ancak bunların hepsi göreve bağlıdır.
**AI Teknoloji İncelemesi: Bu makalede ne buldunuz? Bu keşifler sonraki Transformer teknolojisi değişikliklerini nasıl etkiledi? **
Zhou Bowen: Makalede, en iyi temsil yönteminin, doğal dili (NLP) temsil etmek için yapılandırılmış öz-dikkat kullanmak olduğunu öne sürdük. Bu makale, yayınlanmasından bu yana 2.300'den fazla kez alıntılanmıştır.
Bundan önce, OpenAI'nin baş bilim adamı Ilya Sutskever, en iyi temsil yönteminin "diziden diziye (Seq2Seq)", yani modeli bir alanın dizisini başka bir alanın dizisine dönüştürmek için eğitmek olduğuna inanıyordu. , örneğin makine çevirisinde karşılık gelen kaynak dil ve hedef dil veya sorunun bir sıra ve cevabın bir sıra olduğu soru yanıtlamada. Bu temelde, derin sinir ağı tarafından temsil edilen ikisi arasındaki haritalama ilişkisi öğrenilir.
Ancak daha sonra, derin öğrenme uzmanı ve Turing Ödülü sahibi Yoshua Bengio'dan oluşan ekip, soruları cevaplarken tüm kelimelerin eşit derecede önemli olmadığı bir "dikkat mekanizması" önerdi; Daha kritik kısımları belirleyerek ve ardından daha fazla dikkat göstererek bu kısma daha iyi cevap verebilirsiniz. Bu dikkat modeli kısa sürede çok geniş bir kabul gördü. 2015 yılında, IBM ekibinin aynı zamanda "Seq2Seq+Attention Mechanism" mimarisine ve fikirlerine dayalı araştırma başlatmasına öncülük ettim ve art arda doğal dilde yapay zeka yazımı için birkaç en eski üretken modeli başlattım. İlgili makalelere ayrıca atıf yapıldı. 3000 defadan fazla.
Ama o zamanlar gazetenin içeriğinden memnun değildim çünkü içinde bir sorun vardı yani dikkat cevaba göre kurgulanıyordu. Bu şekilde yetiştirilen yapay zeka, üniversitenin final sınavından önce öğretmeninden kilit noktaları işaretlemesini isteyen ve ardından kilit noktaları dikkatle gözden geçirmeye giden bir öğrenci gibidir. Bu şekilde, yapay zekanın belirli sorunlar üzerindeki performansı iyileştirilebilse de evrensel değildir. Bu nedenle, verilen göreve ve çıktıya bağlı olmadığını, yalnızca doğal dilin girdisinin iç yapısına dayandığını ve AI çoklu okumaları aracılığıyla hangi bölümlerin daha önemli olduğunu ve aralarındaki ilişkiyi öğrendiğini önerdik. öz-dikkat artı Çok Kafalı Mekanizmalar için Temsil Öğrenimi. Bu tür bir öğrenme mekanizması, testin kilit noktalarına dayalı olarak hedeflenmiş ve parçalı bir şekilde öğrenmek yerine, öğrencilerin dersi birden çok kez ve sistematik olarak testten önce çalışıp anlaması gibi, yalnızca girdiye bakar, böylece daha yakındır. genel yapay zekanın amacına ve büyük ölçüde Geliştirilmiş AI'nın öğrenme yeteneğine.
**AI Technology Review: "Attention is All You Need" makalesi ile sizin aranızdaki ilişki nedir? **
Zhou Bowen:Bu dalganın tüm büyük modellerinin Transformer'dan geldiğini biliyoruz, bu nedenle modelde bir T gördüğünüzde, T büyük olasılıkla Transformer'ı temsil ediyor. Bu alanda ileriye dönük bazı çalışmalar yapmaktan büyük onur duyuyorum. 2017'nin sonunda, Google'dan araştırmacılar, Transformer modelini dünyaya getiren bir kilometre taşı olan "Dikkat Tek İhtiyacınız Olan" makalesini yayınladı. Ve ilk olarak 2017'nin başlarında yayınlanan bir "çok sekmeli öz-dikkat mekanizması" öneren "Yapılandırılmış Özenli Cümle Gömme" makalemize atıfta bulunuldu. Ve bu makalenin ilk yazarı Ashish Vaswani, IBM'de akıl hocalığı yaptığım bir öğrenciydi. Makalenin başlığı "Attention is All You Need", tarafımızdan önerilen "kendine dikkat çok önemlidir, çok başlılık çok önemlidir, ancak RNN daha önce düşündüğümüz kadar önemli olmayabilir" anlamını da ifade etmektedir.
**AI Teknoloji İncelemesi: Siz ve OpenAI arasında hangi tutarlı teknik yargılara sahipsiniz? **
**Zhou Bowen: Bu makale ve Transformer mimarisi her şeyi tamamen değiştirdi ve modelin uzun mesafe belleği sorununu çözdü. Ilya Sutskever, yakın tarihli bir röportajda, makalenin yayınlanmasından bir gün sonra OpenAI'nin tamamen Transformer mimarisine geçtiğini hatırladı. **
GPT'nin Bert'in modelinden çok farklı olduğunu biliyoruz ve Bert'in başlarda çok başarılı olmasına rağmen daha sonra GPT kadar iyi olmamasının nedeni hem soldan sağa hem de sağdan sola bilgileri kullanmasıdır. Başka bir deyişle, Bert, yapay zekanın nasıl temsil edileceğini öğrenmesine yardımcı olmak için gelecekteki bilgileri kullanırken, GPT yalnızca geçmiş bilgilere dayanarak bir sonraki kelimenin ne olacağını tahmin etmekte ısrar ediyor. **OpenAI'nin bu noktadaki yaklaşımı, ekibimizin düşüncesiyle, yani öğrenmek için cevapları kullanmamaya çalışın. **Dikkatten kendine dikkat etmeye, BERT'den GPT-3'e kadar temel fikir, tahmin edilecek kelimenin çıktısı veya bağlamı gibi gelecekteki bilgilere artık güvenmemeniz veya daha fazla verinin kullanılabilmesidir. tamamen AI modellerini eğitirken, AGI olasılığını görmeye başlarız.
Ayrıca OpenAI, büyük modellerin dünya bilgisini doğal dil yoluyla öğrendiğine ve böylece dünya bilgisini büyük modellere sıkıştırdığına inanır.GPT serisi büyük modeller ve ChatGPT de bu konsepte göre tanıtılır. Aynı şey, ekibim ve benim konsept ve vizyonumuz için de geçerli, yani genel amaçlı büyük ölçekli bir model oluşturmak ve profesyonel eğitim yoluyla dikey alanda daha yüksek değer ve yetenekler ortaya koymasını sağlamak ve tüketicileri entegre etmek. karmaşık duygular, ihtiyaçlar ve deneyimlerin yanı sıra ürün yeniliği, Tasarım, ürün parametreleri, malzemeler, işlevler vb., insanlar ve ürünler arasındaki ikili ilişkiyi yeniden yapılandırmak için büyük bir modele sıkıştırılır ve değerini yeniden şekillendirmek için yapay zekayı kullanır. ürünler.
**Yapay Zeka Teknoloji İncelemesi: Teknik güce ek olarak, OpenAI'nin başka hangi yönleri size yararları olduğunu düşündürüyor? **
Zhou Bowen: Yalnızca teknik yargılar açısından değil, ekosistemin kurulması, yeni Moore Yasasının duyurulması, API fiyatlarının %90 oranında düşürülmesi vb. dahil olmak üzere OpenAI'nin tüm iş yaklaşımı temsilidir. büyük modellerin ticari uygulaması için sermayenin ve kullanıcıların hayal gücü alanını genişletin ve neredeyse sınırsız uygulama senaryoları elde edin. Ayrıca, OpenAI'nin etik yönetişim, iş geliştirme, ekolojik teknoloji ve gelecek geliştirme planları da çok net.
**AI Teknoloji İncelemesi: Bir sonraki OpenAI Çin'de görünecek mi? **
** Zhou Bowen: ** Büyük bir model oluşturmanın teknik zorluğu aslında birçok Çinli girişimcinin hayal gücünün ötesinde. Bu nedenle, yerli şirketlerin "OpenAI+Microsoft" modelini körü körüne takip etmelerini ve kopyalamalarını önermiyorum, çünkü Çin'deki Çinli teknoloji şirketlerinin çoğu iş karar verme yeteneğinde Microsoft kadar iyi değil ve teknoloji muhakeme yetenekleri o kadar iyi değil. OpenAI olarak. **
OpenAI'nin başarısı birçok faktörün sonucudur: Örneğin, Ilya Sutskever teknik yargılarda bulundu, Greg Brockman işlevleri yerine getirdi ve Sam Altman, yapay zekanın etik ve toplum üzerindeki etkisine ilişkin araştırma da dahil olmak üzere kaynakları entegre etti. Yerli şirketler sadece OpenAI'yi taklit ederse, birbirleri arasındaki mesafe sadece daha da uzaklaşacaktır.
OpenAI'nin teknik yargısı, verilerin enleminden görülebilir, çünkü dünyadaki tüm veriler eşit derecede önemli değildir. OpenAI, düşünme zincirini eğitmek için neden Github'ın programlama dilini kullanmayı seçti? Programlama dilinin semantiği ve sözdizimi son derece basit olduğundan, yürütme sürecinin mantığı titizdir. Bu aynı zamanda OpenAI'nin bir özelliğini ve avantajını temsil eder: körü körüne saldırmaz. Bu nedenle, Çin'in yapay zeka gelişiminin başka bir yol bulması gerektiğini düşünüyorum, yani genel büyük modellerin dikey senaryoların uygulanmasından başlama yeteneğine güvenerek, ki bu da başarılı olma olasılığı daha yüksektir.
Üretken yapay zeka, mevcut tüketici deneyimini bozacak
**AI Teknoloji İncelemesi: Neden tüketici sektörünü hedefliyorsunuz? **
Zhou Bowen: JD.com'dayken "tüketici talebini ve ürün tasarımını yapay zekayla dinamik olarak eşleştirme" konusunda büyük bir iş fırsatı gördüm. 2021'de, belirli olmayan senaryolardan tüm tüketici davranışlarını kapsamayı umarak dikey endüstriler için genel bir büyük dil modeli geliştirmek üzere işimden ayrılmaya ve bir iş kurmaya karar verdim (o zamanlar büyük dil modeli patlamamıştı). Pazartesiden Cumaya zaman ve mekan sahnelerinin farklı olduğunu ve beyaz yakalı çalışanların veya diğer mesleklerin odaklarının da farklı olduğunu biliyoruz.Alışveriş davranışını etkileyen bu kültürel sembollerin arkasında tüketicilerin karmaşık duyguları, deneyimleri ve ürün seçimleri vardır. , bu tam olarak işletmelerin ihtiyaç duyduğu değerli bilgilerdir. Tedarik tarafında ürünler yapılırken yaratıcılık, tasarım, ürün parametreleri, işlevler, malzemeler ve marka konumlandırma, slogan, pazarlama, reklam, pazarlama, tanıtım görselleri vb.
Bu tür bir karşılık gelen ilişki daha önce insanlar tarafından hiç geçmedi. Planlama, pazarlama ve satış alanındaki uygulayıcılar yalnızca sorumlu oldukları bağlantıları anlarlar. Ve emtia tedarik zincirinin dünyanın ilk genel amaçlı büyük ölçekli modelini yapacağız, yani tüm bu bilgileri yüksek doğrulukla genel amaçlı bir modele sıkıştıracağız ve bu büyük ölçekli modele dayalı olarak yetkilendirme yapacağız. Fırsatlar Öngörü (Keşfet), ürün tanımı (Tanımla), program tasarımı (Tasarım), Ar-Ge'yi yönlendirme (Geliştirme), pazarlama dönüşümü (Dağıt) dahil olmak üzere kurumsal ürünlerin tüm yaşam döngüsü. Bu sayede işletmeler yenilik fırsatlarını daha verimli keşfedebilir, daha yaratıcı tasarlayıp üretebilir, pazarlama tutundurma yapabilir, kullanıcılara ulaşabilir ve dönüşümü daha etkin bir şekilde tamamlayabilir.
**AI Teknoloji İncelemesi: İş modeli açısından bu daha gelişmiş görünüyor. **
Zhou Bowen: Herhangi bir girişimci ekip için, büyük modellerin genel teknik yeteneklerine sahip olduktan sonra daha profesyonel yetenekler geliştirebilmek çok önemlidir. Şu anda, GPT'nin atılımı esas olarak genel yeteneğindedir, ancak belirli endüstriler ve dikey alanlar için değeri henüz geliştirilmemiştir.Örneğin: GPT çok gerçekçi sanatsal resimler çizebilir, ancak devre şemaları çizemez, çünkü çizemez. yeterli fiziksel bilgi birikimine sahip olmamak Derinlemesine ve ilgili yargılar yeterince profesyonel değildir.
Bu nedenle, tüketicilerin ihtiyaç duydukları ürünleri bulmalarını ve satın alma konusunda daha istekli olmalarını kolaylaştıracak ve insanların mevcut alışveriş yollarını tamamen değiştirebilecek böyle bir araca (profesyonel yeteneklere sahip genel amaçlı büyük bir model) ihtiyaç olduğunu düşünüyorum. . Üretken yapay zeka, emtia tedarik zincirinin tüm yönlerini öğrenmek ve tüketiciler merkezli kilit bağlantıların verimliliğini artırmak için çok büyük miktarda iş bilgisini bu tür büyük modellere sıkıştırabilir. Bu, 2021'de zaten üretilmiş olan fikir ve yaratıcılıktır.
**Lianyuan Technology, genel yeteneklere sahip büyük bir model geliştiriyor. Bu büyük model, ürünleri ve tüketicileri birbirine bağlama konusunda uzmanlığa sahip. **2/3'ü muhakeme yeteneği ve hesaplama yeteneği gibi genel amaçlı yetenekler olan 37 büyük ölçekli model değerlendirme göstergemiz var ve ürünler ile tüketiciler arasındaki bağlantıya özel olarak uygulanan bir düzineden fazla öğe var. "Her ürün ihtiyaçtan doğsun, her tüketici istediğini alsın" hedefini gerçekleştirin.
**Yapay Zeka Teknoloji İncelemesi: Üretken yapay zeka, e-ticaret gibi tüketim senaryolarıyla nasıl daha iyi entegre olabilir? **
**Zhou Bowen:**İnsanlar ya yalnızca planlamanın iş mantığını ya da pazarlamanın mantığını anlayabilir, ancak yapay zeka tüm iş zincirlerini açabilir.
Tüketiciler, e-ticaret platformları gibi senaryolarda istedikleri ürünleri bulabilmek için çok fazla profesyonel kelime dağarcığına ihtiyaç duyarken, diğer yandan tüccarlar, tüketicilerin gerçek ihtiyaçlarını anlamamakta ve tüketicilere ancak e-ticaret işlemleri, danışmanlık yoluyla ulaşabilmektedir. tüketicileri daha iyi anlamak için araştırma kurumları. ProductGPT gibi çok yönlü bir diyalog işlevini kullanıma sunduktan sonra, tüccarların ve tüketicilerin ürünler üzerindeki dinamik eşleştirme verimliliği, pazar araştırmasından daha verimli olacak, böylece e-ticaret platformları ürün inovasyonu, tasarımı, araştırma ve geliştirmesine daha derinden katılabilir ve pazarlama. promosyon vb.
Gerçek ticari toplumda, talep tarafı ile arz tarafı arasında aslında güçlü bir karşılıklılık vardır. Kendi geliştirdiğimiz lider İşbirlikçi İnovasyon Platformu Hizmet Olarak Sunulan Yazılımlarımız, büyük modellerin çok modlu anlayışına, muhakemesine ve üretim yeteneklerine dayanır ve şirketlerin tüketicilere, senaryolara, ürünlere, ürün referanslarına ve Ar-Ge'ye ilişkin derinlemesine içgörüler aracılığıyla iş fırsatlarını ve ürün yeniliğini keşfetmesine yardımcı olur. . Aynı zamanda, Lianyuan Technology'nin ProductGPT çok yönlü diyalog platformu, kurumun her çalışanına farklı profesyonel rollere göre derinden özelleştirilmiş bir kişisel asistan sağlar ve göreve özgü beceri ve bilgi sağlayarak özel çalışma ihtiyaçlarını karşılar. Örneğin, Lianyuan Technology'nin tüketici araştırma kişisel asistanı, pazar trendlerini araştırmak, tüketici ihtiyaçlarını anlamak ve pazar araştırması gibi mesleki beceriler ve ilgili bilgiler sağlayacaktır.
**AI Teknoloji İncelemesi: JD.com'da para kazanmak için üretken AI kullandınız, bunu nasıl yaptınız? **
**Zhou Bowen:**2019'da, JD.com'un yapay zeka ekibine ürün metin yazarlığı oluşturmak ve resimleri seçmek için üretken yapay zekayı uygulamaya yönlendirdim. Bu aynı zamanda JD.com'un ilk üretken büyük ölçekli modelidir. O zamanlar yapay zeka modelimiz temel olarak üç şeyi başardı:
Öncelikle ürün detay sayfasındaki içeriği kendiniz okuyabilmek ve analiz yaparak doğrudan bu ürünün 8-9 satış noktasını oluşturabilmek;
İkincisi, bir tüketici belirli bir ürüne göz attığında, büyük model, farklı tüketicilerin davranış verilerini analiz ederek hangi satış noktalarının kullanıcıyı daha fazla etkileyebileceğini hızlı bir şekilde bulacaktır;
Üçüncüsü, AIGC, kullanıcı portrelerine dayalı olarak tüketicilerin en çok endişe duyduğu satış noktaları etrafında özel sloganlar üretecek.
Bir uygulama döneminin ardından, ürün önerilerinin dönüşüm oranı eskiye göre %30 arttı. Tüketiciler, JD.com'da arama yaptıklarında ve alışveriş yaptıklarında, gördükleri ürün kategorilerinin ve açıklamalarının, kullanıcının ürünlere göz attığı andaki tercihlerine ve ürünlerin satış noktalarına göre AIGC tarafından kelime kelime otomatik olarak oluşturulduğunu fark etmeyebilirler. .
**AI Teknoloji İncelemesi: OpenAI'nin açık API'si hakkında ne düşünüyorsunuz ve bunun sektör için anlamı nedir? **
Zhou Bowen: Kişisel deneyimlerime dayanarak, IBM Watson Group'un baş bilim adamıydım. O zamanlar Amerika Birleşik Devletleri'ndeki bazı endüstrilerin verileri düzenlenmişti ve bu tür işletmeler genellikle işbirliği yapamıyor ve yalnızca özel bulutları dağıtabiliyordu. Bu nedenle 2015-2016'da genel bulut olmaya kararlıydım. Bunu başarmak için Watson'ın AI yeteneklerini APIize etmek gerekiyor. O zamanlar diyalog ve doğal dil anlama dahil düzinelerce API'nin piyasaya sürülmesine öncülük ettim. Bu API'leri bulut platformuna koyun ve şimdi IBM'in yapay zeka işi esas olarak bundan para kazanıyor.
2017 sonunda Çin'e döndüm ve Nisan 2018'de JD.com'un yapay zeka açık platformunu çıkardım. O zamanlar, Çin'de temelde hiçbir AI platformu yoktu ve bu da JD.com'a önemli bir gelir getirdi. 2019'da liderliğini yaptığım JD.com AI ekibi 170 milyon yuan gelir elde etti ki bu 200 kişilik bir ekip için hiç de fena sayılmaz.
**AI Technology Review: Sektörde dikey büyük model yapma riskinin çok yüksek olduğuna dair bir algı var, siz ne düşünüyorsunuz? **
Zhou Bowen: Gelecekte, bu iyi tanımlanmış, yüksek değerli iş akışlarının genel yapay zeka modelleri yerine profesyonel yapay zeka modelleri tarafından tamamlanacağını düşünüyorum. Belirli bir dikey sahne başarıyla tamamlandıktan sonra genel amaçlı büyük bir modelin temel özelliklerini daha da geliştirmek kolaydır. Ek olarak, dikey bir senaryodan yola çıkarsak, bilgi işlem gücü, veri ve algoritmalar açısından geçmiş birikimimiz daha tam olarak kullanılabilir. Bu nedenle, Lianyuan Teknolojisinde, büyük model, teknolojinin altında yatan çerçevede genel büyük model teknolojisinin temel yeteneklerine sahip olmalı ve bilimsel yöntemlerle değerlendirilmelidir, ancak aynı zamanda profesyonel eğitim gerektirir.
2023'te ChatGPT'nin ani popülaritesi nedeniyle pazar, devasa potansiyelini açıklamak için AI 2.0'ı kullanmaya başladı. Ayrıca, neredeyse tüm teknoloji devleri savaşa katıldı, risk sermayesi piyasası yeni fırsatları yakalamaya çalışıyor ve pazar ortamı da hızla değişiyor. GPT sistematik bir girişimcilik fırsatıdır, ancak yalnızca kopyalamak, takip etmek ve yetişmek riskli ve zordur.
Lianyuan Technology'yi kurduktan sonra 100'den fazla müşteriyle iletişim kurduk, gerçek ihtiyaçları gördük ve büyük modeli sürekli optimize ederek teknoloji gerçekleştirme yolunu iyileştirdik: "2022'de bu senaryonun ticari değerini ve teknik fizibilitesini gösterdik. büyük bir model yapıyor olsak bile OpenAI'den farklı bir yoldayız ve kar modeli de farklı.
Yapmak istediğim, çok etkileşimli veriler gerektiren mevcut GPT'den daha iyi bir dünya bilgisi sıkıştırıcısı ve veriler açıkça sahneyle yakından ilişkili. Ne tür verilerin daha yüksek insan zekası anlamına geldiğine gelince, aslında bu konuda yapılacak çok fazla teorik çalışma var ve bu gelecekte keşfedilmeye değer bir yön.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Diyalog 丨Bowen Zhou: Genel büyük ölçekli model, dikey endüstri senaryolarını nasıl aşar?
Yazar: Wang Yongang Editör: Dong Zibo
**Kaynak:**AI Teknoloji İncelemesi
JD.com'dan ayrıldıktan sonra Zhou Bowen uzun zamandır bu kadar heyecanlanmamıştı.
ChatGPT'nin, hayatın her kesiminden uygulayıcıları uyandıran bir bahar gök gürültüsü gibi dünyayı harekete geçirdiği ortaya çıktı, böylece hepsi AGI'nin gerçeğe dönüşen ayak seslerini duydu.
Yükseliş altında, insanlar Wang Huiwen ve Wang Xiaochuan'ın kendi işlerini kurduklarını ve ayrıca Baidu ve Alibaba'nın piyasaya hakim olduğunu gördüler. IBM ve JD.com'un AI Araştırma Enstitüsü'nün eski dekanı olan Zhou Bowen, 25 yılı aşkın bir süredir yapay zekanın temel teorisini ve çekirdek en son teknolojileri, uygulamaları ve sanayileşmeyi inceledi ve Lianyuan Technology'yi kurdu. 2021'in sonu gibi erken bir tarihte. Üretken yapay zeka, çok yönlü diyalog ve insan-bilgisayar işbirliği teknolojisine sahip Model, işletmelerin ve tüketicilerin yeni yapay zeka çağında ürün yeniliğini ve dijital zeka dönüşümünü tamamlamasına yardımcı olur. "Bu alanda bir iş kurmaya pek karar vermedim, bu işin beni bulduğunu söylemek daha iyi." Zhou Bowen, sanki bir görev duygusu onu harekete geçmeye zorluyormuş gibi, bunu yapılması gereken bir şey olarak nitelendirdi.
Zhou Bowen, Çin Bilim ve Teknoloji Üniversitesi'nden mezun oldu ve ardından doktora yapmak için Boulder'daki Colorado Üniversitesi'ne gitti. IBM Research'ün ABD genel merkezi yapay zeka temel araştırma enstitüsünün eski başkanı olarak, uzun yıllar yapay zeka ile ilgili çalışmalara başkanlık ettikten sonra Çin'e döndü ve art arda JD Group'un kıdemli başkan yardımcısı, grup teknik komitesi başkanı, grup başkanı olarak görev yaptı. JD Cloud ve AI ve JD Yapay Zeka Araştırma Enstitüsü'nün kurucu başkanı ve diğer pozisyonlar. JD AI'nin kurucusu olarak, JD AI'nin teknik araştırma ve iş geliştirmesinden sorumludur. Akıllı tedarik zinciri yapay zekası için ulusal bir açık platform oluşturmak üzere 0'dan JD AI Bölümü, AI Araştırma Enstitüsü ve JD AI Accelerator'ı kurdu. , günlük arama hacmini 0'dan on milyarlara çıkardı, Jingdong yapay zeka müşteri hizmetlerinin teknik olarak yeniden yapılandırılmasına öncülük etti ve harici ürünleştirmeyi başlattı, milyarlarca teknik servis işini ve binlerce entegre teknoloji, ürün, pazarlama ve satış ekibini yönetti.
2021'de Zhou Bowen, üretken yapay zekanın yakın gelecekte patlayacağını tahmin etti ve bu nedenle JD.com'dan ayrılarak dikey işletmelerin genel büyük ölçekli modelle ürün inovasyonu ve dijital zeka dönüşümü gerçekleştirmesine yardımcı olmayı taahhüt eden Lianyuan Technology'yi kurmaya karar verdi. 2022'de Tsinghua Üniversitesi'nde Huiyan Kürsüsü Profesörü ve Elektronik Mühendisliği Bölümü'nde kadrolu profesör olarak görev yapacak ve aynı yılın Mayıs ayında Collaborative Interactive Intelligence Research'ü kuracak. Tsinghua Üniversitesi'nin merkezi Tesadüfen. **
ChatGPT gelmek üzere ve Zhou Bowen ayrıca Moments'ta şunları yazdı: "Çin'in OpenAI'sinin yeni bir yol keşfetmesi gerektiğine inanıyorum!" Gururunun altında yetenekler aramaya can atıyor. Ancak diğer girişimcilerden farklı olarak, Zhou Bowen ve Lianyuan Technology, genel yetenekler temelinde insanlar ve mallar arasındaki ilişkiyi anlamada büyük modeli daha iyi hale getirmek için on milyarlarca parametreye ve benzersiz eğitim yöntemlerine güvenmeyi seçti. ürün içgörüsü, konumlandırma, tasarım, Ar-Ge'den pazarlamaya kadar tam bağlantılı inovasyon sistemi.
Zhou Bowen bir keresinde, girişimcilik yönünün, kurumsal dijital zeka inovasyonuna daha yüksek değer getirmek için yapay zekayı geleneksel endüstrilerle entegre etmede liderliği ele geçirmek, yani dikey senaryolarda genel büyük modellerin yeteneğinde bir atılım gerçekleştirmek olduğunu kamuoyuna açıklamıştı.
Geçenlerde, AI Technology Review'dan bir muhabir Zhou Bowen ile bir konuşma yaptı. Aşağıda, konuşmanın dökümü yer almaktadır. AI Technology Review, orijinal anlamını değiştirmeden içeriği düzenledi:
Yapay zekanın yeni bir etkileşim ve işbirliği paradigması olan insan bilgeliğini öğrenmesine izin verin
**AI Teknoloji İncelemesi: ChatGPT bu etkileşim yöntemini getirdi, sizce önceki etkileşim yönteminden farkı nedir? **
Zhou Bowen: Araştırma yönlerimden biri, yapay zeka ile insanlar arasındaki etkileşim ve etkileşim içinde öğrenme. İnsan-bilgisayar etkileşimi, insan-bilgisayar diyaloğundan farklıdır.İnsan-bilgisayar etkileşimi yoluyla, AI süreçteki şeyleri öğrenebilir, bu nedenle bu, gerçekleştirilmesi basit bir görev değil, öğrenmeyi başarmanın bir yoludur.
"The Analects of Confucius"ta kaydedildiği gibi, Konfüçyüs ve yetmiş iki öğrencisinin etkileşim yoluyla öğrenmelerinin hikayesidir. Batı'da, Platon ve Aristoteles'in Atina Akademisi'ne benzer şekilde, en eski bilgi ve bilgeliğin mirası, insanlar arasındaki diyalog yoluyla sağlanır ve öğretmenler, öğrencilerle etkileşim yoluyla öğrencilerin çalışmalarını daha iyi tamamlamalarına yardımcı olur.
Örneğin, öğretmen öğrencilerden bir bardak su dökmelerini isterse, bu kadar basit "emir-yürütme" eylemlerinin bilgeliği artırması zordur; Zorlukların üstesinden nasıl gelinir, bilgeliği artırabilecek etkileşim budur ve aynı zamanda yansıtır insanlar ve yapay zeka arasındaki işbirlikçi etkileşime ilişkin temel bakış açım.
AI'nın özü, insanlarla işbirliği ve etkileşimdir. Etkileşimlerden sürekli olarak öğrenir ve ardından sorunları daha iyi çözmek için insanlarla işbirliği yapar. Bu bakış açısı yakın gelecekte giderek daha fazla önem kazanacak ve aynı zamanda daha teknik ve etik zorluklarla karşılaşacak ve sonuçta kârlılığı korumak kolay olmayacaktır. Herkesin söylediği AI Hizalaması gibi, insanlar iradelerini AI'ya aktarabilir ve ardından AI ile görevleri parçalayarak AI'nın bu süreçte insan iradesini öğrenmesine ve gerçekleştirmesine izin verebilir. Bu, yeni bir işbirliği yöntemi, yani işbirliğine dayalı etkileşimli zekadır.
**Yapay Zeka Teknoloji İncelemesi: Etkileşim yoluyla değer uyumu sağlamanın insan beyni ve GPT için işbirliği yapması için etkili bir yol olduğunu düşünüyor musunuz? İnsanlar ve yapay zeka birlikte nasıl daha iyi çalışmalıdır? **
**Zhou Bowen: **Üretken yapay zekanın patlamasından sonra, insanlarla işbirlikçi etkileşim yoluyla öğrenen yapay zeka giderek daha da güçlenecek.
2002'de Nobel Ekonomi Ödülü sahibi Daniel Kahneman, çok satan Hızlı ve Yavaş Düşünmek adlı kitabında insan düşüncesinin iki modu olduğunu öne sürdü: 1. sistem ve 2. sistem ve 1. sistem hızlıdır.Düşünme, sezgisel muhakeme; Sistem 2, çok fazla muhakeme ve hesaplama gerektiren yavaş düşünmedir.
Başlangıçta, insanlar yapay zekanın "sistem 1"in örüntü tanımaya dayalı yüz tanıma ve kalite denetimi gibi "sistem 1" çalışmaları için daha uygun olduğunu düşündüler. Ancak yapay zekanın gerçek değerinin, insanların karmaşık mantıksal akıl yürütme görevlerini daha iyi tamamlamasına yardımcı olmak olan 2'de yattığı konusunda ısrar ediyorum. ChatGPT'nin ortaya çıkışı, AI'nın Sistem 2 olarak fizibilitesini doğrulamıştır; bu, AI'nın yeni bilgiler keşfedebileceği ve yeni bilgilerin keşfedilmesinin insanların daha iyi AI tasarlamasına yardımcı olacağı anlamına gelir, örneğin beyin bilimi ve hesaplama optimizasyonu Discovery ve yeni bilgi yaratmak için bir volan ortaya çıkıyor. Volan etkisi, AI'nın tüm sistemin yeni bilgileri daha iyi keşfetmesini sağlayabileceği ve bu yeni bilginin daha iyi AI sistemleri tasarlamaya yardımcı olabileceği ve böylece bir erdemli döngü oluşturabileceği anlamına gelir. Bu nedenle, yapay zeka, bilgi ve yenilik arasında karşılıklı olarak güçlendirici bir ilişki kuruldu ve bu da yapay zeka ile insanların işbirliği yapma biçiminin dönüştürülmesini gerektiriyor.
Daha önce bir "3+1" araştırma yönü önermiştim, yani güvenilir yapay zekayı araştırma temeli ve uzun vadeli hedef olarak kullanmak, çok modlu temsil etkileşimi, insan-bilgisayar işbirlikçi yorumlama ve çevresel işbirlikçi evrime odaklanmak. İşin özü insan olmaktır Makinelerin işbirliği ve birlikte yaratılması, insanların yapay zekanın yenilik yapmasına yardım etmesi ve yapay zekanın da insanların yenilik yapmasına yardım etmesi hedefini gerçekleştirebilir.
Bunlardan biri, büyük bir birleşik teorinin olabileceği çok modlu temsil etkileşimidir. 2022'de insanlar buna hala şüpheyle bakıyor, ancak GPT-4'ün ortaya çıkmasıyla bu çok modlu birleşik temsil etkileşimi daha inandırıcı hale geldi; Başka bir nokta da insan-bilgisayar işbirlikçi etkileşimidir. 2022'de insanlar da buna şüpheyle yaklaşıyordu, ancak şimdi bu etkileşim yöntemi daha inandırıcı hale geldi ve insanlar bunun olma ihtimalinin yüksek olduğuna inanmaya başladı; Üçüncü nokta, yapay zeka ve çevrenin birlikte evrimidir, Bu AI'nın yalnızca insanlarla işbirliği yapması değil, aynı zamanda çevredeki ortama da uyum sağlaması gerektiği anlamına gelir. Bu konsepti ilk olarak 2022'nin başlarında önerdik ve şimdiye kadar OpenAI dahil bu yönde başarılı bir vaka görmedik.
OpenAI öğrenemiyorsanız, ancak Microsoft'u öğrenemiyorsanız, büyük ölçekli yerel işletme girişimleri için çıkarmanız gerekir
**Yapay Zeka Teknoloji İncelemesi: Transformer modelinin özelliği, metni modellemek için bir dikkat mekanizması (Dikkat) kullanmasıdır. Yapay zeka dikkat mekanizmasıyla ilgili çok erken bir araştırma yaptığınızı fark ettik. **
**Zhou Bowen:**Transformer'ın temel özellikleri, kişisel dikkat mekanizması ve çok kafalı mekanizmadır. Haziran 2017'de Google Brain tarafından yayınlanan "Attention is All You Need", öz-dikkat (öz-dikkat) mekanizması ve Transformer kavramını tanıttı. Daha sonra, OpenAI'nin GPT'si de bu makaleden derinden etkilendi.
Bundan önce, kodlayıcıyı geliştirmek için çok sekmeli bir öz-dikkat mekanizmasını tanıtmak için ilgili yazar olarak ilk makaleyi yayınladım - "Yapılandırılmış Öz-Dikkatli Cümle Gömme". Bu makale 2016'da tamamlanıp arXiv'e yüklendi ve 2017'nin başlarında ICLR'de resmi olarak yayınlandı. Ayrıca bu mekanizmayı öneren ilk ekibiz ve daha da önemlisi bu, aşağı yönlü görevleri dikkate almayan ilk doğal dil temsil modelidir. hiç. Herkes daha önce bazı durumlarda dikkatini veya kişisel dikkatini kullanmıştır, ancak bunların hepsi göreve bağlıdır.
**AI Teknoloji İncelemesi: Bu makalede ne buldunuz? Bu keşifler sonraki Transformer teknolojisi değişikliklerini nasıl etkiledi? **
Zhou Bowen: Makalede, en iyi temsil yönteminin, doğal dili (NLP) temsil etmek için yapılandırılmış öz-dikkat kullanmak olduğunu öne sürdük. Bu makale, yayınlanmasından bu yana 2.300'den fazla kez alıntılanmıştır.
Bundan önce, OpenAI'nin baş bilim adamı Ilya Sutskever, en iyi temsil yönteminin "diziden diziye (Seq2Seq)", yani modeli bir alanın dizisini başka bir alanın dizisine dönüştürmek için eğitmek olduğuna inanıyordu. , örneğin makine çevirisinde karşılık gelen kaynak dil ve hedef dil veya sorunun bir sıra ve cevabın bir sıra olduğu soru yanıtlamada. Bu temelde, derin sinir ağı tarafından temsil edilen ikisi arasındaki haritalama ilişkisi öğrenilir.
Ancak daha sonra, derin öğrenme uzmanı ve Turing Ödülü sahibi Yoshua Bengio'dan oluşan ekip, soruları cevaplarken tüm kelimelerin eşit derecede önemli olmadığı bir "dikkat mekanizması" önerdi; Daha kritik kısımları belirleyerek ve ardından daha fazla dikkat göstererek bu kısma daha iyi cevap verebilirsiniz. Bu dikkat modeli kısa sürede çok geniş bir kabul gördü. 2015 yılında, IBM ekibinin aynı zamanda "Seq2Seq+Attention Mechanism" mimarisine ve fikirlerine dayalı araştırma başlatmasına öncülük ettim ve art arda doğal dilde yapay zeka yazımı için birkaç en eski üretken modeli başlattım. İlgili makalelere ayrıca atıf yapıldı. 3000 defadan fazla.
Ama o zamanlar gazetenin içeriğinden memnun değildim çünkü içinde bir sorun vardı yani dikkat cevaba göre kurgulanıyordu. Bu şekilde yetiştirilen yapay zeka, üniversitenin final sınavından önce öğretmeninden kilit noktaları işaretlemesini isteyen ve ardından kilit noktaları dikkatle gözden geçirmeye giden bir öğrenci gibidir. Bu şekilde, yapay zekanın belirli sorunlar üzerindeki performansı iyileştirilebilse de evrensel değildir. Bu nedenle, verilen göreve ve çıktıya bağlı olmadığını, yalnızca doğal dilin girdisinin iç yapısına dayandığını ve AI çoklu okumaları aracılığıyla hangi bölümlerin daha önemli olduğunu ve aralarındaki ilişkiyi öğrendiğini önerdik. öz-dikkat artı Çok Kafalı Mekanizmalar için Temsil Öğrenimi. Bu tür bir öğrenme mekanizması, testin kilit noktalarına dayalı olarak hedeflenmiş ve parçalı bir şekilde öğrenmek yerine, öğrencilerin dersi birden çok kez ve sistematik olarak testten önce çalışıp anlaması gibi, yalnızca girdiye bakar, böylece daha yakındır. genel yapay zekanın amacına ve büyük ölçüde Geliştirilmiş AI'nın öğrenme yeteneğine.
**AI Technology Review: "Attention is All You Need" makalesi ile sizin aranızdaki ilişki nedir? **
Zhou Bowen: Bu dalganın tüm büyük modellerinin Transformer'dan geldiğini biliyoruz, bu nedenle modelde bir T gördüğünüzde, T büyük olasılıkla Transformer'ı temsil ediyor. Bu alanda ileriye dönük bazı çalışmalar yapmaktan büyük onur duyuyorum. 2017'nin sonunda, Google'dan araştırmacılar, Transformer modelini dünyaya getiren bir kilometre taşı olan "Dikkat Tek İhtiyacınız Olan" makalesini yayınladı. Ve ilk olarak 2017'nin başlarında yayınlanan bir "çok sekmeli öz-dikkat mekanizması" öneren "Yapılandırılmış Özenli Cümle Gömme" makalemize atıfta bulunuldu. Ve bu makalenin ilk yazarı Ashish Vaswani, IBM'de akıl hocalığı yaptığım bir öğrenciydi. Makalenin başlığı "Attention is All You Need", tarafımızdan önerilen "kendine dikkat çok önemlidir, çok başlılık çok önemlidir, ancak RNN daha önce düşündüğümüz kadar önemli olmayabilir" anlamını da ifade etmektedir.
**AI Teknoloji İncelemesi: Siz ve OpenAI arasında hangi tutarlı teknik yargılara sahipsiniz? **
**Zhou Bowen: Bu makale ve Transformer mimarisi her şeyi tamamen değiştirdi ve modelin uzun mesafe belleği sorununu çözdü. Ilya Sutskever, yakın tarihli bir röportajda, makalenin yayınlanmasından bir gün sonra OpenAI'nin tamamen Transformer mimarisine geçtiğini hatırladı. **
GPT'nin Bert'in modelinden çok farklı olduğunu biliyoruz ve Bert'in başlarda çok başarılı olmasına rağmen daha sonra GPT kadar iyi olmamasının nedeni hem soldan sağa hem de sağdan sola bilgileri kullanmasıdır. Başka bir deyişle, Bert, yapay zekanın nasıl temsil edileceğini öğrenmesine yardımcı olmak için gelecekteki bilgileri kullanırken, GPT yalnızca geçmiş bilgilere dayanarak bir sonraki kelimenin ne olacağını tahmin etmekte ısrar ediyor. **OpenAI'nin bu noktadaki yaklaşımı, ekibimizin düşüncesiyle, yani öğrenmek için cevapları kullanmamaya çalışın. **Dikkatten kendine dikkat etmeye, BERT'den GPT-3'e kadar temel fikir, tahmin edilecek kelimenin çıktısı veya bağlamı gibi gelecekteki bilgilere artık güvenmemeniz veya daha fazla verinin kullanılabilmesidir. tamamen AI modellerini eğitirken, AGI olasılığını görmeye başlarız.
Ayrıca OpenAI, büyük modellerin dünya bilgisini doğal dil yoluyla öğrendiğine ve böylece dünya bilgisini büyük modellere sıkıştırdığına inanır.GPT serisi büyük modeller ve ChatGPT de bu konsepte göre tanıtılır. Aynı şey, ekibim ve benim konsept ve vizyonumuz için de geçerli, yani genel amaçlı büyük ölçekli bir model oluşturmak ve profesyonel eğitim yoluyla dikey alanda daha yüksek değer ve yetenekler ortaya koymasını sağlamak ve tüketicileri entegre etmek. karmaşık duygular, ihtiyaçlar ve deneyimlerin yanı sıra ürün yeniliği, Tasarım, ürün parametreleri, malzemeler, işlevler vb., insanlar ve ürünler arasındaki ikili ilişkiyi yeniden yapılandırmak için büyük bir modele sıkıştırılır ve değerini yeniden şekillendirmek için yapay zekayı kullanır. ürünler.
**Yapay Zeka Teknoloji İncelemesi: Teknik güce ek olarak, OpenAI'nin başka hangi yönleri size yararları olduğunu düşündürüyor? **
Zhou Bowen: Yalnızca teknik yargılar açısından değil, ekosistemin kurulması, yeni Moore Yasasının duyurulması, API fiyatlarının %90 oranında düşürülmesi vb. dahil olmak üzere OpenAI'nin tüm iş yaklaşımı temsilidir. büyük modellerin ticari uygulaması için sermayenin ve kullanıcıların hayal gücü alanını genişletin ve neredeyse sınırsız uygulama senaryoları elde edin. Ayrıca, OpenAI'nin etik yönetişim, iş geliştirme, ekolojik teknoloji ve gelecek geliştirme planları da çok net.
**AI Teknoloji İncelemesi: Bir sonraki OpenAI Çin'de görünecek mi? **
** Zhou Bowen: ** Büyük bir model oluşturmanın teknik zorluğu aslında birçok Çinli girişimcinin hayal gücünün ötesinde. Bu nedenle, yerli şirketlerin "OpenAI+Microsoft" modelini körü körüne takip etmelerini ve kopyalamalarını önermiyorum, çünkü Çin'deki Çinli teknoloji şirketlerinin çoğu iş karar verme yeteneğinde Microsoft kadar iyi değil ve teknoloji muhakeme yetenekleri o kadar iyi değil. OpenAI olarak. **
OpenAI'nin başarısı birçok faktörün sonucudur: Örneğin, Ilya Sutskever teknik yargılarda bulundu, Greg Brockman işlevleri yerine getirdi ve Sam Altman, yapay zekanın etik ve toplum üzerindeki etkisine ilişkin araştırma da dahil olmak üzere kaynakları entegre etti. Yerli şirketler sadece OpenAI'yi taklit ederse, birbirleri arasındaki mesafe sadece daha da uzaklaşacaktır.
OpenAI'nin teknik yargısı, verilerin enleminden görülebilir, çünkü dünyadaki tüm veriler eşit derecede önemli değildir. OpenAI, düşünme zincirini eğitmek için neden Github'ın programlama dilini kullanmayı seçti? Programlama dilinin semantiği ve sözdizimi son derece basit olduğundan, yürütme sürecinin mantığı titizdir. Bu aynı zamanda OpenAI'nin bir özelliğini ve avantajını temsil eder: körü körüne saldırmaz. Bu nedenle, Çin'in yapay zeka gelişiminin başka bir yol bulması gerektiğini düşünüyorum, yani genel büyük modellerin dikey senaryoların uygulanmasından başlama yeteneğine güvenerek, ki bu da başarılı olma olasılığı daha yüksektir.
Üretken yapay zeka, mevcut tüketici deneyimini bozacak
**AI Teknoloji İncelemesi: Neden tüketici sektörünü hedefliyorsunuz? **
Zhou Bowen: JD.com'dayken "tüketici talebini ve ürün tasarımını yapay zekayla dinamik olarak eşleştirme" konusunda büyük bir iş fırsatı gördüm. 2021'de, belirli olmayan senaryolardan tüm tüketici davranışlarını kapsamayı umarak dikey endüstriler için genel bir büyük dil modeli geliştirmek üzere işimden ayrılmaya ve bir iş kurmaya karar verdim (o zamanlar büyük dil modeli patlamamıştı). Pazartesiden Cumaya zaman ve mekan sahnelerinin farklı olduğunu ve beyaz yakalı çalışanların veya diğer mesleklerin odaklarının da farklı olduğunu biliyoruz.Alışveriş davranışını etkileyen bu kültürel sembollerin arkasında tüketicilerin karmaşık duyguları, deneyimleri ve ürün seçimleri vardır. , bu tam olarak işletmelerin ihtiyaç duyduğu değerli bilgilerdir. Tedarik tarafında ürünler yapılırken yaratıcılık, tasarım, ürün parametreleri, işlevler, malzemeler ve marka konumlandırma, slogan, pazarlama, reklam, pazarlama, tanıtım görselleri vb.
Bu tür bir karşılık gelen ilişki daha önce insanlar tarafından hiç geçmedi. Planlama, pazarlama ve satış alanındaki uygulayıcılar yalnızca sorumlu oldukları bağlantıları anlarlar. Ve emtia tedarik zincirinin dünyanın ilk genel amaçlı büyük ölçekli modelini yapacağız, yani tüm bu bilgileri yüksek doğrulukla genel amaçlı bir modele sıkıştıracağız ve bu büyük ölçekli modele dayalı olarak yetkilendirme yapacağız. Fırsatlar Öngörü (Keşfet), ürün tanımı (Tanımla), program tasarımı (Tasarım), Ar-Ge'yi yönlendirme (Geliştirme), pazarlama dönüşümü (Dağıt) dahil olmak üzere kurumsal ürünlerin tüm yaşam döngüsü. Bu sayede işletmeler yenilik fırsatlarını daha verimli keşfedebilir, daha yaratıcı tasarlayıp üretebilir, pazarlama tutundurma yapabilir, kullanıcılara ulaşabilir ve dönüşümü daha etkin bir şekilde tamamlayabilir.
**AI Teknoloji İncelemesi: İş modeli açısından bu daha gelişmiş görünüyor. **
Zhou Bowen: Herhangi bir girişimci ekip için, büyük modellerin genel teknik yeteneklerine sahip olduktan sonra daha profesyonel yetenekler geliştirebilmek çok önemlidir. Şu anda, GPT'nin atılımı esas olarak genel yeteneğindedir, ancak belirli endüstriler ve dikey alanlar için değeri henüz geliştirilmemiştir.Örneğin: GPT çok gerçekçi sanatsal resimler çizebilir, ancak devre şemaları çizemez, çünkü çizemez. yeterli fiziksel bilgi birikimine sahip olmamak Derinlemesine ve ilgili yargılar yeterince profesyonel değildir.
Bu nedenle, tüketicilerin ihtiyaç duydukları ürünleri bulmalarını ve satın alma konusunda daha istekli olmalarını kolaylaştıracak ve insanların mevcut alışveriş yollarını tamamen değiştirebilecek böyle bir araca (profesyonel yeteneklere sahip genel amaçlı büyük bir model) ihtiyaç olduğunu düşünüyorum. . Üretken yapay zeka, emtia tedarik zincirinin tüm yönlerini öğrenmek ve tüketiciler merkezli kilit bağlantıların verimliliğini artırmak için çok büyük miktarda iş bilgisini bu tür büyük modellere sıkıştırabilir. Bu, 2021'de zaten üretilmiş olan fikir ve yaratıcılıktır.
**Lianyuan Technology, genel yeteneklere sahip büyük bir model geliştiriyor. Bu büyük model, ürünleri ve tüketicileri birbirine bağlama konusunda uzmanlığa sahip. **2/3'ü muhakeme yeteneği ve hesaplama yeteneği gibi genel amaçlı yetenekler olan 37 büyük ölçekli model değerlendirme göstergemiz var ve ürünler ile tüketiciler arasındaki bağlantıya özel olarak uygulanan bir düzineden fazla öğe var. "Her ürün ihtiyaçtan doğsun, her tüketici istediğini alsın" hedefini gerçekleştirin.
**Yapay Zeka Teknoloji İncelemesi: Üretken yapay zeka, e-ticaret gibi tüketim senaryolarıyla nasıl daha iyi entegre olabilir? **
**Zhou Bowen:**İnsanlar ya yalnızca planlamanın iş mantığını ya da pazarlamanın mantığını anlayabilir, ancak yapay zeka tüm iş zincirlerini açabilir.
Tüketiciler, e-ticaret platformları gibi senaryolarda istedikleri ürünleri bulabilmek için çok fazla profesyonel kelime dağarcığına ihtiyaç duyarken, diğer yandan tüccarlar, tüketicilerin gerçek ihtiyaçlarını anlamamakta ve tüketicilere ancak e-ticaret işlemleri, danışmanlık yoluyla ulaşabilmektedir. tüketicileri daha iyi anlamak için araştırma kurumları. ProductGPT gibi çok yönlü bir diyalog işlevini kullanıma sunduktan sonra, tüccarların ve tüketicilerin ürünler üzerindeki dinamik eşleştirme verimliliği, pazar araştırmasından daha verimli olacak, böylece e-ticaret platformları ürün inovasyonu, tasarımı, araştırma ve geliştirmesine daha derinden katılabilir ve pazarlama. promosyon vb.
Gerçek ticari toplumda, talep tarafı ile arz tarafı arasında aslında güçlü bir karşılıklılık vardır. Kendi geliştirdiğimiz lider İşbirlikçi İnovasyon Platformu Hizmet Olarak Sunulan Yazılımlarımız, büyük modellerin çok modlu anlayışına, muhakemesine ve üretim yeteneklerine dayanır ve şirketlerin tüketicilere, senaryolara, ürünlere, ürün referanslarına ve Ar-Ge'ye ilişkin derinlemesine içgörüler aracılığıyla iş fırsatlarını ve ürün yeniliğini keşfetmesine yardımcı olur. . Aynı zamanda, Lianyuan Technology'nin ProductGPT çok yönlü diyalog platformu, kurumun her çalışanına farklı profesyonel rollere göre derinden özelleştirilmiş bir kişisel asistan sağlar ve göreve özgü beceri ve bilgi sağlayarak özel çalışma ihtiyaçlarını karşılar. Örneğin, Lianyuan Technology'nin tüketici araştırma kişisel asistanı, pazar trendlerini araştırmak, tüketici ihtiyaçlarını anlamak ve pazar araştırması gibi mesleki beceriler ve ilgili bilgiler sağlayacaktır.
**AI Teknoloji İncelemesi: JD.com'da para kazanmak için üretken AI kullandınız, bunu nasıl yaptınız? **
**Zhou Bowen:**2019'da, JD.com'un yapay zeka ekibine ürün metin yazarlığı oluşturmak ve resimleri seçmek için üretken yapay zekayı uygulamaya yönlendirdim. Bu aynı zamanda JD.com'un ilk üretken büyük ölçekli modelidir. O zamanlar yapay zeka modelimiz temel olarak üç şeyi başardı:
Öncelikle ürün detay sayfasındaki içeriği kendiniz okuyabilmek ve analiz yaparak doğrudan bu ürünün 8-9 satış noktasını oluşturabilmek;
İkincisi, bir tüketici belirli bir ürüne göz attığında, büyük model, farklı tüketicilerin davranış verilerini analiz ederek hangi satış noktalarının kullanıcıyı daha fazla etkileyebileceğini hızlı bir şekilde bulacaktır;
Üçüncüsü, AIGC, kullanıcı portrelerine dayalı olarak tüketicilerin en çok endişe duyduğu satış noktaları etrafında özel sloganlar üretecek.
Bir uygulama döneminin ardından, ürün önerilerinin dönüşüm oranı eskiye göre %30 arttı. Tüketiciler, JD.com'da arama yaptıklarında ve alışveriş yaptıklarında, gördükleri ürün kategorilerinin ve açıklamalarının, kullanıcının ürünlere göz attığı andaki tercihlerine ve ürünlerin satış noktalarına göre AIGC tarafından kelime kelime otomatik olarak oluşturulduğunu fark etmeyebilirler. .
**AI Teknoloji İncelemesi: OpenAI'nin açık API'si hakkında ne düşünüyorsunuz ve bunun sektör için anlamı nedir? **
Zhou Bowen: Kişisel deneyimlerime dayanarak, IBM Watson Group'un baş bilim adamıydım. O zamanlar Amerika Birleşik Devletleri'ndeki bazı endüstrilerin verileri düzenlenmişti ve bu tür işletmeler genellikle işbirliği yapamıyor ve yalnızca özel bulutları dağıtabiliyordu. Bu nedenle 2015-2016'da genel bulut olmaya kararlıydım. Bunu başarmak için Watson'ın AI yeteneklerini APIize etmek gerekiyor. O zamanlar diyalog ve doğal dil anlama dahil düzinelerce API'nin piyasaya sürülmesine öncülük ettim. Bu API'leri bulut platformuna koyun ve şimdi IBM'in yapay zeka işi esas olarak bundan para kazanıyor.
2017 sonunda Çin'e döndüm ve Nisan 2018'de JD.com'un yapay zeka açık platformunu çıkardım. O zamanlar, Çin'de temelde hiçbir AI platformu yoktu ve bu da JD.com'a önemli bir gelir getirdi. 2019'da liderliğini yaptığım JD.com AI ekibi 170 milyon yuan gelir elde etti ki bu 200 kişilik bir ekip için hiç de fena sayılmaz.
**AI Technology Review: Sektörde dikey büyük model yapma riskinin çok yüksek olduğuna dair bir algı var, siz ne düşünüyorsunuz? **
Zhou Bowen: Gelecekte, bu iyi tanımlanmış, yüksek değerli iş akışlarının genel yapay zeka modelleri yerine profesyonel yapay zeka modelleri tarafından tamamlanacağını düşünüyorum. Belirli bir dikey sahne başarıyla tamamlandıktan sonra genel amaçlı büyük bir modelin temel özelliklerini daha da geliştirmek kolaydır. Ek olarak, dikey bir senaryodan yola çıkarsak, bilgi işlem gücü, veri ve algoritmalar açısından geçmiş birikimimiz daha tam olarak kullanılabilir. Bu nedenle, Lianyuan Teknolojisinde, büyük model, teknolojinin altında yatan çerçevede genel büyük model teknolojisinin temel yeteneklerine sahip olmalı ve bilimsel yöntemlerle değerlendirilmelidir, ancak aynı zamanda profesyonel eğitim gerektirir.
2023'te ChatGPT'nin ani popülaritesi nedeniyle pazar, devasa potansiyelini açıklamak için AI 2.0'ı kullanmaya başladı. Ayrıca, neredeyse tüm teknoloji devleri savaşa katıldı, risk sermayesi piyasası yeni fırsatları yakalamaya çalışıyor ve pazar ortamı da hızla değişiyor. GPT sistematik bir girişimcilik fırsatıdır, ancak yalnızca kopyalamak, takip etmek ve yetişmek riskli ve zordur.
Lianyuan Technology'yi kurduktan sonra 100'den fazla müşteriyle iletişim kurduk, gerçek ihtiyaçları gördük ve büyük modeli sürekli optimize ederek teknoloji gerçekleştirme yolunu iyileştirdik: "2022'de bu senaryonun ticari değerini ve teknik fizibilitesini gösterdik. büyük bir model yapıyor olsak bile OpenAI'den farklı bir yoldayız ve kar modeli de farklı.
Yapmak istediğim, çok etkileşimli veriler gerektiren mevcut GPT'den daha iyi bir dünya bilgisi sıkıştırıcısı ve veriler açıkça sahneyle yakından ilişkili. Ne tür verilerin daha yüksek insan zekası anlamına geldiğine gelince, aslında bu konuda yapılacak çok fazla teorik çalışma var ve bu gelecekte keşfedilmeye değer bir yön.