تعني سلسلة الأسئلة أعلاه أن دمج التخزين والحساب لم يعد "يبقى" في الأوساط الأكاديمية والصناعية ، ويبدو أنه شائع في السوق الثانوية: يعمل المساهمون ومؤسسات الوساطة لوقت إضافي لتعويض تكامل التخزين والحساب ، لذا فإن مصنعي الرقائق التقليديين منذ بداية عام 2023 ، تعرض تخطيط تكامل التخزين والحوسبة "للضرر".
السؤال الطبيعي هو لماذا أصبح تكامل الإيداع والحساب فجأة شائعًا جدًا؟
أعطت Huawei ، التي أصدرت منتج التخزين الجديد OceanStor A310 في 7.14 ، إجابتها الخاصة. قال Zhou Yuefeng ، رئيس خط إنتاج تخزين البيانات في Huawei ، إن هناك العديد من مشاكل البيانات في التدريب والتفكير في النماذج الكبيرة للأغراض العامة والنماذج الصناعية الكبيرة: الجمع البطيء عبر المجالات للبيانات الضخمة ، وانخفاض كفاءة تفاعل البيانات في المعالجة المسبقة و التدريب ، وصعوبة أمن تدفق البيانات.
يجلب نموذج الذكاء الاصطناعي الكبير تحديات جديدة للتخزين. على سبيل المثال ، الاستقرار أسوأ من استقرار الذكاء الاصطناعي التقليدي. وفي الوقت نفسه ، هناك قدر كبير من المعالجة المسبقة للبيانات وأعمال التحضير ، والتي تتطلب حوسبة قريبة من التخزين (نوع من التخزين والحساب) للتعامل بشكل منهجي مع هذه المشكلة.
إذن ، ما مقدار "كمية البيانات الكبيرة" هنا؟ وفقًا لحسابات SI Rui Insight ، فإن ChatGPT لديها حاليًا 100 مليون مستخدم يوميًا.إذا طرح 5 ٪ من الأشخاص أسئلة كل ثانية في نفس الوقت كل يوم ، فسوف يلتهم توليد الطاقة لسد الخوانق الثلاثة لمدة عام تقريبًا.
بعبارة أخرى ، تتطلب النماذج الكبيرة بشكل محموم قوة الحوسبة ، ويمكن للحلول الناشئة المتمثلة في تكامل التخزين والحوسبة أن تحل العديد من التحديات التي تسببها النماذج الكبيرة. في الواقع ، بالإضافة إلى فرض متطلبات صارمة على قوة الحوسبة ، يمنح النموذج الكبير أيضًا مصنعي شرائح الذكاء الاصطناعي "الكثير من السكر لتناوله".
تحاول هذه المقالة استكشاف ، في ظل خلفية النموذج الكبير ، ما هي الفوائد التي تُعطى لمصنعي شرائح الذكاء الاصطناعي؟ ما هو النمط المستقبلي للمصنعين المتكاملين للتخزين والحوسبة التي تم "إطلاقها" بواسطة ChatGPT؟
** PART-01 "الثروة والمحن يعتمدان على بعضهما البعض" الشركات المصنعة لشرائح الذكاء الاصطناعي **
لا تزال رياح نموذج بالحجم الطبيعي تهب ، ولا يزال النقاش حول النموذج على قدم وساق.
في بداية شهر أغسطس ، في المنتدى الفرعي لمؤتمر الذكاء الاصطناعي لاتحاد الكمبيوتر الصيني (CCF) - "رؤية حدود قوة الحوسبة النموذجية واسعة النطاق للذكاء الاصطناعي في كونلون" ، اتفق الخبراء والعلماء على أنه في عصر النطاق الواسع النماذج ، أصبحت قوة الحوسبة الذكية "أصلًا نادرًا". ، أصبحت كيفية الاستفادة الجيدة من موارد الحوسبة وتعظيم فوائدها تحديًا يجب على كل مشارك مواجهته.
بالنسبة لمقدار قوة الحوسبة التي تتطلبها GPT-3 وحدها ، في ظل الظروف المحافظة ، يحتاج سد الخوانق الثلاثة إلى "العمل" طوال الليل للوفاء بما يلي:
بافتراض وجود 100 مليون شخص عبر الإنترنت في نفس الوقت ، يطرح 5٪ منهم أسئلة كل ثانية في نفس الوقت كل يوم ، كل منها يشغل 30 رمزًا ، و 15.3 مليون شريحة H100 مطلوبة لتوفير قوة الحوسبة الاستدلالية ؛ والقوة استهلاك كل H100 هو 750 واط ، إذا تم تشغيله لمدة 10 ساعات في اليوم ، فإن استهلاك الطاقة السنوي لمركز البيانات حيث توجد شرائح H100 هذه سيصل إلى 84 مليار كيلو واط * ساعة ، في حين أن توليد الطاقة السنوي لسد الخوانق الثلاثة هو 88.2 مليار كيلوواط * ساعة.
ما يجعل مصنعي شرائح الذكاء الاصطناعي أكثر قلقًا هو أن هذا ليس سوى استهلاك الطاقة لنموذج ChatGPT كبير في مرحلة الاستدلال.
نتيجة لذلك ، تم اكتشاف سلسلة من الحلول الناشئة من قبل الشركات المصنعة: التخزين المتكامل والحوسبة ، و chiplets ، و HBM ، وما إلى ذلك. من بينها ، نظرًا لأن دمج التخزين والحوسبة قد أطاح بجدار التخزين في ظل بنية von Neumann التقليدية ، فقد حقق بالفعل خفض التكلفة وتحسين الكفاءة ، ليصبح Ziweixing هذا العام.
(مصدر الصورة: "تقرير صناعة رقائق طاقة الحوسبة الكبرى لمنظمة العفو الدولية - مئات البوارج ، المبتكرون أولاً" بقلم Cirui Insights)
بالإضافة إلى ظهور الحلول الناشئة التي منحت مصنعي شرائح الذكاء الاصطناعي الصعداء ، فإن النموذج الكبير يجلب أيضًا أخبارًا جيدة لمصنعي الرقائق ، وخاصة الشركات المصنعة للرقائق المبتدئة: تتراجع أهمية بيئة البرمجيات.
عندما لم تكن التكنولوجيا ناضجة بما يكفي في الأيام الأولى ، كان بإمكان الباحثين البدء فقط من خلال حل مشكلة معينة ، وولدت نماذج صغيرة بأقل من مليون متغير. على سبيل المثال ، DeepMind ، وهي شركة ذكاء اصطناعي مملوكة لشركة Google ، تسمح لـ AlphaGO بإجراء "تعليم" خاص على خطوات لعب الشطرنج لملايين اللاعبين المحترفين من البشر.
بعد وجود المزيد من الطرز الصغيرة ، تصبح مشكلة الأجهزة مثل تكيف الرقاقة وشيكة. لذلك ، عندما أطلقت Nvidia نظام CUDA البيئي الموحد ، فازت GPU + CUDA بسرعة باعتراف مجتمع علوم الكمبيوتر وأصبحت التكوين القياسي لتطوير الذكاء الاصطناعي.
تتمتع النماذج الكبيرة التي تظهر واحدة تلو الأخرى اليوم بقدرات متعددة الوسائط ، ويمكنها التعامل مع النصوص والصور والبرمجة وغيرها من المشكلات ، ويمكنها أيضًا تغطية مجالات رأسية متعددة مثل المكتب والتعليم والرعاية الطبية. هذا يعني أيضًا أن التكيف مع البيئة السائدة ليس هو الخيار الوحيد: عندما يرتفع الطلب على الرقائق للنماذج الكبيرة ، قد تتمكن الشركات المصنعة للرقائق من إكمال الطلبات لنماذج صغيرة متعددة في الماضي من خلال التكيف فقط مع نموذج واحد أو نموذجين كبيرين .
بمعنى آخر ، يوفر ظهور ChatGPT للشركات المصنعة للرقائق المبتدئة فرصة للتغلب على الزوايا. هذا يعني أن هيكل سوق شرائح الذكاء الاصطناعي سيخضع لتغييرات هائلة: لن يكون عرضًا فرديًا للمصنعين الفرديين ، بل لعب جماعي للعديد من المبتكرين.
عندما تصبح قوة الحوسبة سلعة نادرة ولم يعد التكيف مع البيئة السائدة أمرًا ضروريًا ، فإن تكامل التخزين والحوسبة بالكاد يمكن أن يخفي ضوءها. في هذا الوقت ، أصبح الاستثمار ومقدار الاستثمار هو المشكلة الثانية التي تواجه مصنعي شرائح الذكاء الاصطناعي.
في هذا الصدد ، فإن الإجابة التي قدمتها شركة NVIDIA العملاقة للرقاقات "ذات الخبرة" لسنوات عديدة هي أن تكون شجاعًا في الابتكار وأن تستثمر بكثافة:
لا شك أن كل شركة مصنعة للبحث والتطوير لتقنية ناشئة ستواجه مشكلات على مستويات مختلفة مثل عقبات الاستكشاف التقني وخلاف الشركات المصنعة للمصب. في المرحلة المبكرة ، أياً كان من يتوقع اتجاه التنمية المستقبلي أولاً ، يأخذ الشجاعة لاتخاذ خطوات الاستكشاف ، ويضع موارد معقولة للمحاولة ، فإنه يغتنم الفرصة.
عندما لم تصل موجة مراكز البيانات بشكل كبير بعد ، ولا يزال تدريب الذكاء الاصطناعي مجالًا متخصصًا ، استثمرت Nvidia بكثافة في تطوير وحدات معالجة الرسومات (GPU) للحوسبة العامة للأغراض العامة وبرامج البرمجة الموحدة CUDA ، وهي وظيفة جيدة لشركة Nvidia- منصات الحوسبة.
في ذلك الوقت ، كان جعل وحدة معالجة الرسومات قابلة للبرمجة "عديم الفائدة وخسارة": لا أعرف ما إذا كان يمكن مضاعفة أدائها ، ولكن تطوير المنتج سيتضاعف. لهذا السبب ، لا يوجد عميل على استعداد لدفع ثمنها. ومع ذلك ، قررت Nvidia ، التي توقعت أن معالج الرسومات أحادي الوظيفة ليس حلاً طويل الأمد ، تطبيق CUDA على جميع خطوط الإنتاج.
في مقابلة بين Xindongxi والدكتور Lai Junjie ، المدير الأول للهندسة والحلول في Nvidia China ، قال Lai Junjie: "من أجل رؤية منصة الحوسبة ، حشد Huang Renxun بسرعة الكثير من الموارد من Nvidia صعودًا وهبوطًا في وقت مبكر أيام."
Foresight + استثمار ضخم ، في عام 2012 ، فازت Nvidia بجائزة المبتكر: في عام 2012 ، تسبب أداء الحوسبة لخوارزمية التعلم العميق في إحداث ضجة كبيرة في الدائرة الأكاديمية. كأداة إنتاجية عالية الحوسبة وأكثر تنوعًا وسهولة في الاستخدام ، أصبحت GPU + CUDA شائعة بسرعة أصبح مجتمع علوم الكمبيوتر "التكوين القياسي" لتطوير الذكاء الاصطناعي.
في رحلة رقائق الذكاء الاصطناعي التي تتمتع بقوة حوسبة كبيرة ، أدخل التخزين المتكامل ورقائق الحوسبة "حقبة ذهبية" خاصة بهم ، والاستثمار مقدمًا هو الإجابة الصحيحة.
** PART-02 غير تقني ، غني ماليًا ، لا تدخل **
بالنظر إلى الفوائد المختلفة لدمج التخزين والحوسبة ، في هذه المرحلة ، ينمو معسكر اللاعبين الذين يدمجون رقائق الحوسبة والتخزين.
(مصدر الصورة: "تقرير صناعة رقائق طاقة الحوسبة الكبرى لمنظمة العفو الدولية - مئات البوارج ، المبتكرون أولاً" بقلم Cirui Insights)
وفقًا للإحصاءات غير المكتملة لـ CIRUI Insight ، منذ عام 2019 ، قامت معظم الشركات المصنعة لرقائق الذكاء الاصطناعي الجديدة بدمج التخزين والحوسبة: هناك 20 مصنعًا جديدًا لرقائق الذكاء الاصطناعي في 2019-2021 ، و 10 منهم اختاروا مسار تكامل الإيداع والحساب.
كل هذا يوضح أن تكامل التخزين والحوسبة سيصبح نجمًا صاعدًا بعد GPGPU و ASIC والبنى الأخرى. وهذا النجم الجديد ، لا يستطيع الجميع اختياره.
في ظل الظروف التي تكون فيها الأوساط الأكاديمية والصناعية ورأس المال متفائلة بالإجماع بشأن تكامل التخزين والحوسبة ، فإن القوة التقنية القوية واحتياطيات المواهب القوية والتحكم الدقيق في قبول تكاليف الهجرة هي المفتاح للحفاظ على القدرة التنافسية في الصناعة للبدء- حتى الشركات ، ثلاثة حواجز للاعبين الجدد.
القوة التقنية القوية هي دائمًا أعلى جبل في مجال الرقائق.
الأول هو تكامل التخزين والحوسبة ، والذي يتضمن العملية الكاملة لتصنيع الرقائق: من الجهاز الأدنى ، إلى تصميم الدوائر ، والتصميم المعماري ، وسلسلة الأدوات ، ثم إلى البحث والتطوير لطبقة البرنامج ؛ الجسم بالكامل ": أثناء إجراء التغييرات المقابلة في كل طبقة ، يجب أيضًا مراعاة درجة التكيف بين كل طبقة.
دعونا نلقي نظرة عليها طبقة تلو الأخرى ، ما نوع المشاكل التقنية الموجودة عند تصنيع شريحة متكاملة لحوسبة الذاكرة.
بادئ ذي بدء ، فيما يتعلق باختيار الجهاز ، فإن المصنِّعين "يسيرون على الجليد الرقيق": يحدد تصميم الذاكرة معدل إنتاج الرقاقة ، وبمجرد أن يكون الاتجاه خاطئًا ، قد لا يتم إنتاج الرقاقة بكميات كبيرة.
والثاني هو مستوى تصميم الدائرة. بعد أن يكون الجهاز متاحًا على مستوى الدائرة ، يجب استخدامه لتصميم دائرة صفيف التخزين. في الوقت الحالي ، في تصميم الدوائر ، لا توجد إرشادات أداة EDA للحساب في الذاكرة ، ويجب أن يتم ذلك يدويًا ، مما يزيد بلا شك من صعوبة التشغيل بشكل كبير.
بعد ذلك مباشرة ، بعد وجود دوائر على المستوى المعماري ، من الضروري تصميم الطبقة المعمارية. كل دائرة هي وحدة حوسبة أساسية ، وتتكون البنية بأكملها من وحدات مختلفة ، ويحدد تصميم الوحدة المتكاملة لحوسبة الذاكرة نسبة كفاءة الطاقة للرقاقة. سوف تتأثر الدوائر التناظرية بالضوضاء ، وستواجه الرقائق العديد من المشكلات عندما تتأثر بالضوضاء.
في هذه الحالة ، يُطلب من المهندسين المعماريين للرقائق الفهم الكامل لخصائص عملية الحوسبة التناظرية في الذاكرة ، وفي نفس الوقت تصميم البنية وفقًا لهذه الخصائص. وعلى هذا الأساس ، يجب أيضًا مراعاة القدرة على التكيف بين الهندسة المعمارية وتطوير البرامج . بعد اكتمال التصميم المعماري على مستوى البرنامج ، يجب تطوير سلسلة الأدوات المقابلة.
(مصدر الصورة: "تقرير صناعة رقائق طاقة الحوسبة الكبرى للذكاء الاصطناعي - مئات البوارج ، المبتكرون أولاً" بقلم Cirui Insights)
نظرًا لأن النموذج الأصلي لتكامل حوسبة التخزين يختلف عن النموذج الموجود في البنية التقليدية ، يحتاج المحول البرمجي إلى التكيف مع بنية تكامل حوسبة تخزين مختلفة تمامًا لضمان إمكانية ربط جميع وحدات الحوسبة بالأجهزة وتشغيلها بسلاسة.
ستختبر سلسلة تقنية كاملة قدرة كل رابط من الأجهزة ، وتصميم الدائرة ، وتصميم العمارة ، وسلسلة الأدوات ، وتطوير طبقة البرامج ، وتنسيق قدرة التكيف لكل رابط.إنها معركة طويلة الأمد تستهلك الوقت والجهد والمال.
في الوقت نفسه ، وفقًا لعملية تشغيل الروابط أعلاه ، يمكن ملاحظة أن الشريحة المتكاملة لحوسبة الذاكرة بحاجة ماسة إلى مصممي الدوائر ومهندسي الشرائح ذوي الخبرة.
في ضوء خصوصية تكامل التخزين والحساب ، يجب أن تتمتع الشركات التي يمكنها دمج التخزين والحساب بالخاصيتين التاليتين من حيث احتياطي الموظفين:
القائد يحتاج إلى ما يكفي من الشجاعة. يجب أن تكون هناك فكرة واضحة في اختيار اختيار الجهاز (RRAM ، SRAM ، إلخ) ووضع الحوسبة (تقليدي von Neumann ، التخزين المتكامل والحوسبة ، إلخ). هذا لأنه ، كتقنية تخريبية ومبتكرة ، لا يوجد أحد يقود تكامل التخزين والحساب ، كما أن تكلفة التجربة والخطأ مرتفعة للغاية. غالبًا ما يتمتع مؤسسو الشركات التي يمكنها تحقيق التسويق بخبرة غنية في الصناعة وكبار المصنعين والخلفيات الأكاديمية ، ويمكنهم قيادة الفريق لإكمال عمليات تكرار المنتجات بسرعة.
في الفريق الأساسي ، من الضروري تجهيز المواهب ذات الخبرة في جميع مستويات التكنولوجيا. على سبيل المثال ، المهندس المعماري الذي هو جوهر الفريق. يحتاج المهندسون المعماريون إلى فهم عميق وإدراك لأدوات الأجهزة والبرامج الأساسية ، وأن يكونوا قادرين على إدراك بنية التخزين والحوسبة في المفهوم من خلال التكنولوجيا ، وأخيراً تحقيق هبوط المنتج ؛
بالإضافة إلى ذلك ، وفقًا لتقرير qubit ، هناك نقص في المواهب المتطورة في تصميم الدوائر في الصين ، خاصة في مجال الدوائر الهجينة. تتضمن الحوسبة في الذاكرة عددًا كبيرًا من تصميمات الدوائر التناظرية. وبالمقارنة مع تصميم الدوائر الرقمية الذي يركز على العمل الجماعي ، فإن تصميم الدوائر التناظرية يتطلب مصممين فرديين على دراية كبيرة بالعملية والتصميم والتخطيط ونموذج PDK والتعبئة والتغليف.
وهذه السلسلة من المواهب والتقنيات يجب أن تأخذ تأثير الهبوط كهدف نهائي - الهبوط هو القوة الإنتاجية الأساسية. في وقت التسليم ، ما يعتبره العملاء ليس فقط التكنولوجيا المتكاملة لحوسبة التخزين ، ولكن ما إذا كانت مؤشرات الأداء الخاصة بحوسبة التخزين المدمجة ، مثل نسبة كفاءة الطاقة ، ونسبة كفاءة المنطقة ، وقابلية الاستخدام ، قد تم تحسينها بشكل كافٍ مقارنة مع المنتجات السابقة ، والأهم من ذلك ، ما إذا كانت تكاليف الترحيل معقولة.
إذا كان اختيار شريحة جديدة لتحسين أداء الخوارزمية يتطلب إعادة تعلم نظام البرمجة ، وكانت تكلفة العمالة لترحيل النموذج أعلى من تكلفة شراء وحدة معالجة الرسومات الجديدة ، فمن المرجح ألا يختار العملاء استخدام شريحة جديدة.
لذلك ، ما إذا كان تكامل التخزين والحوسبة يمكن أن يقلل من تكلفة الترحيل أثناء عملية الهبوط هو عامل رئيسي للعملاء عند اختيار المنتجات.
في سياق النماذج واسعة النطاق ، أصبحت الرقاقة المتكاملة لحوسبة الذاكرة نجمة صاعدة في مسار الرقائق بفضل استهلاكها المنخفض للطاقة ولكن نسبة كفاءة الطاقة العالية. في الوقت الحاضر ، لا يزال سوق الإيداع والحساب المتكامل في مرحلة "Xiaohe آخذ في الظهور للتو".
لكن لا يمكننا إنكار أن مشغلي التخزين والحساب المدمجين قد قاموا بالفعل ببناء ثلاثة جدران عالية ، ولا ينبغي لمن يتمتعون بقوة فنية قوية واحتياطيات قوية من المواهب أن يدخلوا.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
في عام 2023 ، طُلب من شركات شرائح الذكاء الاصطناعي ثلاث مرات
في عام 2023 ، تطرح المؤسسات الاستثمارية والمساهمون على الشركات المدرجة في مجال رقائق الذكاء الاصطناعي ثلاثة أسئلة قاتلة:
هل صنعت شريحة متكاملة للتخزين والحساب حتى الآن؟
(مصدر المستثمرين الذين يطرحون أسئلة على Montage Technology: Tonghuashun Finance)
كيف يتم التقدم في الشريحة المتكاملة لحوسبة الذاكرة؟
(يسأل المستثمرون أسهم Dongxin مصدر السؤال: Tonghuashun Finance)
ما هو احتمال التخزين المتكامل ورقائق الحوسبة؟
(مصدر أسئلة المستثمرين لأسهم Hengshuo: Tonghuashun Finance)
تعني سلسلة الأسئلة أعلاه أن دمج التخزين والحساب لم يعد "يبقى" في الأوساط الأكاديمية والصناعية ، ويبدو أنه شائع في السوق الثانوية: يعمل المساهمون ومؤسسات الوساطة لوقت إضافي لتعويض تكامل التخزين والحساب ، لذا فإن مصنعي الرقائق التقليديين منذ بداية عام 2023 ، تعرض تخطيط تكامل التخزين والحوسبة "للضرر".
السؤال الطبيعي هو لماذا أصبح تكامل الإيداع والحساب فجأة شائعًا جدًا؟
أعطت Huawei ، التي أصدرت منتج التخزين الجديد OceanStor A310 في 7.14 ، إجابتها الخاصة. قال Zhou Yuefeng ، رئيس خط إنتاج تخزين البيانات في Huawei ، إن هناك العديد من مشاكل البيانات في التدريب والتفكير في النماذج الكبيرة للأغراض العامة والنماذج الصناعية الكبيرة: الجمع البطيء عبر المجالات للبيانات الضخمة ، وانخفاض كفاءة تفاعل البيانات في المعالجة المسبقة و التدريب ، وصعوبة أمن تدفق البيانات.
يجلب نموذج الذكاء الاصطناعي الكبير تحديات جديدة للتخزين. على سبيل المثال ، الاستقرار أسوأ من استقرار الذكاء الاصطناعي التقليدي. وفي الوقت نفسه ، هناك قدر كبير من المعالجة المسبقة للبيانات وأعمال التحضير ، والتي تتطلب حوسبة قريبة من التخزين (نوع من التخزين والحساب) للتعامل بشكل منهجي مع هذه المشكلة.
إذن ، ما مقدار "كمية البيانات الكبيرة" هنا؟ وفقًا لحسابات SI Rui Insight ، فإن ChatGPT لديها حاليًا 100 مليون مستخدم يوميًا.إذا طرح 5 ٪ من الأشخاص أسئلة كل ثانية في نفس الوقت كل يوم ، فسوف يلتهم توليد الطاقة لسد الخوانق الثلاثة لمدة عام تقريبًا.
بعبارة أخرى ، تتطلب النماذج الكبيرة بشكل محموم قوة الحوسبة ، ويمكن للحلول الناشئة المتمثلة في تكامل التخزين والحوسبة أن تحل العديد من التحديات التي تسببها النماذج الكبيرة. في الواقع ، بالإضافة إلى فرض متطلبات صارمة على قوة الحوسبة ، يمنح النموذج الكبير أيضًا مصنعي شرائح الذكاء الاصطناعي "الكثير من السكر لتناوله".
تحاول هذه المقالة استكشاف ، في ظل خلفية النموذج الكبير ، ما هي الفوائد التي تُعطى لمصنعي شرائح الذكاء الاصطناعي؟ ما هو النمط المستقبلي للمصنعين المتكاملين للتخزين والحوسبة التي تم "إطلاقها" بواسطة ChatGPT؟
** PART-01 "الثروة والمحن يعتمدان على بعضهما البعض" الشركات المصنعة لشرائح الذكاء الاصطناعي **
لا تزال رياح نموذج بالحجم الطبيعي تهب ، ولا يزال النقاش حول النموذج على قدم وساق.
في بداية شهر أغسطس ، في المنتدى الفرعي لمؤتمر الذكاء الاصطناعي لاتحاد الكمبيوتر الصيني (CCF) - "رؤية حدود قوة الحوسبة النموذجية واسعة النطاق للذكاء الاصطناعي في كونلون" ، اتفق الخبراء والعلماء على أنه في عصر النطاق الواسع النماذج ، أصبحت قوة الحوسبة الذكية "أصلًا نادرًا". ، أصبحت كيفية الاستفادة الجيدة من موارد الحوسبة وتعظيم فوائدها تحديًا يجب على كل مشارك مواجهته.
بالنسبة لمقدار قوة الحوسبة التي تتطلبها GPT-3 وحدها ، في ظل الظروف المحافظة ، يحتاج سد الخوانق الثلاثة إلى "العمل" طوال الليل للوفاء بما يلي:
بافتراض وجود 100 مليون شخص عبر الإنترنت في نفس الوقت ، يطرح 5٪ منهم أسئلة كل ثانية في نفس الوقت كل يوم ، كل منها يشغل 30 رمزًا ، و 15.3 مليون شريحة H100 مطلوبة لتوفير قوة الحوسبة الاستدلالية ؛ والقوة استهلاك كل H100 هو 750 واط ، إذا تم تشغيله لمدة 10 ساعات في اليوم ، فإن استهلاك الطاقة السنوي لمركز البيانات حيث توجد شرائح H100 هذه سيصل إلى 84 مليار كيلو واط * ساعة ، في حين أن توليد الطاقة السنوي لسد الخوانق الثلاثة هو 88.2 مليار كيلوواط * ساعة.
ما يجعل مصنعي شرائح الذكاء الاصطناعي أكثر قلقًا هو أن هذا ليس سوى استهلاك الطاقة لنموذج ChatGPT كبير في مرحلة الاستدلال.
نتيجة لذلك ، تم اكتشاف سلسلة من الحلول الناشئة من قبل الشركات المصنعة: التخزين المتكامل والحوسبة ، و chiplets ، و HBM ، وما إلى ذلك. من بينها ، نظرًا لأن دمج التخزين والحوسبة قد أطاح بجدار التخزين في ظل بنية von Neumann التقليدية ، فقد حقق بالفعل خفض التكلفة وتحسين الكفاءة ، ليصبح Ziweixing هذا العام.
(مصدر الصورة: "تقرير صناعة رقائق طاقة الحوسبة الكبرى لمنظمة العفو الدولية - مئات البوارج ، المبتكرون أولاً" بقلم Cirui Insights)
بالإضافة إلى ظهور الحلول الناشئة التي منحت مصنعي شرائح الذكاء الاصطناعي الصعداء ، فإن النموذج الكبير يجلب أيضًا أخبارًا جيدة لمصنعي الرقائق ، وخاصة الشركات المصنعة للرقائق المبتدئة: تتراجع أهمية بيئة البرمجيات.
عندما لم تكن التكنولوجيا ناضجة بما يكفي في الأيام الأولى ، كان بإمكان الباحثين البدء فقط من خلال حل مشكلة معينة ، وولدت نماذج صغيرة بأقل من مليون متغير. على سبيل المثال ، DeepMind ، وهي شركة ذكاء اصطناعي مملوكة لشركة Google ، تسمح لـ AlphaGO بإجراء "تعليم" خاص على خطوات لعب الشطرنج لملايين اللاعبين المحترفين من البشر.
بعد وجود المزيد من الطرز الصغيرة ، تصبح مشكلة الأجهزة مثل تكيف الرقاقة وشيكة. لذلك ، عندما أطلقت Nvidia نظام CUDA البيئي الموحد ، فازت GPU + CUDA بسرعة باعتراف مجتمع علوم الكمبيوتر وأصبحت التكوين القياسي لتطوير الذكاء الاصطناعي.
تتمتع النماذج الكبيرة التي تظهر واحدة تلو الأخرى اليوم بقدرات متعددة الوسائط ، ويمكنها التعامل مع النصوص والصور والبرمجة وغيرها من المشكلات ، ويمكنها أيضًا تغطية مجالات رأسية متعددة مثل المكتب والتعليم والرعاية الطبية. هذا يعني أيضًا أن التكيف مع البيئة السائدة ليس هو الخيار الوحيد: عندما يرتفع الطلب على الرقائق للنماذج الكبيرة ، قد تتمكن الشركات المصنعة للرقائق من إكمال الطلبات لنماذج صغيرة متعددة في الماضي من خلال التكيف فقط مع نموذج واحد أو نموذجين كبيرين .
بمعنى آخر ، يوفر ظهور ChatGPT للشركات المصنعة للرقائق المبتدئة فرصة للتغلب على الزوايا. هذا يعني أن هيكل سوق شرائح الذكاء الاصطناعي سيخضع لتغييرات هائلة: لن يكون عرضًا فرديًا للمصنعين الفرديين ، بل لعب جماعي للعديد من المبتكرين.
عندما تصبح قوة الحوسبة سلعة نادرة ولم يعد التكيف مع البيئة السائدة أمرًا ضروريًا ، فإن تكامل التخزين والحوسبة بالكاد يمكن أن يخفي ضوءها. في هذا الوقت ، أصبح الاستثمار ومقدار الاستثمار هو المشكلة الثانية التي تواجه مصنعي شرائح الذكاء الاصطناعي.
في هذا الصدد ، فإن الإجابة التي قدمتها شركة NVIDIA العملاقة للرقاقات "ذات الخبرة" لسنوات عديدة هي أن تكون شجاعًا في الابتكار وأن تستثمر بكثافة:
لا شك أن كل شركة مصنعة للبحث والتطوير لتقنية ناشئة ستواجه مشكلات على مستويات مختلفة مثل عقبات الاستكشاف التقني وخلاف الشركات المصنعة للمصب. في المرحلة المبكرة ، أياً كان من يتوقع اتجاه التنمية المستقبلي أولاً ، يأخذ الشجاعة لاتخاذ خطوات الاستكشاف ، ويضع موارد معقولة للمحاولة ، فإنه يغتنم الفرصة.
عندما لم تصل موجة مراكز البيانات بشكل كبير بعد ، ولا يزال تدريب الذكاء الاصطناعي مجالًا متخصصًا ، استثمرت Nvidia بكثافة في تطوير وحدات معالجة الرسومات (GPU) للحوسبة العامة للأغراض العامة وبرامج البرمجة الموحدة CUDA ، وهي وظيفة جيدة لشركة Nvidia- منصات الحوسبة.
في ذلك الوقت ، كان جعل وحدة معالجة الرسومات قابلة للبرمجة "عديم الفائدة وخسارة": لا أعرف ما إذا كان يمكن مضاعفة أدائها ، ولكن تطوير المنتج سيتضاعف. لهذا السبب ، لا يوجد عميل على استعداد لدفع ثمنها. ومع ذلك ، قررت Nvidia ، التي توقعت أن معالج الرسومات أحادي الوظيفة ليس حلاً طويل الأمد ، تطبيق CUDA على جميع خطوط الإنتاج.
في مقابلة بين Xindongxi والدكتور Lai Junjie ، المدير الأول للهندسة والحلول في Nvidia China ، قال Lai Junjie: "من أجل رؤية منصة الحوسبة ، حشد Huang Renxun بسرعة الكثير من الموارد من Nvidia صعودًا وهبوطًا في وقت مبكر أيام."
Foresight + استثمار ضخم ، في عام 2012 ، فازت Nvidia بجائزة المبتكر: في عام 2012 ، تسبب أداء الحوسبة لخوارزمية التعلم العميق في إحداث ضجة كبيرة في الدائرة الأكاديمية. كأداة إنتاجية عالية الحوسبة وأكثر تنوعًا وسهولة في الاستخدام ، أصبحت GPU + CUDA شائعة بسرعة أصبح مجتمع علوم الكمبيوتر "التكوين القياسي" لتطوير الذكاء الاصطناعي.
في رحلة رقائق الذكاء الاصطناعي التي تتمتع بقوة حوسبة كبيرة ، أدخل التخزين المتكامل ورقائق الحوسبة "حقبة ذهبية" خاصة بهم ، والاستثمار مقدمًا هو الإجابة الصحيحة.
** PART-02 غير تقني ، غني ماليًا ، لا تدخل **
بالنظر إلى الفوائد المختلفة لدمج التخزين والحوسبة ، في هذه المرحلة ، ينمو معسكر اللاعبين الذين يدمجون رقائق الحوسبة والتخزين.
(مصدر الصورة: "تقرير صناعة رقائق طاقة الحوسبة الكبرى لمنظمة العفو الدولية - مئات البوارج ، المبتكرون أولاً" بقلم Cirui Insights)
وفقًا للإحصاءات غير المكتملة لـ CIRUI Insight ، منذ عام 2019 ، قامت معظم الشركات المصنعة لرقائق الذكاء الاصطناعي الجديدة بدمج التخزين والحوسبة: هناك 20 مصنعًا جديدًا لرقائق الذكاء الاصطناعي في 2019-2021 ، و 10 منهم اختاروا مسار تكامل الإيداع والحساب.
كل هذا يوضح أن تكامل التخزين والحوسبة سيصبح نجمًا صاعدًا بعد GPGPU و ASIC والبنى الأخرى. وهذا النجم الجديد ، لا يستطيع الجميع اختياره.
في ظل الظروف التي تكون فيها الأوساط الأكاديمية والصناعية ورأس المال متفائلة بالإجماع بشأن تكامل التخزين والحوسبة ، فإن القوة التقنية القوية واحتياطيات المواهب القوية والتحكم الدقيق في قبول تكاليف الهجرة هي المفتاح للحفاظ على القدرة التنافسية في الصناعة للبدء- حتى الشركات ، ثلاثة حواجز للاعبين الجدد.
القوة التقنية القوية هي دائمًا أعلى جبل في مجال الرقائق.
الأول هو تكامل التخزين والحوسبة ، والذي يتضمن العملية الكاملة لتصنيع الرقائق: من الجهاز الأدنى ، إلى تصميم الدوائر ، والتصميم المعماري ، وسلسلة الأدوات ، ثم إلى البحث والتطوير لطبقة البرنامج ؛ الجسم بالكامل ": أثناء إجراء التغييرات المقابلة في كل طبقة ، يجب أيضًا مراعاة درجة التكيف بين كل طبقة.
دعونا نلقي نظرة عليها طبقة تلو الأخرى ، ما نوع المشاكل التقنية الموجودة عند تصنيع شريحة متكاملة لحوسبة الذاكرة.
بادئ ذي بدء ، فيما يتعلق باختيار الجهاز ، فإن المصنِّعين "يسيرون على الجليد الرقيق": يحدد تصميم الذاكرة معدل إنتاج الرقاقة ، وبمجرد أن يكون الاتجاه خاطئًا ، قد لا يتم إنتاج الرقاقة بكميات كبيرة.
والثاني هو مستوى تصميم الدائرة. بعد أن يكون الجهاز متاحًا على مستوى الدائرة ، يجب استخدامه لتصميم دائرة صفيف التخزين. في الوقت الحالي ، في تصميم الدوائر ، لا توجد إرشادات أداة EDA للحساب في الذاكرة ، ويجب أن يتم ذلك يدويًا ، مما يزيد بلا شك من صعوبة التشغيل بشكل كبير.
بعد ذلك مباشرة ، بعد وجود دوائر على المستوى المعماري ، من الضروري تصميم الطبقة المعمارية. كل دائرة هي وحدة حوسبة أساسية ، وتتكون البنية بأكملها من وحدات مختلفة ، ويحدد تصميم الوحدة المتكاملة لحوسبة الذاكرة نسبة كفاءة الطاقة للرقاقة. سوف تتأثر الدوائر التناظرية بالضوضاء ، وستواجه الرقائق العديد من المشكلات عندما تتأثر بالضوضاء.
في هذه الحالة ، يُطلب من المهندسين المعماريين للرقائق الفهم الكامل لخصائص عملية الحوسبة التناظرية في الذاكرة ، وفي نفس الوقت تصميم البنية وفقًا لهذه الخصائص. وعلى هذا الأساس ، يجب أيضًا مراعاة القدرة على التكيف بين الهندسة المعمارية وتطوير البرامج . بعد اكتمال التصميم المعماري على مستوى البرنامج ، يجب تطوير سلسلة الأدوات المقابلة.
(مصدر الصورة: "تقرير صناعة رقائق طاقة الحوسبة الكبرى للذكاء الاصطناعي - مئات البوارج ، المبتكرون أولاً" بقلم Cirui Insights)
نظرًا لأن النموذج الأصلي لتكامل حوسبة التخزين يختلف عن النموذج الموجود في البنية التقليدية ، يحتاج المحول البرمجي إلى التكيف مع بنية تكامل حوسبة تخزين مختلفة تمامًا لضمان إمكانية ربط جميع وحدات الحوسبة بالأجهزة وتشغيلها بسلاسة.
ستختبر سلسلة تقنية كاملة قدرة كل رابط من الأجهزة ، وتصميم الدائرة ، وتصميم العمارة ، وسلسلة الأدوات ، وتطوير طبقة البرامج ، وتنسيق قدرة التكيف لكل رابط.إنها معركة طويلة الأمد تستهلك الوقت والجهد والمال.
في الوقت نفسه ، وفقًا لعملية تشغيل الروابط أعلاه ، يمكن ملاحظة أن الشريحة المتكاملة لحوسبة الذاكرة بحاجة ماسة إلى مصممي الدوائر ومهندسي الشرائح ذوي الخبرة.
في ضوء خصوصية تكامل التخزين والحساب ، يجب أن تتمتع الشركات التي يمكنها دمج التخزين والحساب بالخاصيتين التاليتين من حيث احتياطي الموظفين:
القائد يحتاج إلى ما يكفي من الشجاعة. يجب أن تكون هناك فكرة واضحة في اختيار اختيار الجهاز (RRAM ، SRAM ، إلخ) ووضع الحوسبة (تقليدي von Neumann ، التخزين المتكامل والحوسبة ، إلخ). هذا لأنه ، كتقنية تخريبية ومبتكرة ، لا يوجد أحد يقود تكامل التخزين والحساب ، كما أن تكلفة التجربة والخطأ مرتفعة للغاية. غالبًا ما يتمتع مؤسسو الشركات التي يمكنها تحقيق التسويق بخبرة غنية في الصناعة وكبار المصنعين والخلفيات الأكاديمية ، ويمكنهم قيادة الفريق لإكمال عمليات تكرار المنتجات بسرعة.
في الفريق الأساسي ، من الضروري تجهيز المواهب ذات الخبرة في جميع مستويات التكنولوجيا. على سبيل المثال ، المهندس المعماري الذي هو جوهر الفريق. يحتاج المهندسون المعماريون إلى فهم عميق وإدراك لأدوات الأجهزة والبرامج الأساسية ، وأن يكونوا قادرين على إدراك بنية التخزين والحوسبة في المفهوم من خلال التكنولوجيا ، وأخيراً تحقيق هبوط المنتج ؛
بالإضافة إلى ذلك ، وفقًا لتقرير qubit ، هناك نقص في المواهب المتطورة في تصميم الدوائر في الصين ، خاصة في مجال الدوائر الهجينة. تتضمن الحوسبة في الذاكرة عددًا كبيرًا من تصميمات الدوائر التناظرية. وبالمقارنة مع تصميم الدوائر الرقمية الذي يركز على العمل الجماعي ، فإن تصميم الدوائر التناظرية يتطلب مصممين فرديين على دراية كبيرة بالعملية والتصميم والتخطيط ونموذج PDK والتعبئة والتغليف.
وهذه السلسلة من المواهب والتقنيات يجب أن تأخذ تأثير الهبوط كهدف نهائي - الهبوط هو القوة الإنتاجية الأساسية. في وقت التسليم ، ما يعتبره العملاء ليس فقط التكنولوجيا المتكاملة لحوسبة التخزين ، ولكن ما إذا كانت مؤشرات الأداء الخاصة بحوسبة التخزين المدمجة ، مثل نسبة كفاءة الطاقة ، ونسبة كفاءة المنطقة ، وقابلية الاستخدام ، قد تم تحسينها بشكل كافٍ مقارنة مع المنتجات السابقة ، والأهم من ذلك ، ما إذا كانت تكاليف الترحيل معقولة.
إذا كان اختيار شريحة جديدة لتحسين أداء الخوارزمية يتطلب إعادة تعلم نظام البرمجة ، وكانت تكلفة العمالة لترحيل النموذج أعلى من تكلفة شراء وحدة معالجة الرسومات الجديدة ، فمن المرجح ألا يختار العملاء استخدام شريحة جديدة.
لذلك ، ما إذا كان تكامل التخزين والحوسبة يمكن أن يقلل من تكلفة الترحيل أثناء عملية الهبوط هو عامل رئيسي للعملاء عند اختيار المنتجات.
في سياق النماذج واسعة النطاق ، أصبحت الرقاقة المتكاملة لحوسبة الذاكرة نجمة صاعدة في مسار الرقائق بفضل استهلاكها المنخفض للطاقة ولكن نسبة كفاءة الطاقة العالية. في الوقت الحاضر ، لا يزال سوق الإيداع والحساب المتكامل في مرحلة "Xiaohe آخذ في الظهور للتو".
لكن لا يمكننا إنكار أن مشغلي التخزين والحساب المدمجين قد قاموا بالفعل ببناء ثلاثة جدران عالية ، ولا ينبغي لمن يتمتعون بقوة فنية قوية واحتياطيات قوية من المواهب أن يدخلوا.