В 2023 году компании-производители чипов ИИ трижды спрашивают

2023-08-12 05:48:42

В 2023 году инвестиционные институты и акционеры задают зарегистрированным на бирже компаниям в области чипов ИИ три смертельных вопроса:

Вы уже сделали интегрированный чип для хранения и вычислений?

(Источник инвесторов, задающих вопросы Montage Technology: Tonghuashun Finance)

Как обстоят дела с интегрированным чипом для вычислений с памятью?

(Инвесторы спрашивают акции Dongxin, источник вопроса: Tonghuashun Finance)

Каковы перспективы интегрированных запоминающих и вычислительных чипов?

(Источник вопросов инвесторов к акциям Hengshuo: Tonghuashun Finance)

Приведенная выше серия вопросов означает, что интеграция хранения и вычислений больше не «остается» в академических и промышленных кругах и, похоже, популярна на вторичном рынке: акционеры и брокерские учреждения работают сверхурочно, чтобы компенсировать интеграцию хранения и вычислений, поэтому традиционные производители чипов с начала 2023 года «замучили» схему интеграции хранения и вычислений.

Возникает закономерный вопрос: почему интеграция депозита и расчета вдруг стала такой популярной?

Huawei, выпустившая новый продукт для хранения данных OceanStor A310 7.14, дала свой ответ. Чжоу Юефэн, президент линейки продуктов Huawei для хранения данных, сказал, что существует много проблем с данными при обучении и анализе больших моделей общего назначения и крупных отраслевых моделей: медленный междоменный сбор массивных данных, низкая эффективность взаимодействия данных при предварительной обработке и обучение и сложная защита потока данных.

Модель большого ИИ ставит перед хранилищем новые задачи: например, стабильность хуже, чем у традиционного ИИ, в то же время возникает большой объем работы по предварительной обработке и подготовке данных, что требует вычислений вблизи хранилища (разновидность хранение и расчет) для систематического решения этой проблемы.

Итак, при чем здесь «большой объем данных»? По подсчетам SI Rui Insight, ChatGPT в настоящее время имеет 100 миллионов пользователей в день.Если 5% людей будут задавать вопросы каждую секунду в одно и то же время каждый день, это поглотит электроэнергию плотины «Три ущелья» почти на год.

Другими словами, большие модели очень требовательны к вычислительной мощности, и появляющиеся решения, представленные интеграцией хранения и вычислений, могут решить многие проблемы, связанные с большими моделями. Фактически, в дополнение к строгим требованиям к вычислительной мощности, большая модель также дает производителям чипов ИИ «много сладкого».

В этой статье делается попытка исследовать на фоне большой модели, какие преимущества предоставляются производителям чипов ИИ? Какова будущая модель производителей интегрированных систем хранения и вычислений, которые были «уволены» ChatGPT?

ЧАСТЬ-01 "Удача и несчастье зависят друг от друга" производители чипов ИИ

Ветер макета все еще дует, и обсуждение макета все еще в самом разгаре.

В начале августа на подфоруме конференции по искусственному интеллекту Китайской компьютерной федерации (CCF) «Видя границы вычислительной мощности крупномасштабных моделей ИИ Куньлунь» эксперты и ученые сошлись во мнении, что в эпоху крупномасштабных моделей, интеллектуальная вычислительная мощность стала «дефицитным активом». Как правильно использовать вычислительные ресурсы и максимизировать их преимущества, стало проблемой, с которой должен столкнуться каждый участник.

Что касается количества вычислительной мощности, требуемой только для GPT-3, при консервативных обстоятельствах плотина «Три ущелья» должна «работать» всю ночь, чтобы удовлетворить:

Если предположить, что в сети одновременно находятся 100 миллионов человек, 5% из них задают вопросы каждую секунду в одно и то же время каждый день, каждый из которых занимает 30 токенов, а для обеспечения вычислительной мощности логического вывода требуется 15,3 миллиона чипов H100; потребление каждого H100 составляет 750 Вт. О, если он работает по 10 часов в день, годовое энергопотребление центра обработки данных, где расположены эти чипы H100, достигнет 84 млрд. кВтч, а годовая выработка электроэнергии плотины «Три ущелья» составляет 88,2 млрд кВтч.

Что еще больше беспокоит производителей микросхем ИИ, так это то, что это всего лишь энергопотребление большой модели ChatGPT на этапе вывода.

В результате производителями был обнаружен ряд новых решений: интегрированные системы хранения и вычислений, чиплеты, HBM и так далее. Среди них, поскольку интеграция хранения и вычислений разрушила стену хранения в традиционной архитектуре фон Неймана, она фактически добилась снижения затрат и повышения эффективности, став в этом году «Ziweixing».

(Источник фото: «Отчет об индустрии микросхем AI Big Computing Power — сотни линкоров, прежде всего инноваторы», Cirui Insights)

В дополнение к появлению новых решений, которые дали производителям микросхем ИИ передышку, большая модель также приносит хорошие новости производителям микросхем, особенно начинающим производителям микросхем: важность экологии программного обеспечения снижается.

Когда технология не была достаточно зрелой в первые дни, исследователи могли начать только с решения конкретной проблемы, и родились небольшие модели с менее чем одним миллионом параметров. Например, DeepMind, компания искусственного интеллекта, принадлежащая Google, позволяет AlphaGO проводить специальное «обучение» на шахматных шагах миллионов профессиональных игроков.

После появления более мелких моделей проблема аппаратного обеспечения, такая как адаптация чипа, неизбежна. Поэтому, когда Nvidia запустила унифицированную экологическую CUDA, GPU+CUDA быстро завоевали признание компьютерного сообщества и стали стандартной конфигурацией для разработки искусственного интеллекта.

Большие модели, которые появляются сегодня одна за другой, обладают мультимодальными возможностями, могут обрабатывать текст, изображения, программирование и другие вопросы, а также могут охватывать несколько вертикальных областей, таких как офис, образование и медицинское обслуживание. Это также означает, что адаптация к основной экологии — не единственный вариант: когда спрос на чипы для больших моделей стремительно растет, производители чипов могут выполнять заказы на несколько небольших моделей в прошлом, адаптируясь только к 1-2 крупным моделям. .

Другими словами, появление ChatGPT дает начинающим производителям чипов возможность обгонять на поворотах. Это означает, что структура рынка чипов ИИ претерпит огромные изменения: это будет уже не шоу одного человека, состоящее из отдельных производителей, а групповая игра нескольких новаторов.

Когда вычислительная мощность становится дефицитным товаром и адаптация к господствующей экологии больше не является обязательной, интеграция хранения и вычислений едва ли может скрыть свой свет. В настоящее время вопрос о том, стоит ли инвестировать и сколько инвестировать, стал второй проблемой, стоящей перед производителями ИИ-чипов.

В связи с этим ответ «опытного» чипового гиганта NVIDIA на протяжении многих лет заключается в том, чтобы быть смелым в инновациях и вкладывать значительные средства:

Каждый производитель НИОКР новой технологии, несомненно, столкнется с проблемами на различных уровнях, такими как препятствия для технических исследований и разногласия между производителями. На ранней стадии тот, кто первым предскажет будущую тенденцию развития, наберется смелости предпринять шаги по исследованию и заложит разумные ресурсы, чтобы попытаться, воспользуется возможностью.

Когда волна центров обработки данных еще не достигла подавляющего большинства, а обучение искусственному интеллекту все еще остается нишевой областью, Nvidia вложила значительные средства в разработку вычислительных графических процессоров общего назначения и унифицированного программного обеспечения для программирования CUDA, и это хорошая работа для Nvidia. вычислительные платформы.

В то время делать GPU программируемым было «бесполезно и убыточно»: я не знаю, можно ли удвоить его производительность, но разработка продукта будет удвоена. По этой причине ни один клиент не готов платить за это. Однако Nvidia, предсказавшая, что однофункциональный графический процессор не является долгосрочным решением, решила применить CUDA ко всем продуктовым линейкам.

В интервью между Xindongxi и доктором Лай Цзюньцзе, старшим директором по разработке и решениям Nvidia China, Лай Цзюньцзе сказал: «Для видения вычислительной платформы Хуан Ренсюнь быстро мобилизовал много ресурсов от Nvidia вверх и вниз в начале дней».

Предвидение + большие инвестиции, в 2012 году Nvidia получила награду новатора: в 2012 году вычислительная производительность алгоритма глубокого обучения произвела сенсацию в академических кругах.Как высокопроизводительный, более универсальный и простой в использовании инструмент повышения производительности, GPU+CUDA быстро стали популярными. Сообщество компьютерщиков стало «стандартной конфигурацией» для разработки искусственного интеллекта.

На пути чипов ИИ с большой вычислительной мощностью встроенные чипы для хранения данных и вычислительные чипы открыли свой собственный «золотой период», и авансовые инвестиции — правильный ответ.

PART-02 Нетехнические, финансово богатые, не входить

Видя различные преимущества интеграции хранения и вычислений, на данном этапе растет число игроков, интегрирующих микросхемы хранения и вычислений.

Согласно неполной статистике CIRUI Insight, с 2019 года большинство новых производителей ИИ-чипов интегрировали хранение и вычисления: в 2019-2021 годах появилось 20 новых производителей ИИ-чипов, и 10 из них выбрали путь интеграции депозита и вычислений.

Все это показывает, что интеграция хранения и вычислений станет восходящей звездой после GPGPU, ASIC и других архитектур. И эту новую звезду не каждый может подобрать.

В условиях, когда научные круги, промышленность и капитал единодушно настроены оптимистично в отношении интеграции хранения и вычислений, сильная техническая мощь, солидный резерв талантов и точный контроль над принятием затрат на миграцию являются ключом к поддержанию конкурентоспособности в отрасли на начальном этапе. вверх компании Три барьера для новых игроков.

Сильная техническая сила всегда является самой высокой горой в области чипов.

Во-первых, это интеграция хранения и вычислений, которая включает в себя весь процесс производства чипа: от самого нижнего устройства до проектирования схемы, проектирования архитектуры, цепочки инструментов, а затем до исследований и разработок уровня программного обеспечения; «Все тело»: При внесении соответствующих изменений в каждый уровень следует также учитывать степень адаптации между каждым уровнем.

Давайте рассмотрим его слой за слоем, какие технические проблемы возникают при изготовлении интегрированного чипа для вычислений с памятью.

Во-первых, с точки зрения выбора устройств производители «ходят по тонкому льду»: конструкция памяти определяет производительность чипа, и если направление неверное, чип может не выпускаться серийно.

Второй уровень — это уровень схемотехники. После того, как устройство доступно на уровне схемы, его необходимо использовать для проектирования схемы массива хранения. В настоящее время в схемотехнике отсутствует инструментальное средство ЭДА для расчета в памяти, и его необходимо выполнять вручную, что, несомненно, значительно увеличивает сложность работы.

Сразу после того, как есть схемы на архитектурном уровне, необходимо спроектировать архитектурный слой. Каждая схема представляет собой базовый вычислительный модуль, а вся архитектура состоит из различных модулей.Конструкция интегрированного модуля вычислений с памятью определяет коэффициент энергоэффективности чипа. Аналоговые схемы будут возмущены шумом, а чипы столкнутся со многими проблемами, когда на них воздействует шум.

В этом случае архитекторы микросхем должны полностью понимать характеристики процесса аналоговых вычислений в памяти и в то же время проектировать архитектуру в соответствии с этими характеристиками.На этой основе также необходимо учитывать адаптивность между архитектурой и разработкой программного обеспечения. . После завершения проектирования архитектуры на уровне программного обеспечения необходимо разработать соответствующую цепочку инструментов.

Поскольку первоначальная модель интеграции хранения и вычислений отличается от модели традиционной архитектуры, компилятору необходимо адаптироваться к совершенно другой архитектуре интеграции хранения и вычислений, чтобы гарантировать, что все вычислительные блоки могут быть сопоставлены с оборудованием и работать бесперебойно.

Полная техническая цепочка будет проверять способность каждого звена устройства, схемотехники, проектирования архитектуры, цепочки инструментов и разработки уровня программного обеспечения, а также координировать способность адаптации каждого звена Это затяжная битва, которая требует времени, усилий и денег.

В то же время, согласно процессу работы по вышеуказанным ссылкам, видно, что интегрированный чип для вычислений с памятью срочно нуждается в опытных схемотехниках и архитекторах микросхем.

Ввиду специфики интеграции хранения и расчета компаниям, которые могут интегрировать хранение и расчет, необходимо иметь следующие две характеристики с точки зрения кадрового резерва:

Лидеру нужно иметь достаточно мужества. Должно быть четкое представление о выборе устройства (RRAM, SRAM и т. д.) и режима вычислений (традиционное фон Неймана, интегрированное хранение и вычисление и т. д.). Это связано с тем, что, будучи подрывной и инновационной технологией, интеграцию хранения и вычислений некому вести, а цена проб и ошибок чрезвычайно высока. Основатели компаний, которые могут добиться коммерциализации, часто имеют богатый опыт работы в отрасли, крупные производители и академическое образование и могут руководить командой, чтобы быстро завершить итерации продукта.
В основной команде необходимо вооружить опытных талантов на всех уровнях технологии. Например, архитектор, который является ядром команды. Архитекторы должны иметь глубокое понимание и знание базовых аппаратных и программных инструментов, а также быть в состоянии реализовать архитектуру хранения и вычислений в концепции с помощью технологий и, наконец, добиться выпуска продукта;
Кроме того, согласно отчету о кубитах, в Китае не хватает высококлассных специалистов в области проектирования схем, особенно в области гибридных схем. Вычисления в памяти включают в себя большое количество проектов аналоговых схем.По сравнению с проектированием цифровых схем, которое делает упор на командную работу, проектирование аналоговых схем требует отдельных дизайнеров, которые хорошо знакомы с процессом, дизайном, компоновкой, макетом модели и компоновкой.

И этот ряд талантов и технологий должен рассматривать эффект приземления как конечную цель — приземление является основной производительной силой. Во время поставки клиенты обращают внимание не только на интегрированную технологию хранения и вычислений, но и на то, достаточно ли улучшены показатели производительности интегрированной системы хранения и вычислений, такие как коэффициент энергоэффективности, коэффициент полезного действия по площади и удобство использования. с предыдущими продуктами. , и, что более важно, доступны ли затраты на миграцию.

Если выбор нового чипа для улучшения производительности алгоритма требует переобучения системы программирования, а трудозатраты на миграцию модели выше, чем стоимость покупки нового графического процессора, то заказчики, скорее всего, не захотят использовать новый чип.

Поэтому то, может ли интеграция хранения и вычислений минимизировать затраты на миграцию в процессе посадки, является ключевым фактором для клиентов при выборе продуктов.

В контексте крупномасштабных моделей интегрированный чип для вычислений с памятью становится восходящей звездой на рынке чипов благодаря низкому энергопотреблению, но высокому коэффициенту энергоэффективности. В настоящее время интегрированный рынок депозитов и расчетов все еще находится в стадии «Сяохэ только зарождается».

Но мы не можем отрицать, что интегрированные игроки хранения и расчета уже построили три высокие стены, и те, у кого есть сильная техническая сила и солидный запас талантов, не должны входить.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

1 Лайков

Награда
1
комментарий
Репост
Поделиться

комментарий

0/400

Нет комментариев

Тема
#BTC Back To $120k
2k Популярность
#Show My Alpha Points
77k Популярность
#ETH Breaks $4,300
2k Популярность
#SOL Futures Reach New High
22k Популярность
#ETH ETF Sees 12 Weeks of Inflows
8k Популярность

Закрепить

Карта сайта