С момента появления chatGPT ИИ быстро развивался ежемесячно.С таким количеством моделей и быстрых итераций многие люди не могут не осознавать, что люди, кажется, действительно стоят на краю ворот ОИИ.
Недавно документ, раскрытый Ведомством США по патентам и товарным знакам (USPTO), показывает, что OpenAI подала заявку на регистрацию товарного знака для «GPT-5» 18 июля. и был принят.
Скриншот файла USPTO
Хотя в первой половине этого года различные эксперты и ученые в области ИИ много раз публиковали совместные открытые письма, призывая людей обратить внимание на потенциальные риски генеративного ИИ, и OpenAI также объявила в то время, что у нее не будет плана обучить ОПТ-5 в короткие сроки.
Однако искушение науки и техники, наконец, позволило людям выйти за границы табу.
В раскрытой на этот раз заявке OpenAI упомянула, что невыпущенный GPT-5 будет иметь много возможностей, которых нет у GPT-4, и почти каждый пункт относится к AGI.
Скриншот файла USPTO
Итак, что такое изменение означает для ИИ и людей?
Сегодня в этой статье будет предпринята попытка провести простой анализ возможных функций, изменений и влияния GPT-5 на основе ограниченной информации, раскрытой в документах приложения OpenAI.
01 Путь к AGI
В опубликованном на этот раз документе одним из первых изменений, упомянутых OpenAI, является улучшение мультимодальных функций.
В частности, функции GPT-5 включают перевод текста или речи с одного языка на другой, распознавание речи, генерацию текста и речи и многое другое.
Хотя в текущем GPT-4 пользователи также могут выполнять перевод между разными языками, но, поскольку здесь выделена функция перевода, она, должно быть, была повторно оптимизирована.
Почему OpenAI так много внимания уделяет переводческим возможностям GPT-5?
Это может быть связано с тем, что одной из предпосылок для того, чтобы GPT стала универсальной, является минимизация разрыва в затратах на использование больших моделей на разных языках.
Ранее результаты исследования Оксфордского университета показали, что из-за методов измерения стоимости серверов и методов выставления счетов, принятых такими сервисами, как OpenAI, стоимость ввода и вывода на английском языке намного ниже, чем на других языках.
Среди них стоимость упрощенного китайского примерно в два раза выше, чем английского, испанского в 1,5 раза больше, чем английского, а шанского языка в Мьянме в 15 раз больше, чем английского.
Поскольку такие языки, как китайский, имеют другую, более сложную структуру, они требуют более высокой степени лемматизации.
Например, согласно токенизатору OpenAI GPT3, токен для «вашей привязанности» требует только двух токенов на английском языке и восьми токенов на упрощенном китайском языке.
Это означает, что для языков, отличных от английского, использовать и обучать модели намного дороже.
И как только порог «языкового барьера» будет преодолен, этот универсальный барьер перед GPT, несомненно, будет преодолен напрямую.
Кроме того, заметная функция распознавания речи в документе кажется просто незаметным изменением, но в какой-то степени это еще одна часть OpenAI, прокладывающая GPT-5 на пути к кирпичику AGI.
Как мы все знаем, в будущем направлении развития больших моделей становится все более очевидной тенденция к тому, что модели становятся маргинализованными и терминальными.
Поскольку в июле этого года Qualcomm выпустила большую модель с 1 миллиардом параметров, которая может работать на мобильных телефонах, такие производители, как Honor и Apple, также объявили о выпуске собственных мобильных телефонов «большой модели».
Начиная с мобильных телефонов, данные ИИ в будущем будут все больше обрабатываться на стороне терминалов, таких как камеры, датчики и автономное вождение.
В таком сценарии применения распознавание речи, несомненно, более удобно и эффективно.
Например, языковая модель ИИ позволяет водителю управлять транспортным средством с помощью голоса. Преобразование голосовых команд водителя в исполняемые команды, такие как запуск, остановка, ускорение, торможение и другие операции.
Умные помощники, существующие в системе мобильных телефонов, такие как SIri, также будут отдавать приоритет управлению с помощью голосовых команд.
Видно, что распознавание речи — это не просто вишенка на торте, а «стандартная конфигурация», когда GPT-5 заходит на терминальную сторону.
И за счет утопления каждого терминального устройства GPT-5 также получит более маргинализированные и неязыковые структуры данных.
В конце концов, с момента разработки большой модели текстовые данные, которые могут быть поглощены, почти одинаковы.Если мы хотим сделать еще один шаг на пути к ОИИ, такие «нетекстовые» данные очень важны.
02 Вызов экспертной модели
В дополнение к вышеуказанным характеристикам в документе, представленном OpenAI, также упоминается: «GPT-5 также может иметь возможность изучать, анализировать, классифицировать данные и реагировать на них».
Судя по текущей тенденции развития искусственного интеллекта, это, вероятно, означает, что GPT-5 обладает способностью к активному обучению, аналогичной способности разумного тела.
И эта способность сделает GPT-5 принципиально отличным от предыдущих моделей, которые могут только пассивно изучать новые знания через ввод данных человеком.
В частности, способность к активному обучению означает, что модель может самостоятельно выбирать, собирать и обрабатывать данные в соответствии со своими целями и потребностями, а не полагаться исключительно на данные, предоставленные людьми.
Это позволяет модели более эффективно использовать информацию и знания, содержащиеся в данных, и более гибко адаптироваться к различным средам данных и сценариям задач, а не просто пассивно получать и выводить данные.
И такая способность особенно важна, когда GPT-5 сталкивается с какими-то относительно незнакомыми и вертикальными полями.
Некоторые специфические области, такие как медицина, юриспруденция, финансы и т. д., обычно имеют свои собственные специфические термины, правила и системы знаний, которые могут быть трудны для понимания и обработки для обычных языковых моделей.
Если GPT-5 имеет возможность активного обучения, он может автоматически собирать и обновлять соответствующие данные в этих областях из Интернета, анализировать и классифицировать основные понятия, важные принципы и последние разработки в этих областях, а также реагировать на общие проблемы в этих областях. , Типичные случаи и практические приложения.
Таким образом, GPT-5 может быстрее освоить экспертизу в этих областях и выполнять соответствующие задачи в этих областях более точно и эффективно.
И все это является ключом к настоящей общей модели.
Потому что если GPT всегда нужно подключать к определенной «экспертной модели» для решения профессиональных задач, то нельзя сказать, что она действительно «универсальна».
Потому что это приведет к различиям и зависимости ТШП от разведывательных возможностей разных областей и сценариев, а также увеличит затраты на связь и координацию между ТШП и «экспертной моделью» и не может гарантировать, что качественные услуги могут быть достигнуты при любых условиях. обстоятельства.
Ранее зарубежные СМИ Semianalysis раскрыли секреты GPT-4, выпущенного в марте этого года, разоблачив, что OpenAI использует смешанную экспертную модель для построения GPT-4.
Согласно новостям, GPT-4 использует 16 смешанных экспертных моделей (смесь экспертов), каждая со 111 миллиардами параметров, и каждый маршрут прямого прохода проходит через две экспертные модели.
Однако чем больше экспертных моделей, тем труднее обобщать и достигать конвергенции.
Это связано с тем, что у каждой экспертной модели есть свои параметры и стратегии, которые зачастую сложно согласовать, что затрудняет балансировку и «учет общей ситуации» GPT.
Получив возможность активного обучения, GPT-5 сможет использовать мультимодальные возможности понимания и рассуждений, а также карты знаний и базы данных для анализа и понимания полученных данных, а также с помощью алгоритмов кластеризации и классификаторов, связывания и обобщения связанных данных. .
Таким образом, GPT-5 может эффективно использовать информацию и знания в данных в соответствии с различными средами данных и сценариями задач.
03 заменить больше работы
Как упоминалось выше, после преодоления языкового барьера и выхода на терминальную сторону с удобной функцией распознавания речи, GPT-5 продолжит поглощать знания в различных сценариях, областях и режимах за счет непрерывных активных возможностей обучения, а затем двинется в сторону Пути к ОИИ. движется с большой скоростью.
Можно предвидеть, что, когда GPT-5 с такой сильной «универсальностью» начнет распространяться на различные области, за исключением нескольких отраслей с барьерами данных (таких как медицина), большие модели в большинстве вертикальных областей будут постепенно затмеваться.
Потому что в конечном счете довольно много экспертов или вертикальных крупномасштабных моделей по сути являются продуктами некоторых предприятий с недостаточными вычислительными мощностями и данными, неспособными подняться по «общей крупномасштабной модели» и вынуждены довольствоваться следующим лучшим (особенно это заметно в Китае).
Если крупная модель общего назначения может быть эффективной в большинстве отраслей благодаря своей способности к обучению, то кто захочет утомительно переключаться между разными моделями и нести многочисленные затраты на обучение и использование разных моделей?
С этой точки зрения экспертная модель постепенно заменяется общей моделью, что является неизбежным историческим процессом для человека на пути к ОИИ.
Другое явление, которое сопровождает это, заключается в том, что более мелкие и тривиальные задачи заменяются.
Потому что с более мощной общей моделью люди обнаружат, что на самом деле содержание работы многих должностей может быть объединено и интегрировано.
Один из возможных примеров — менеджеры по продуктам и аналитики данных.
Например, в проекте разработки нового продукта GPT-5 может искать в Интернете соответствующие исследования рынка, анализ конкурентного продукта, портреты пользователей и другие данные в соответствии с заданной концепцией продукта или спросом и загружать их в свою память.
После этого он будет анализировать и понимать полученные данные с помощью собственного мультимодального понимания и возможностей логического мышления, а также графов знаний и баз данных.
После получения соответствующих данных, их классификации и организации GPT-5 изучит соответствующие маркетинговые стратегии, отзывы пользователей и другую информацию из обратной связи диалоговой системы через способность понимания языка и сравнит ее с заданными концепциями продукта или потребностями. и оценил.
Таким образом, две должности продакт-менеджера и аналитика данных эффективно «объединяются».
На незаконченном пути к ОИИ есть бесчисленное множество работ, которые объединяются и заменяются.
Таким образом, более универсальный GPT-5 — это не только благо для роста производительности, но и прелюдия к крупному землетрясению в отрасли.
В это время многие компании, у которых еще нет возможности использовать крупномасштабные модели и отсутствуют отраслевые барьеры, рухнут, как замки из песка.
И более простые люди, столкнувшиеся с постоянно сменяемыми позициями, глубже ощутят неопределенность времени...
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
GPT-5 будет? Какие кардинальные изменения произойдут в индустрии ИИ
С момента появления chatGPT ИИ быстро развивался ежемесячно.С таким количеством моделей и быстрых итераций многие люди не могут не осознавать, что люди, кажется, действительно стоят на краю ворот ОИИ.
Недавно документ, раскрытый Ведомством США по патентам и товарным знакам (USPTO), показывает, что OpenAI подала заявку на регистрацию товарного знака для «GPT-5» 18 июля. и был принят.
Скриншот файла USPTO
Хотя в первой половине этого года различные эксперты и ученые в области ИИ много раз публиковали совместные открытые письма, призывая людей обратить внимание на потенциальные риски генеративного ИИ, и OpenAI также объявила в то время, что у нее не будет плана обучить ОПТ-5 в короткие сроки.
Однако искушение науки и техники, наконец, позволило людям выйти за границы табу.
В раскрытой на этот раз заявке OpenAI упомянула, что невыпущенный GPT-5 будет иметь много возможностей, которых нет у GPT-4, и почти каждый пункт относится к AGI.
Скриншот файла USPTO
Итак, что такое изменение означает для ИИ и людей?
Сегодня в этой статье будет предпринята попытка провести простой анализ возможных функций, изменений и влияния GPT-5 на основе ограниченной информации, раскрытой в документах приложения OpenAI.
01 Путь к AGI
В опубликованном на этот раз документе одним из первых изменений, упомянутых OpenAI, является улучшение мультимодальных функций.
В частности, функции GPT-5 включают перевод текста или речи с одного языка на другой, распознавание речи, генерацию текста и речи и многое другое.
Хотя в текущем GPT-4 пользователи также могут выполнять перевод между разными языками, но, поскольку здесь выделена функция перевода, она, должно быть, была повторно оптимизирована.
Почему OpenAI так много внимания уделяет переводческим возможностям GPT-5?
Это может быть связано с тем, что одной из предпосылок для того, чтобы GPT стала универсальной, является минимизация разрыва в затратах на использование больших моделей на разных языках.
Ранее результаты исследования Оксфордского университета показали, что из-за методов измерения стоимости серверов и методов выставления счетов, принятых такими сервисами, как OpenAI, стоимость ввода и вывода на английском языке намного ниже, чем на других языках.
Среди них стоимость упрощенного китайского примерно в два раза выше, чем английского, испанского в 1,5 раза больше, чем английского, а шанского языка в Мьянме в 15 раз больше, чем английского.
Поскольку такие языки, как китайский, имеют другую, более сложную структуру, они требуют более высокой степени лемматизации.
Например, согласно токенизатору OpenAI GPT3, токен для «вашей привязанности» требует только двух токенов на английском языке и восьми токенов на упрощенном китайском языке.
Это означает, что для языков, отличных от английского, использовать и обучать модели намного дороже.
И как только порог «языкового барьера» будет преодолен, этот универсальный барьер перед GPT, несомненно, будет преодолен напрямую.
Кроме того, заметная функция распознавания речи в документе кажется просто незаметным изменением, но в какой-то степени это еще одна часть OpenAI, прокладывающая GPT-5 на пути к кирпичику AGI.
Как мы все знаем, в будущем направлении развития больших моделей становится все более очевидной тенденция к тому, что модели становятся маргинализованными и терминальными.
Поскольку в июле этого года Qualcomm выпустила большую модель с 1 миллиардом параметров, которая может работать на мобильных телефонах, такие производители, как Honor и Apple, также объявили о выпуске собственных мобильных телефонов «большой модели».
Начиная с мобильных телефонов, данные ИИ в будущем будут все больше обрабатываться на стороне терминалов, таких как камеры, датчики и автономное вождение.
В таком сценарии применения распознавание речи, несомненно, более удобно и эффективно.
Например, языковая модель ИИ позволяет водителю управлять транспортным средством с помощью голоса. Преобразование голосовых команд водителя в исполняемые команды, такие как запуск, остановка, ускорение, торможение и другие операции.
Умные помощники, существующие в системе мобильных телефонов, такие как SIri, также будут отдавать приоритет управлению с помощью голосовых команд.
Видно, что распознавание речи — это не просто вишенка на торте, а «стандартная конфигурация», когда GPT-5 заходит на терминальную сторону.
И за счет утопления каждого терминального устройства GPT-5 также получит более маргинализированные и неязыковые структуры данных.
В конце концов, с момента разработки большой модели текстовые данные, которые могут быть поглощены, почти одинаковы.Если мы хотим сделать еще один шаг на пути к ОИИ, такие «нетекстовые» данные очень важны.
02 Вызов экспертной модели
В дополнение к вышеуказанным характеристикам в документе, представленном OpenAI, также упоминается: «GPT-5 также может иметь возможность изучать, анализировать, классифицировать данные и реагировать на них».
Судя по текущей тенденции развития искусственного интеллекта, это, вероятно, означает, что GPT-5 обладает способностью к активному обучению, аналогичной способности разумного тела.
И эта способность сделает GPT-5 принципиально отличным от предыдущих моделей, которые могут только пассивно изучать новые знания через ввод данных человеком.
В частности, способность к активному обучению означает, что модель может самостоятельно выбирать, собирать и обрабатывать данные в соответствии со своими целями и потребностями, а не полагаться исключительно на данные, предоставленные людьми.
Это позволяет модели более эффективно использовать информацию и знания, содержащиеся в данных, и более гибко адаптироваться к различным средам данных и сценариям задач, а не просто пассивно получать и выводить данные.
И такая способность особенно важна, когда GPT-5 сталкивается с какими-то относительно незнакомыми и вертикальными полями.
Некоторые специфические области, такие как медицина, юриспруденция, финансы и т. д., обычно имеют свои собственные специфические термины, правила и системы знаний, которые могут быть трудны для понимания и обработки для обычных языковых моделей.
Если GPT-5 имеет возможность активного обучения, он может автоматически собирать и обновлять соответствующие данные в этих областях из Интернета, анализировать и классифицировать основные понятия, важные принципы и последние разработки в этих областях, а также реагировать на общие проблемы в этих областях. , Типичные случаи и практические приложения.
Таким образом, GPT-5 может быстрее освоить экспертизу в этих областях и выполнять соответствующие задачи в этих областях более точно и эффективно.
И все это является ключом к настоящей общей модели.
Потому что если GPT всегда нужно подключать к определенной «экспертной модели» для решения профессиональных задач, то нельзя сказать, что она действительно «универсальна».
Потому что это приведет к различиям и зависимости ТШП от разведывательных возможностей разных областей и сценариев, а также увеличит затраты на связь и координацию между ТШП и «экспертной моделью» и не может гарантировать, что качественные услуги могут быть достигнуты при любых условиях. обстоятельства.
Ранее зарубежные СМИ Semianalysis раскрыли секреты GPT-4, выпущенного в марте этого года, разоблачив, что OpenAI использует смешанную экспертную модель для построения GPT-4.
Согласно новостям, GPT-4 использует 16 смешанных экспертных моделей (смесь экспертов), каждая со 111 миллиардами параметров, и каждый маршрут прямого прохода проходит через две экспертные модели.
Однако чем больше экспертных моделей, тем труднее обобщать и достигать конвергенции.
Это связано с тем, что у каждой экспертной модели есть свои параметры и стратегии, которые зачастую сложно согласовать, что затрудняет балансировку и «учет общей ситуации» GPT.
Получив возможность активного обучения, GPT-5 сможет использовать мультимодальные возможности понимания и рассуждений, а также карты знаний и базы данных для анализа и понимания полученных данных, а также с помощью алгоритмов кластеризации и классификаторов, связывания и обобщения связанных данных. .
Таким образом, GPT-5 может эффективно использовать информацию и знания в данных в соответствии с различными средами данных и сценариями задач.
03 заменить больше работы
Как упоминалось выше, после преодоления языкового барьера и выхода на терминальную сторону с удобной функцией распознавания речи, GPT-5 продолжит поглощать знания в различных сценариях, областях и режимах за счет непрерывных активных возможностей обучения, а затем двинется в сторону Пути к ОИИ. движется с большой скоростью.
Можно предвидеть, что, когда GPT-5 с такой сильной «универсальностью» начнет распространяться на различные области, за исключением нескольких отраслей с барьерами данных (таких как медицина), большие модели в большинстве вертикальных областей будут постепенно затмеваться.
Потому что в конечном счете довольно много экспертов или вертикальных крупномасштабных моделей по сути являются продуктами некоторых предприятий с недостаточными вычислительными мощностями и данными, неспособными подняться по «общей крупномасштабной модели» и вынуждены довольствоваться следующим лучшим (особенно это заметно в Китае).
Если крупная модель общего назначения может быть эффективной в большинстве отраслей благодаря своей способности к обучению, то кто захочет утомительно переключаться между разными моделями и нести многочисленные затраты на обучение и использование разных моделей?
С этой точки зрения экспертная модель постепенно заменяется общей моделью, что является неизбежным историческим процессом для человека на пути к ОИИ.
Другое явление, которое сопровождает это, заключается в том, что более мелкие и тривиальные задачи заменяются.
Потому что с более мощной общей моделью люди обнаружат, что на самом деле содержание работы многих должностей может быть объединено и интегрировано.
Один из возможных примеров — менеджеры по продуктам и аналитики данных.
Например, в проекте разработки нового продукта GPT-5 может искать в Интернете соответствующие исследования рынка, анализ конкурентного продукта, портреты пользователей и другие данные в соответствии с заданной концепцией продукта или спросом и загружать их в свою память.
После этого он будет анализировать и понимать полученные данные с помощью собственного мультимодального понимания и возможностей логического мышления, а также графов знаний и баз данных.
После получения соответствующих данных, их классификации и организации GPT-5 изучит соответствующие маркетинговые стратегии, отзывы пользователей и другую информацию из обратной связи диалоговой системы через способность понимания языка и сравнит ее с заданными концепциями продукта или потребностями. и оценил.
Таким образом, две должности продакт-менеджера и аналитика данных эффективно «объединяются».
На незаконченном пути к ОИИ есть бесчисленное множество работ, которые объединяются и заменяются.
Таким образом, более универсальный GPT-5 — это не только благо для роста производительности, но и прелюдия к крупному землетрясению в отрасли.
В это время многие компании, у которых еще нет возможности использовать крупномасштабные модели и отсутствуют отраслевые барьеры, рухнут, как замки из песка.
И более простые люди, столкнувшиеся с постоянно сменяемыми позициями, глубже ощутят неопределенность времени...