Diálogo 丨 Bowen Zhou: ¿Cómo rompe el modelo general a gran escala los escenarios de la industria vertical?

Autor: Wang Yongang Editor: Dong Zibo

**Fuente:**Revisión de tecnología de IA

Fuente de la imagen: Generada por la herramienta de IA Unbounded

Después de dejar JD.com, Zhou Bowen no ha estado tan emocionado en mucho tiempo.

ChatGPT resultó agitar al mundo, como un trueno de primavera que despertó a los practicantes de todos los ámbitos de la vida, para que todos escucharan los pasos de AGI entrando en la realidad.

Bajo el auge, la gente vio a Wang Huiwen y Wang Xiaochuan iniciar sus propios negocios, y también vio a Baidu y Alibaba dominar el mercado. Zhou Bowen, como exdecano del Instituto de Investigación de IA de IBM y JD.com, ha estudiado la teoría básica de la inteligencia artificial y las tecnologías, aplicaciones e industrialización centrales de vanguardia durante más de 25 años. Fundó Lianyuan Technology como temprano a fines de 2021. Model, con IA generativa, diálogo de múltiples rondas y tecnología de colaboración humano-computadora, ayuda a las empresas y consumidores a completar la innovación de productos y la transformación de la inteligencia digital en la nueva era de la inteligencia artificial. "No es tanto que haya decidido iniciar un negocio en este campo, es mejor decir que este negocio me encontró a mí", Zhou Bowen describió esto como algo que debe hacerse, como si un sentido de misión lo instara a actuar.

Zhou Bowen se graduó de la Universidad de Ciencia y Tecnología de China y luego fue a la Universidad de Colorado en Boulder para obtener un doctorado. Como ex presidente del instituto de investigación básica de inteligencia artificial de la sede estadounidense de IBM Research, regresó a China después de presidir el trabajo relacionado con la IA durante muchos años, y sucesivamente se desempeñó como vicepresidente senior de JD Group, presidente del comité técnico del grupo, presidente JD Cloud y AI, y presidente fundador de JD Artificial Intelligence Research Institute y otros cargos. Como fundador de JD AI, es responsable de la investigación técnica y el desarrollo comercial de JD AI. Estableció la División JD AI, el Instituto de Investigación AI y el Acelerador JD AI desde 0 para crear una plataforma abierta nacional para la inteligencia artificial de la cadena de suministro inteligente. , al darse cuenta del volumen diario de llamadas de 0 a decenas de miles de millones, lideró la reconstrucción técnica del servicio al cliente de inteligencia artificial de Jingdong y lanzó la producción externa, administró miles de millones de negocios de servicio técnico y miles de equipos integrados de tecnología, productos, marketing y ventas.

En 2021, Zhou Bowen predijo que la IA generativa explotaría en un futuro cercano, por lo que decidió dejar JD.com para fundar Lianyuan Technology, que se compromete a ayudar a las empresas verticales a llevar a cabo la innovación de productos y la transformación de la inteligencia digital con un modelo general a gran escala. capacidades y remodelado con valor de AI Commodity; en 2022, se desempeñará como profesor de la cátedra Huiyan de la Universidad de Tsinghua y profesor titular del Departamento de Ingeniería Electrónica, y en mayo del mismo año, establecerá la Investigación de Inteligencia Interactiva Colaborativa Centro de la Universidad de Tsinghua Coincidentemente. **

ChatGPT está a punto de llegar, y Zhou Bowen también publicó en Moments: "¡Creo que OpenAI de China necesita explorar un nuevo camino!" Bajo el orgullo, está ansioso por buscar talentos. Pero a diferencia de otros empresarios, Zhou Bowen y Lianyuan Technology optaron por confiar en decenas de miles de millones de parámetros y métodos de entrenamiento únicos para hacer que el modelo grande comprendiera mejor la relación entre las personas y los productos básicos sobre la base de las capacidades generales.La tecnología inteligente ayuda a las empresas a reconstruir el sistema de innovación de enlace completo desde la percepción del producto, el posicionamiento, el diseño, la I + D hasta el marketing.

Zhou Bowen dijo una vez en público que su dirección empresarial es tomar la iniciativa en la integración de la inteligencia artificial con las industrias tradicionales para aportar un mayor valor a la innovación de la inteligencia digital empresarial, es decir, lograr un gran avance en la capacidad de los grandes modelos generales en escenarios verticales.

Recientemente, un reportero de AI Technology Review tuvo una conversación con Zhou Bowen. La siguiente es la transcripción de la conversación. AI Technology Review ha editado el contenido sin cambiar su significado original:

Deja que la IA aprenda la sabiduría humana, un nuevo paradigma de interacción y colaboración

**AI Technology Review: ChatGPT ha traído este método de interacción, ¿qué crees que es diferente del método de interacción anterior? **

Zhou Bowen: Una de mis direcciones de investigación es la interacción entre la IA y las personas, y el aprendizaje en la interacción. La interacción humano-computadora es diferente del diálogo humano-computadora. A través de la interacción humano-computadora, la IA puede aprender cosas en el proceso, por lo que no es una tarea simple de realizar, sino un medio para lograr el aprendizaje.

Como se registra en "Las Analectas de Confucio", es la historia de Confucio y sus setenta y dos discípulos aprendiendo a través de la interacción. En Occidente, similar a la Academia de Atenas de Platón y Aristóteles, la herencia del conocimiento y la sabiduría más antiguos se logra a través del diálogo entre las personas, y los maestros ayudan a los estudiantes a completar mejor sus estudios a través de la interacción con los estudiantes.

Por ejemplo, si el maestro les pide a los estudiantes que viertan un vaso de agua, acciones tan simples de "ejecución de comandos" son difíciles de aumentar la sabiduría; Cómo superar las dificultades, esta es la interacción que puede aumentar la sabiduría, y también refleja mi núcleo punto de vista sobre la interacción colaborativa entre humanos e IA.

La esencia de la IA es la colaboración y la interacción con los humanos. Aprende continuamente de las interacciones y luego coopera con los humanos para resolver mejor los problemas. Este punto de vista será cada vez más importante en el futuro próximo y, al mismo tiempo, se enfrentará a más desafíos técnicos y éticos. Al final, no será fácil mantener el resultado final. Al igual que la Alineación de IA que todos dicen, los humanos pueden pasar su voluntad a la IA y luego desglosar las tareas con la IA, lo que permite que la IA aprenda y realice la voluntad humana en el proceso. Esta es una nueva forma de colaboración, es decir, inteligencia interactiva colaborativa.

**Revisión de tecnología de IA: ¿Cree que lograr la alineación de valores a través de la interacción es una forma efectiva para que el cerebro humano y GPT colaboren? ¿Cómo deberían los humanos y la IA trabajar mejor juntos? **

**Zhou Bowen: **Después de la explosión de la IA generativa, la IA que aprende a través de la interacción colaborativa con los humanos será cada vez más fuerte.

Daniel Kahneman, ganador del Premio Nobel de Economía en 2002, propuso en su exitoso libro Thinking Fast And Slow que existen dos modos de pensamiento humano: el sistema 1 y el sistema 2, y el sistema 1 es rápido. Pensamiento, juicio intuitivo; El sistema 2 es un pensamiento lento, que requiere mucho razonamiento y cálculo.

Inicialmente, la gente pensó que la IA era más adecuada para el trabajo del "sistema 1", como el reconocimiento facial y la inspección de calidad, que se basaban en el reconocimiento de patrones del "sistema 1". Pero insisto en que el valor real de la IA radica en 2, que es ayudar a los humanos a completar mejor las tareas complejas de razonamiento lógico. El surgimiento de ChatGPT ha verificado la viabilidad de la IA como Sistema 2, lo que significa que la IA puede descubrir nuevos conocimientos, y el descubrimiento de nuevos conocimientos ayudará a los humanos a diseñar una mejor IA, como la ciencia del cerebro y la optimización de la computación Descubrimiento, y surge un volante para crear nuevos conocimientos. El efecto volante significa que la IA puede permitir que todo el sistema descubra mejor nuevos conocimientos, y estos nuevos conocimientos pueden ayudar a diseñar mejores sistemas de IA, formando así un círculo virtuoso. Por lo tanto, se ha formado una relación de refuerzo mutuo entre la IA, el conocimiento y la innovación, lo que requiere que se transforme la forma en que la IA y los humanos colaboran.

He propuesto una dirección de investigación "3+1" antes, es decir, usar IA confiable como base de investigación y objetivo a largo plazo, para centrarme en la interacción de representación multimodal, la interpretación colaborativa humano-computadora y la evolución colaborativa ambiental. El núcleo es ser humano. La colaboración y la creación conjunta de máquinas pueden lograr el objetivo de que los seres humanos ayuden a la IA a innovar y que la IA ayude a los seres humanos a innovar.

Uno de ellos es la interacción de representación multimodal, donde puede haber una gran teoría unificada. En 2022, la gente todavía se muestra escéptica al respecto, pero con la llegada de GPT-4, esta interacción de representación unificada multimodal se ha vuelto más convincente; Otro punto es la interacción colaborativa persona-computadora. La gente también se mostró escéptica sobre esto en 2022, pero ahora este método de interacción se ha vuelto más creíble y la gente comenzó a creer que es probable que suceda; El tercer punto es la evolución conjunta de la IA y el medio ambiente, este significa que la IA no solo necesita cooperar con los humanos, sino que también debe adaptarse al entorno circundante. Propusimos este concepto por primera vez a principios de 2022, y hasta ahora no hemos visto ningún caso exitoso en esta dirección, ni siquiera OpenAI.

Si no puede aprender OpenAI, pero no puede hacer Microsoft, debe restar para las nuevas empresas nacionales a gran escala

**AI Technology Review: la característica especial del modelo Transformer es que utiliza un mecanismo de atención (Atención) para modelar el texto. Nos dimos cuenta de que ha llevado a cabo investigaciones relacionadas con el mecanismo de atención de la IA desde muy temprano. **

**Zhou Bowen:**Los aspectos más destacados de Transformer son el mecanismo de autoatención y el mecanismo de cabezales múltiples. En junio de 2017, "La atención es todo lo que necesita" publicado por Google Brain introdujo el concepto de mecanismo de autoatención (autoatención) y Transformador. Más tarde, el GPT de OpenAI también se vio profundamente influenciado por este documento.

Antes de esto, publiqué el primer artículo como autor correspondiente para presentar un mecanismo de autoatención de múltiples saltos para mejorar el codificador: "Una incrustación estructurada de oraciones de autoatención". Este documento se completó y cargó en arXiv en 2016 y se publicó oficialmente en ICLR a principios de 2017. También somos el primer equipo en proponer este mecanismo y, lo que es más importante, este es el primer modelo de representación de lenguaje natural que no considera las tareas posteriores. en absoluto. Todo el mundo ha utilizado la atención o la autoatención en algunos casos antes, pero todos dependen de la tarea.

**AI Technology Review: En este documento, ¿qué encontró? ¿Cómo afectaron estos descubrimientos a los cambios posteriores en la tecnología de los transformadores? **

Zhou Bowen: Propusimos en el artículo que el mejor método de representación es utilizar la autoatención estructurada para representar el lenguaje natural (PNL).Este artículo ha sido citado más de 2300 veces desde su publicación.

Antes de esto, Ilya Sutskever, científico jefe de OpenAI, creía que el mejor método de representación era "secuencia a secuencia (Seq2Seq)", es decir, entrenar el modelo para convertir la secuencia de un dominio en la secuencia de otro dominio. , como el idioma de origen correspondiente en la traducción automática y el idioma de destino, o en la respuesta a preguntas, donde la pregunta es una secuencia y la respuesta es una secuencia. Sobre esta base, se aprende la relación de mapeo entre los dos representados por la red neuronal profunda.

Pero más tarde, el equipo del experto en aprendizaje profundo y ganador del Premio Turing, Yoshua Bengio, propuso un "mecanismo de atención", cuyo núcleo es que no todas las palabras son igualmente importantes al responder preguntas; identificando las partes más críticas y luego prestando más atención. a esta parte, usted puede dar una mejor respuesta. Este modelo de atención ganó rápidamente una aceptación muy amplia. En 2015, dirigí al equipo de IBM para iniciar una investigación basada en la arquitectura y las ideas "Seq2Seq+Attention Mechanism" al mismo tiempo, y sucesivamente lancé varios de los primeros modelos generativos para la escritura de IA en lenguaje natural. También se han citado artículos relacionados más de 3000 veces

Pero no estaba satisfecho con el contenido del trabajo en ese momento, porque había un problema en él, es decir, la atención se construía a partir de la respuesta. La IA entrenada de esta manera es como un estudiante que le pide al profesor que marque los puntos clave antes del examen final de la universidad y luego repasa los puntos clave con atención específica. De esta forma, aunque se puede mejorar el desempeño de la IA en problemas específicos, no es universal. Por lo tanto, propusimos que no dependa en absoluto de la tarea y la salida dadas, sino solo de la estructura interna del lenguaje natural de entrada, y aprenda qué partes son más importantes y la relación entre ellas a través de lecturas múltiples de IA. autoatención más aprendizaje de representación para mecanismos multicabezales. Este tipo de mecanismo de aprendizaje solo analiza los datos de entrada, más bien como si los estudiantes estudiaran y entendieran el curso varias veces y de forma sistemática antes del examen, en lugar de aprender de forma específica y fragmentada en función de los puntos clave del examen, que está más cerca del objetivo. propósito de la inteligencia artificial general, y la capacidad de aprendizaje de la IA en gran medida mejorada.

**AI Technology Review: ¿Cuál es la relación entre el artículo "Todo lo que necesitas es atención" y tú? **

Zhou Bowen: Sabemos que todos los modelos grandes de esta ola provienen de Transformer, por lo que cuando vea una T en el modelo, lo más probable es que la T represente a Transformer. Me siento muy honrado de haber realizado un trabajo con visión de futuro en esta área. A fines de 2017, los investigadores de Google publicaron "La atención es todo lo que necesitas", un documento histórico que trajo el modelo Transformer al mundo. Y se citó nuestro artículo "A Structured Self-attentive Sentence Embedding", que propuso por primera vez un "mecanismo de autoatención de múltiples saltos" publicado a principios de 2017. Y el primer autor de este artículo, Ashish Vaswani, fue un estudiante del que fui mentor en IBM. El título del documento "La atención es todo lo que necesita" también expresa el significado de "la autoatención es muy importante, los múltiples cabezales son muy importantes, pero RNN puede no ser tan importante como pensábamos antes" propuesto por nosotros.

**Revisión de tecnología de IA: ¿Qué juicios técnicos consistentes tienen usted y OpenAI? **

**Zhou Bowen: Este artículo y la arquitectura de Transformer cambiaron todo por completo y resolvieron el problema de la memoria a larga distancia del modelo. Ilya Sutskever recordó en una entrevista reciente que OpenAI cambió por completo a la arquitectura Transformer el día después de que apareció el artículo. **

Sabemos que GPT es muy diferente del modelo de Bert, y la razón por la que Bert tuvo mucho éxito al principio, pero no tanto como GPT más adelante es que utiliza información de izquierda a derecha y de derecha a izquierda. En otras palabras, Bert usa información futura para ayudar a AI a aprender a representar, mientras que GPT insiste en predecir cuál será la siguiente palabra basándose únicamente en información pasada. **El enfoque de OpenAI en este punto está en línea con el pensamiento de nuestro equipo, es decir: trate de no usar respuestas para aprender. **De la atención a la autoatención, de BERT a GPT-3, la idea central es cuando ya no depende de la información futura, como el resultado o el contexto de la palabra que se va a predecir, o cuando se pueden usar más datos para completamente Al entrenar modelos de IA, comenzamos a ver la posibilidad de AGI.

Además, OpenAI cree que los modelos grandes aprenden el conocimiento del mundo a través del lenguaje natural, comprimiendo así el conocimiento mundial en modelos grandes. Los modelos grandes de la serie GPT y ChatGPT también se promocionan de acuerdo con este concepto. Lo mismo ocurre con el concepto y la visión de mi equipo y mío, es decir, construir un modelo de propósito general a gran escala y permitirle ejercer un mayor valor y capacidades en el campo vertical a través de la capacitación profesional e integrar a los consumidores. Las emociones, necesidades y experiencias complejas, así como la innovación de productos, el diseño, los parámetros de productos, los materiales, las funciones, etc., se comprimen en un gran modelo para reconstruir la relación binaria entre personas y productos, y utilizar la IA para remodelar el valor de productos

**Revisión de tecnología de IA: además de la solidez técnica, ¿qué otros aspectos de OpenAI le hacen pensar que tiene méritos? **

Zhou Bowen: No solo en términos de juicios técnicos, todo el enfoque comercial de OpenAI es representativo, incluido: el establecimiento del ecosistema, el anuncio de la nueva Ley de Moore, la reducción de los precios de API en un 90 %, etc. Expand el espacio de imaginación del capital y los usuarios para la aplicación comercial de modelos grandes, y deriva escenarios de aplicación casi ilimitados. Además, los planes de OpenAI para la gobernanza ética, el desarrollo empresarial, la tecnología ecológica y el desarrollo futuro también son muy claros.

**AI Technology Review: ¿Aparecerá el próximo OpenAI en China? **

**Zhou Bowen:**La dificultad técnica de construir un modelo grande está más allá de la imaginación de muchos empresarios chinos. Por lo tanto, no recomiendo que las empresas nacionales sigan y copien ciegamente el modelo "OpenAI+Microsoft", porque la mayoría de las empresas de tecnología chinas en China no son tan buenas en la capacidad de toma de decisiones comerciales como Microsoft, y su capacidad de juicio tecnológico no es tan buena. como OpenAI. **

El éxito de OpenAI es el resultado de muchos factores. Por ejemplo, Ilya Sutskever hizo juicios técnicos, Greg Brockman hizo funciones y Sam Altman integró recursos, incluida la investigación sobre el impacto de la IA en la ética y la sociedad. Si las empresas nacionales simplemente imitan a OpenAI, la distancia entre ellas solo se alejará más y más.

El juicio técnico de OpenAI se puede ver a partir de la latitud de los datos, porque no todos los datos del mundo son igualmente importantes. ¿Por qué OpenAI eligió usar el lenguaje de programación de Github para entrenar la cadena de pensamiento? Debido a que la semántica y la sintaxis del lenguaje de programación son extremadamente simples, la lógica del proceso de ejecución es rigurosa. Esto también representa una característica y ventaja de OpenAI: no atacará a ciegas. Por lo tanto, creo que el desarrollo de la IA de China debe encontrar otro camino, es decir, confiar en la capacidad de los grandes modelos generales para comenzar con la aplicación de escenarios verticales, que es más probable que tenga éxito.

La IA generativa alterará la experiencia del consumidor existente

**AI Technology Review: ¿Por qué se dirige al sector de consumo? **

Zhou Bowen: Cuando estaba en JD.com, vi una gran oportunidad comercial de "hacer coincidir dinámicamente la demanda del consumidor y el diseño de productos con inteligencia artificial". En 2021, decidí dejar mi trabajo y comenzar un negocio para desarrollar un modelo de lenguaje grande general para industrias verticales (el modelo de lenguaje grande no había explotado en ese momento), con la esperanza de cubrir todos los comportamientos de los consumidores desde escenarios no específicos. Sabemos que las escenas de tiempo y espacio son diferentes de lunes a viernes, y el enfoque de los trabajadores de cuello blanco u otras ocupaciones también es diferente. Detrás de estos símbolos culturales que afectan el comportamiento de compra están las emociones, experiencias y elecciones de productos complejas de los consumidores. Lógicamente. , esta es exactamente la valiosa información que necesitan las empresas. Cuando se fabrican productos en el lado de la oferta, se incluyen la creatividad, el diseño, los parámetros del producto, las funciones, los materiales y el posicionamiento de la marca, el eslogan, el marketing, la publicidad, el marketing, las imágenes promocionales, etc. De hecho, existe una fuerte relación correspondiente detrás de todos estos factores.

Este tipo de relación correspondiente nunca ha sido pasada por los seres humanos antes. Los profesionales de la planificación, el marketing y las ventas solo entienden los vínculos de los que son responsables. Y vamos a hacer el primer modelo a gran escala de propósito general del mundo de la cadena de suministro de productos básicos, es decir, comprimir toda esta información en un modelo de propósito general con alta fidelidad, y basado en este modelo a gran escala para empoderar el ciclo de vida completo de los productos empresariales, que incluye: información de oportunidades (descubrir), definición de productos (definir), diseño de programas (diseño), impulsar la I+D (desarrollar), transformación de marketing (distribuir). De esta forma, las empresas pueden descubrir oportunidades de innovación de manera más eficiente, diseñar y producir de manera más creativa, realizar promociones de marketing, llegar a los usuarios y completar la transformación de manera más efectiva.

**AI Technology Review: en términos de modelo comercial, parece ser más avanzado. **

Zhou Bowen: Para cualquier equipo emprendedor, es muy importante poder cultivar más capacidades profesionales después de tener las capacidades técnicas generales de los modelos grandes. En la actualidad, el gran avance de GPT se encuentra principalmente en su capacidad general, pero aún no se ha desarrollado su valor para industrias específicas y campos verticales. Por ejemplo: GPT puede dibujar pinturas artísticas muy realistas, pero no puede dibujar diagramas de circuitos, porque no no tener suficiente conocimiento del conocimiento físico Los juicios profundos y relevantes no son lo suficientemente profesionales.

Por lo tanto, creo que existe la necesidad de una herramienta de este tipo (un modelo grande de propósito general con capacidades profesionales) para que sea más fácil para los consumidores encontrar y estar más dispuestos a comprar los productos que necesitan, lo que puede cambiar por completo las rutas de compra existentes de las personas. . La IA generativa puede comprimir cantidades masivas de información comercial en modelos tan grandes, para aprender todos los aspectos de la cadena de suministro de productos básicos y mejorar la eficiencia de los enlaces clave centrados en los consumidores. Esta es la idea y la creatividad que ya se ha generado en 2021.

**Lianyuan Technology está desarrollando un modelo grande con capacidades generales.Este modelo grande tiene experiencia en vincular productos y consumidores. **Tenemos 37 indicadores de evaluación de modelos a gran escala, 2/3 de los cuales son capacidades de propósito general, como la capacidad de razonamiento y la capacidad informática, y más de una docena de elementos se aplican especialmente a la conexión entre productos y consumidores, para darse cuenta de que "deje que cada producto nazca de la necesidad, deje que cada consumidor obtenga lo que quiere" objetivo.

**AI Technology Review: ¿Cómo puede la IA generativa integrarse mejor con escenarios de consumo como el comercio electrónico? **

**Zhou Bowen:**Los humanos solo pueden entender la lógica comercial de la planificación o la lógica del marketing, pero la IA puede conectar todas las cadenas comerciales.

Los consumidores necesitan mucho vocabulario profesional para encontrar los productos que desean en escenarios como las plataformas de comercio electrónico; pero, por otro lado, los comerciantes no entienden las necesidades reales de los consumidores y solo pueden llegar a los consumidores a través de transacciones de comercio electrónico, a través de consultoría. instituciones de investigación para comprender mejor a los consumidores. Después de introducir una función de diálogo de rondas múltiples como ProductGPT, la eficiencia de coincidencia dinámica de comerciantes y consumidores en productos será más eficiente que la investigación de mercado, de modo que las plataformas de comercio electrónico puedan participar más profundamente en la innovación, el diseño, la investigación y el desarrollo de productos, y marketing, promoción, etc.

En la sociedad comercial actual, en realidad existe una fuerte correspondencia entre el lado de la demanda y el lado de la oferta. Nuestra plataforma de innovación colaborativa líder de desarrollo propio SaaS se basa en la comprensión multimodal, el razonamiento y las capacidades de generación de grandes modelos, y ayuda a las empresas a descubrir oportunidades comerciales e innovación de productos a través de conocimientos profundos sobre consumidores, escenarios, productos, referencias de productos e I+D. . Al mismo tiempo, la plataforma de diálogo de rondas múltiples ProductGPT de Lianyuan Technology brinda a cada empleado de la empresa un asistente personal profundamente personalizado de acuerdo con diferentes roles profesionales y satisface sus necesidades laborales específicas al proporcionar habilidades y conocimientos específicos del rol. Por ejemplo, el asistente personal de investigación del consumidor de Lianyuan Technology proporcionará habilidades profesionales y conocimientos relevantes, como la investigación de tendencias del mercado, la comprensión de las necesidades del consumidor y la investigación de mercado.

**Revisión de tecnología de IA: ha utilizado IA generativa para ganar dinero en JD.com, ¿cómo lo hizo? **

**Zhou Bowen:**En 2019, dirigí el equipo de inteligencia artificial de JD.com para aplicar inteligencia artificial generativa para crear redacción de productos y seleccionar imágenes. Ese también es el primer modelo generativo a gran escala de JD.com. En ese momento, nuestro modelo de IA lograba principalmente tres cosas:

Primero, ser capaz de leer el contenido en la página de detalles del producto por sí mismo y generar directamente 8-9 puntos de venta de este producto a través del análisis;

En segundo lugar, cuando un consumidor navega por un determinado producto, el modelo grande descubrirá rápidamente qué puntos de venta pueden impresionar más al usuario mediante el análisis de los datos de comportamiento de diferentes consumidores;

En tercer lugar, AIGC generará eslóganes exclusivos en torno a los puntos de venta que más preocupan a los consumidores en función de los retratos de los usuarios.

Después de un período de implementación, la tasa de conversión de las recomendaciones de productos aumentó en un 30% en comparación con antes. Es posible que los consumidores no se den cuenta de que cuando buscan y compran en JD.com, las categorías y descripciones de productos que ven son generadas automáticamente por AIGC palabra por palabra de acuerdo con las preferencias del usuario y los puntos de venta de los productos en el momento en que navega por los productos. .

**AI Technology Review: ¿Qué opina de la API abierta de OpenAI y qué significa para la industria? **

Zhou Bowen: Hablando por experiencia personal, solía ser el científico jefe de IBM Watson Group. En ese momento, los datos de algunas industrias en los Estados Unidos estaban regulados y, en general, dichas empresas no podían cooperar y solo podían implementar nubes privadas. Por eso, en 2015-2016, estaba decidido a ser una nube pública. Para lograr esto, es necesario APIizar las capacidades de IA de Watson. En ese momento, dirigí el lanzamiento de docenas de API, incluido el diálogo y la comprensión del lenguaje natural. Ponga estas API en la plataforma de la nube y ahora el negocio de IA de IBM gana dinero principalmente con ello.

Regresé a China a fines de 2017 y, en abril de 2018, lancé la plataforma abierta de inteligencia artificial de JD.com. En ese momento, básicamente no había una plataforma de inteligencia artificial en China, lo que también generó ingresos considerables para JD.com. En 2019, el equipo de IA de JD.com dirigido por mí generó 170 millones de yuanes en ingresos, lo que no está mal para un equipo de 200 personas.

**AI Technology Review: Existe una percepción en la industria de que el riesgo de hacer un modelo grande vertical es muy alto. **

Zhou Bowen: Creo que en el futuro, esos flujos de trabajo bien definidos y de alto valor se completarán con modelos profesionales de IA en lugar de modelos generales de IA. Es fácil mejorar aún más las capacidades básicas de un modelo grande de uso general después de completar con éxito una determinada escena vertical. Además, si partimos de un escenario vertical, nuestra acumulación pasada en términos de poder de cómputo, datos y algoritmos se puede utilizar de manera más completa. Por lo tanto, en la tecnología Lianyuan, el modelo grande debe tener las capacidades básicas de la tecnología general de modelos grandes en el marco subyacente de la tecnología, y debe evaluarse con métodos científicos, pero también requiere capacitación profesional.

En 2023, debido a la repentina popularidad de ChatGPT, el mercado comenzó a utilizar AI 2.0 para describir su enorme potencial. Además, casi todos los gigantes tecnológicos se han unido a la batalla, el mercado de capital de riesgo está tratando de aprovechar nuevas oportunidades y el entorno del mercado también está cambiando rápidamente. GPT es una oportunidad empresarial sistemática, pero simplemente copiar, seguir y ponerse al día es arriesgado y difícil.

Después de fundar Lianyuan Technology, nos comunicamos con más de 100 clientes, vimos las necesidades reales y mejoramos el camino de realización de la tecnología mediante la optimización continua del modelo grande: "En 2022, demostramos el valor comercial y la viabilidad técnica de este escenario. Esto significa que incluso si estamos haciendo un modelo grande, estamos en un camino diferente al de OpenAI, y el modelo de ganancias también es diferente.

Lo que quiero hacer es un mejor compresor de conocimiento del mundo que el GPT actual, que requiere datos muy interactivos y, obviamente, los datos están estrechamente relacionados con la escena. En cuanto a qué tipo de datos tienen el significado de inteligencia humana superior, en realidad hay mucho trabajo teórico por hacer y es una dirección que vale la pena explorar en el futuro.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)