¿Qué tan buenA puede llegar a ser CHINA en la IA generativa?

Que tan buena puede llegar a ser CHINA en IA Generativa?

Por The Economist del 9 de Mayo de 2023

Si escuchas la grandilocuencia en Beijing y Washington, Estados Unidos y China están involucrados en una competencia total por la supremacía tecnológica. “Fundamentalmente, creemos que unas pocas tecnologías seleccionadas jugarán una gran importancia en la próxima década”, declaró Jake Sullivan, asesor de seguridad nacional del presidente Joe Biden, en septiembre pasado. En febrero, Xi Jinping, líder supremo de China, se hizo eco del sentimiento y afirmó que “necesitamos fortalecer urgentemente la investigación básica y resolver problemas tecnológicos clave” para “hacer frente a la competencia internacional en ciencia y tecnología, lograr un alto nivel de autosuficiencia y superación personal”.

Ninguna tecnología parece obsesionar más a los formuladores de políticas de ambos lados del Pacífico en este momento que la inteligencia artificial (IA). Las rápidas mejoras en las capacidades de los AI “generativos” como CHAT GPT , que analizan el valor de la web de texto, imágenes o sonidos humanos y luego pueden crear simulacros cada vez más pasables, solo han fortalecido la obsesión. Si la inteligencia artificial generativa resulta tan transformadora como afirman sus impulsores, la tecnología podría dar a quienes la manejan una ventaja económica y militar en la principal contienda geopolítica del siglo XXI. Los estrategas occidentales y chinos ya hablan de una carrera armamentista de inteligencia artificial. ¿Puede China ganarla?

En algunas medidas de la destreza de la inteligencia artificial, la autocracia se adelantó hace algún tiempo (ver graficos nota original link al pie). China superó a Estados Unidos en la proporción de artículos sobre inteligencia artificial altamente citados en 2019; en 2021, el 26 % de las publicaciones de conferencias de IA en todo el mundo procedían de China, en comparación con el 17 % de Estados Unidos. Nueve de las diez principales instituciones del mundo, por volumen de publicaciones de IA, son chinas. Según un punto de referencia popular, también lo son los cinco principales laboratorios que trabajan en visión por computadora, un tipo de inteligencia artificial particularmente útil para un estado de vigilancia comunista.

Sin embargo, cuando se trata de “modelos de base”, que dan su ingenio a sus habilidades generativas, Estados Unidos está firmemente al frente (Links a nota al pie ). Chatgpt y el modelo pionero detrás de él, cuya última versión se llama GPT-4, son una creación de Openai, una empresa emergente estadounidense. Un puñado de otras empresas estadounidenses, desde pequeñas como Anthropic o Stability ai hasta gigantes como Google, Meta y Microsoft (que es propietaria parcial de Openai), tienen sus propios sistemas poderosos. ERNIE , un rival chino de Chatgpt creado por Baidu ( https://www.dw.com/es/china-presenta-ernie-bot-el-chatbot-de-ia-que-aspira-a-ser-el-rival-m%C3%A1s-fuerte-de-chatgpt/a-65019068 ) , el gigante chino de las búsquedas en Internet, es visto como menos inteligente. Alibaba y Tencent, los titanes tecnológicos más poderosos de China, aún tienen que revelar su propia IA generativa. El gigante chino de las búsquedas en Internet, es visto como menos inteligente. Alibaba y Tencent, los titanes tecnológicos más poderosos de China, aún tienen que revelar su propio ais generativo.

Esto lleva a los entendidos a concluir que China está dos o tres años por detrás de Estados Unidos en la construcción de modelos básicos.
Hay tres razones para este bajo rendimiento. El primero se refiere a los datos. Una autocracia centralizada debería ser capaz de organizar gran parte de ella: el gobierno, por ejemplo, pudo entregar grandes cantidades de información de vigilancia sobre ciudadanos chinos a empresas como SenseTime o Megvii que, con la ayuda de los principales laboratorios de visión por computadora de China, luego lo usó para desarrollar sistemas de reconocimiento facial de primer nivel.

Esa ventaja ha demostrado ser menos formidable en el contexto de IA generativa, porque los modelos básicos se entrenan en los datos voluminosos no estructurados de la web. Los constructores de modelos estadounidenses se benefician del hecho de que el 56 % de todos los sitios web están en inglés, mientras que solo el 1,5 % están escritos en chino, según datos de w3Techs )https://w3techs.com/ ) , un sitio de investigación en Internet. Como señala Yiqin Fu de la Universidad de Stanford, los chinos interactúan con Internet principalmente a través de súper aplicaciones móviles como WeChat y Weibo. Estos son “jardines amurallados”, por lo que gran parte de su contenido no está indexado en los motores de búsqueda. Esto hace que el contenido sea más difícil de absorber para los modelos de inteligencia artificial. La falta de datos puede explicar por qué Wu Dao 2.0, un modelo presentado en 2021 por la Academia de Inteligencia Artificial de Beijing, un equipo respaldado por el estado, no logró causar sensación a pesar de que posiblemente sea computacionalmente más complejo que GPT-4.

La segunda razón de los mediocres logros generativos de China tiene que ver con el hardware. El año pasado, Estados Unidos impuso controles a la exportación de tecnología que podría dar a China una ventaja en inteligencia artificial. Estos cubren los poderosos microprocesadores utilizados en los centros de datos de computación en la nube donde los modelos básicos aprenden, y las herramientas de fabricación de chips que podrían permitir que China construya tales semiconductores por su cuenta.

Eso perjudicó a los constructores de modelos chinos. Un análisis de 26 grandes modelos chinos realizado por el Centro para la Gobernanza de IA, un grupo de expertos británico, encontró que más de la mitad dependía de Nvidia, un diseñador de chips estadounidense, para su poder de procesamiento. Algunos informes sugieren que SMIC ( https://www.smics.com/en/) , el fabricante de chips más grande de China, ha producido prototipos solo una o dos generaciones detrás de TSMC (https://www.tsmc.com/english ) , el líder de la industria taiwanesa que fabrica chips para Nvidia . Pero SMIC probablemente solo puede producir en masa los chips que TSMC producía por millones hace tres o cuatro años.

Hay otra exportación estadounidense: los conocimientos técnicos. Estados Unidos sigue siendo un imán para el talento tecnológico del mundo; Dos tercios de los expertos en inteligencia artificial en Estados Unidos que presentan trabajos en la principal conferencia sobre inteligencia artificial son nacidos en el extranjero. Los ingenieros chinos constituían el 27 % de ese grupo selecto en 2019. Muchos científicos chinos de inteligencia artificial estudiaron o trabajaron en Estados Unidos antes de traer su experiencia a casa. La pandemia de covid-19 y las crecientes tensiones chino-estadounidenses están causando que su número disminuya. En la primera mitad de 2022, Estados Unidos otorgó la mitad de visas a estudiantes chinos que en el mismo período de 2019.

La triple escasez de datos, hardware y experiencia ha sido un obstáculo para China.
Si China podra mantener sus ambiciones en inteligencia artificial por mucho más tiempo es otra cuestión.

En febrero, las autoridades locales de Beijing, donde se encuentran casi un tercio de las empresas de inteligencia artificial de China, prometieron publicar datos de 115 organizaciones afiliadas al estado, lo que les dio a los constructores de modelos 15 880 conjuntos de datos para jugar. El gobierno central ha señalado previamente que quiere desmantelar los jardines amurallados de las aplicaciones chinas, lo que podría liberar más datos, dice Kayla Blomquist, una exdiplomática estadounidense en China que ahora trabaja en la Universidad de Oxford. Los últimos modelos también pueden transferir sus aprendizajes automáticos de un idioma a otro. Openai dice que gpt-4 se desempeña notablemente bien en tareas en chino a pesar de la escasez de material fuente chino en sus datos de entrenamiento. El ERNIE de Baidu fue entrenado en muchos datos en inglés, señala Jeffrey Ding de la Universidad George Washington.

También en el hardware, China está encontrando soluciones alternativas. El Financial Times informó en marzo que SenseTime, que está en la lista negra de Estados Unidos, estaba utilizando intermediarios para eludir los controles de exportación. Algunas empresas chinas de inteligencia artificial están aprovechando los procesadores de Nvidia a través de servidores en la nube en otros países. Alternativamente, pueden comprar más productos menos avanzados de Nvidia: para seguir sirviendo al vasto mercado chino, Nvidia ha diseñado dispositivos que cumplen con las sanciones y que son entre un 10 % y un 30 % más lentos que los kits de gama alta. Estos terminan siendo más costosos para los clientes chinos por unidad de potencia de procesamiento. Pero hacen el trabajo.

China podría aliviar en parte la escasez de chips y de capacidad intelectual con la ayuda de modelos de “código abierto”.
El funcionamiento interno de dichos modelos puede ser descargado por cualquier persona y ajustado a una tarea específica. Esos incluyen los números, llamados “WHEIGHTS”, que definen la estructura del modelo y que se derivan de costosas ejecuciones de entrenamiento. Los investigadores de Stanford usaron las “wheitghts” de LLAMA, el modelo base de Meta ( https://research.facebook.com/publications/llama-open-and-efficient-foundation-language-models/ ) , para construir uno llamado Alpaca por menos de $600, en comparación con quizás $100 millones para entrenar algo como gpt-4.
Alpaca funciona tan bien como la versión original de Chatgpt en algunas tareas.

Los laboratorios chinos de inteligencia artificial podrían aprovechar de manera similar los modelos de código abierto, que encarnan la sabiduría colectiva de los equipos de investigación internacionales. Matt Sheehan de Carnegie Endowment for International Peace, otro grupo de expertos, dice que China tiene forma de ser un “seguidor rápido”: sus laboratorios han absorbido los avances del extranjero y los han incorporado rápidamente a sus propios modelos, a menudo con recursos estatales abundantes. Un destacado capitalista de riesgo de Silicon Valley es más contundente y llama a los modelos de código abierto un regalo para el Partido Comunista.

Tales consideraciones hacen que sea difícil imaginar que Estados Unidos o China puedan construir una ventaja insuperable en el modelado de IA.
Cada uno bien puede terminar con IA de capacidad similar, incluso si le cuesta a China superar las probabilidades frente a las sanciones estadounidenses. Pero si la carrera de los constructores de modelos es un empate, Estados Unidos tiene algo a su favor que puede convertirlo en el gran ganador de la IA: su capacidad para difundir la innovación de vanguardia en toda la economía. Después de todo, fue una difusión más eficiente de la tecnología lo que ayudó a Estados Unidos a obtener una ventaja tecnológica sobre la Unión Soviética, que en la década de 1950 producía el doble de doctorados en ciencias que su adversario democrático.

China es mucho más competente que la Unión Soviética en la adopción de nuevas tecnologías.
Sus plataformas fintech, telecomunicaciones 5g y trenes de alta velocidad son de clase mundial. Aún así, esos éxitos pueden ser la excepción, no la regla, dice el Sr. Ding. En particular, a China le ha ido menos bien en la implementación de computación en la nube y software comercial, ambos complementarios a la inteligencia artificial.

Y aunque es posible que los controles de exportación estadounidenses no descarrilen toda la construcción de modelos chinos, restringen la industria tecnológica de China de manera más amplia, lo que ralentiza la adopción de nuevas tecnologías. Además, las empresas chinas en su conjunto, y especialmente las pequeñas y medianas, carecen de tecnólogos que actúen como conductos para la difusión tecnológica. Sectores de la economía están dominados por empresas estatales, que tienden a ser aburridas y reacios al cambio. Algunas partes son dudosas. El “Gran Fondo” para chips de China, que recaudó 50.000 millones de dólares en 2014 con miras a respaldar empresas nacionales de semiconductores, se ha visto envuelto en escándalos. Muchas de las miles de nuevas empresas emergentes de IA son IA solo de nombre

Como consecuencia, el sector privado de China puede tener dificultades para aprovechar al máximo la inteligencia artificial generativa, especialmente si el Partido Comunista impone reglas estrictas para evitar que los chatbots digan algo que no les gusta a sus censores. Las desventajas se sumarían al soborno más amplio de la empresa privada por parte de Xi, incluida una represión de dos años y medio contra la industria tecnológica de China.

Aunque la campaña contra la tecnología ha terminado oficialmente, ha dejado profundas cicatrices, sobre todo en el negocio de la inteligencia artificial. El año pasado, las inversiones privadas en nuevas empresas chinas de inteligencia artificial ascendieron a 13.500 millones de dólares, menos de un tercio de la suma que fluyó a sus rivales estadounidenses. En los primeros cuatro meses de 2023, la brecha de financiación parece haberse ampliado, según PitchBook, un proveedor de datos. Ya sea que la inteligencia artificial generativa resulte o no revolucionaria, el libre mercado ha apostado por quién sacará el máximo provecho de ella.

Ver nota completa en https://www.economist.com/business/2023/05/09/just-how-good-can-china-get-at-generative-ai

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top