Cómo la start-up china de inteligencia artificial DeepSeek compite con gigantes de Silicon Valley
Extraido deloriginal de Cade Metz y Meaghan Tobin (Cade Metz informó desde San Francisco y Meaghan Tobin desde Taipei, Taiwán) para el The New York Times del 27 de Enero de 2025

El día después de Navidad, una pequeña start-up china llamada DeepSeek https://www.deepseek.com/ presentó un nuevo sistema de inteligencia artificial. sistema que podría igualar las capacidades de los chatbots de vanguardia de empresas como OpenAI y Google. Eso por sí solo habría sido un hito. Pero el equipo detrás del sistema, llamado DeepSeek-V3, describió un paso aún más grande. En un artículo de investigación que explica cómo construyeron la tecnología, los ingenieros de DeepSeek dijeron que usaron solo una fracción de los chips informáticos altamente especializados en los que se basaban las principales empresas de IA para entrenar sus sistemas.
Estos chips están en el centro de una tensa competencia tecnológica entre Estados Unidos y China.
Mientras el gobierno estadounidense trabaja para mantener el liderazgo del país en la carrera mundial de la IA, está tratando de limitar la cantidad de chips potentes, como los fabricados por la firma Nvidia de Silicon Valley, que se pueden vender a China y otros rivales.
Pero el desempeño del modelo DeepSeek plantea preguntas sobre las consecuencias no deseadas de las restricciones comerciales del gobierno estadounidense. Los controles han obligado a los investigadores en China a ser creativos con una amplia gama de herramientas que están disponibles gratuitamente en Internet.

El chatbot DeepSeek respondió preguntas, resolvió problemas lógicos y escribió sus propios programas informáticos con la misma habilidad que cualquier otra cosa que ya esté en el mercado, según las pruebas de referencia que han estado utilizando las empresas de IA estadounidenses. Y fue creado a bajo costo, desafiando la idea predominante de que solo las empresas más grandes de la industria tecnológica, todas ellas con sede en Estados Unidos, podían permitirse fabricar los sistemas de IA más avanzados.
Los ingenieros chinos dijeron que solo necesitaban alrededor de $6 millones en potencia informática bruta para construir su nuevo sistema. Eso es aproximadamente 10 veces menos de lo que el gigante tecnológico Meta gastó en construir su última tecnología de IA.
“La cantidad de empresas que tienen $6 millones para gastar es mucho mayor que la cantidad de empresas que tienen $100 millones o $1.000 millones para gastar”, dijo Chris V. Nicholson, un inversor de la firma de capital de riesgo Page One Ventures https://pageone.vc/ , que se enfoca en tecnologías de IA.
En 2022, cuando se lanzó ChatGPT, muchos expertos e inversores habían llegado a la conclusión de que ninguna empresa podría competir con los líderes del mercado sin gastar cientos de millones de dólares en chips especializados.
Las principales empresas de IA del mundo entrenan a sus chatbots utilizando supercomputadoras que utilizan hasta 16.000 chips, si no más.
Los ingenieros de DeepSeek, por otro lado, dijeron que solo necesitaban unos 2.000 chips informáticos especializados de Nvidia.
Las limitaciones de los chips en China obligaron a los ingenieros de DeepSeek a “entrenarlo de manera más eficiente para que aún pudiera ser competitivo”, dijo Jeffrey Ding, profesor asistente de la Universidad George Washington que se especializa en tecnología emergente y relaciones internacionales.
A principios de este mes, la administración Biden emitió nuevas reglas que tienen como objetivo evitar que China obtenga chips de IA avanzados a través de otros países. Las reglas se basan en múltiples rondas de restricciones anteriores que impiden que las empresas chinas puedan comprar o fabricar chips informáticos de vanguardia. El presidente Trump aún no ha indicado si mantendrá las reglas o las derogará.
El gobierno de Estados Unidos ha intentado mantener los chips avanzados fuera del alcance de las empresas chinas por temor a que pudieran utilizarse con fines militares. En respuesta, algunas empresas chinas han acumulado miles de chips, mientras que otras los han obtenido de un próspero mercado clandestino de contrabandistas. DeepSeek está dirigida por una empresa de negociación de acciones cuantitativa llamada High Flyer https://www.highflyercapital.com/ . En 2021, había canalizado sus ganancias en la adquisición de miles de chips de Nvidia, que utilizó para entrenar a sus modelos anteriores. La empresa, que no respondió a las solicitudes de comentarios, se ha hecho conocida en China por captar talentos recién salidos de las mejores universidades con la promesa de altos salarios y la posibilidad de continuar con los temas de investigación que mas atrajeron su interes

Ver nota completa en https://www.nytimes.com/2025/01/23/technology/deepseek-china-ai-chips.html?smid=nytcore-ios-share&referringSource=articleShare