Los robots aprenden, los chatbots visualizan: cómo 2024 será el “salto adelante” de la IA

AI. está destinada a avanzar a un ritmo rápido, volviéndose más poderosa y extendiéndose al mundo físico.

Por Cade Metz ( San Francisco ) en The New York Times del 8 de Enero de 2024

En un evento celebrado en San Francisco en noviembre, se le preguntó a Sam Altman, director ejecutivo de la empresa de inteligencia artificial OpenAI, qué sorpresas traería este campo en 2024.
Los chatbots en línea como ChatGPT de OpenAI darán “un salto adelante que nadie esperaba”, respondió Altman de inmediato.Sentado a su lado, James Manyika, un ejecutivo de Google, asintió y dijo: “Uno más”.

La industria de la IA de este año se definirá por una característica principal: una mejora notablemente rápida de la tecnología a medida que los avances se complementan entre sí, lo que permite que la IA sea un éxito. generar nuevos tipos de medios, imitar el razonamiento humano de nuevas maneras y penetrar en el mundo físico a través de una nueva generación de robots.
En los próximos meses, generadores de imágenes impulsados por inteligencia artificial como DALL-E y Midjourney entregarán instantáneamente videos e imágenes fijas. Y poco a poco se irán fusionando con chatbots como ChatGPT.
Eso significa que los chatbots se expandirán mucho más allá del texto digital al manejar fotografías, videos, diagramas, tablas y otros medios.
Exhibirán un comportamiento que se parece más al razonamiento humano y abordarán tareas cada vez más complejas en campos como las matemáticas y las ciencias.
A medida que la tecnología avance hacia los robots, también ayudará a resolver problemas más allá del mundo digital.
Muchos de estos desarrollos ya han comenzado a surgir dentro de los principales laboratorios de investigación y en productos tecnológicos. Pero en 2024, el poder de estos productos aumentará significativamente y serán utilizados por mucha más gente.

“El rápido progreso de la A.I. continuará”, dijo David Luan, director ejecutivo de Adept, una empresa de inteligencia artificial. puesta en marcha. “Es inevitable.” OpenAI, Google y otras empresas tecnológicas están avanzando en la IA. mucho más rápido que otras tecnologías debido a la forma en que se construyen los sistemas subyacentes. La mayoría de las aplicaciones de software las crean ingenieros, una línea de código informático a la vez, lo que suele ser un proceso lento y tedioso. Las empresas están mejorando la IA más rápidamente porque la tecnología se basa en redes neuronales, sistemas matemáticos que pueden aprender habilidades analizando datos digitales.
Al identificar patrones en datos como artículos de Wikipedia, libros y textos digitales extraídos de Internet, una red neuronal puede aprender a generar texto por sí sola. Este año, las empresas de tecnología IA planean alimentar a los sistemas con más datos (incluidas imágenes, sonidos y más texto) de los que la gente puede entender.
A medida que estos sistemas aprendan las relaciones entre estos diversos tipos de datos, aprenderán a resolver problemas cada vez más complejos, preparándolos para la vida en el mundo físico. Nada de esto significa que la IA podrá igualar al cerebro humano en el corto plazo.
Mientras que las empresas de IA y los empresarios pretenden crear lo que llaman “inteligencia general artificial”, una máquina que puede hacer cualquier cosa que el cerebro humano pueda hacer; esto sigue siendo una tarea de enormes proporciones.
A pesar de todos sus rápidos avances, IA . permanece en las primeras etapas.

Aquí hay una guía sobre cómo está previsto que la IA cambie este año, comenzando con los avances a corto plazo, lo que conducirá a un mayor progreso en sus capacidades.
Vídeos instantáneos
Hasta ahora, las aplicaciones impulsadas por IA generaban principalmente texto e imágenes fijas en respuesta a indicaciones. DALL-E, por ejemplo, puede crear imágenes fotorrealistas en cuestión de segundos a partir de solicitudes como “un rinoceronte que se lanza desde el puente Golden Gate”. Pero este año, es probable que empresas como OpenAI, Google, Meta y Runway, con sede en Nueva York, implementen generadores de imágenes que permitan a las personas generar vídeos también. Estas empresas ya han creado prototipos de herramientas que pueden crear vídeos instantáneamente a partir de mensajes de texto breves.
Es probable que las empresas de tecnología incorporen los poderes de los generadores de imágenes y videos a los chatbots, haciéndolos más poderosos.
Chatbots ‘multimodales’
Los chatbots y los generadores de imágenes, originalmente desarrollados como herramientas independientes, se están fusionando gradualmente. Cuando OpenAI presentó una nueva versión de ChatGPT el año pasado, el chatbot podía generar imágenes además de texto. Las empresas están construyendo sistemas “multimodales”, es decir, que la IA podra manejar múltiples tipos de medios.
Estos sistemas aprenden habilidades analizando fotografías, textos y potencialmente otros tipos de medios, incluidos diagramas, cuadros, sonidos y videos, para luego poder producir sus propios textos, imágenes y sonidos.

Eso no es todo. Debido a que los sistemas también aprenden las relaciones entre diferentes tipos de medios, podrán comprender un tipo de medio y responder con otro. En otras palabras, alguien puede introducir una imagen en el chatbot y este responderá con texto.
“La tecnología se volverá más inteligente y más útil”, dijo Ahmad Al-Dahle, quien dirige el grupo de I.A. en Meta. “Hará más cosas”. Los chatbots multimodales harán las cosas mal, del mismo modo que los chatbots de sólo texto cometen errores. Las empresas de tecnología están trabajando para reducir los errores mientras se esfuerzan por crear chatbots que puedan razonar como un humano.
Mejor ‘razonamiento’
Cuando Altman habla de que la IA está dando un salto adelante, se refiere a los chatbots que son mejores en “razonamiento” para que puedan asumir tareas más complejas, como resolver problemas matemáticos complicados y generar programas informáticos detallados. El objetivo es construir sistemas que puedan resolver un problema de forma cuidadosa y lógica a través de una serie de pasos discretos, cada uno de los cuales se basa en el siguiente. Así razonan los humanos, al menos en algunos casos. Los principales científicos no están de acuerdo sobre si los chatbots realmente pueden razonar así. Algunos argumentan que estos sistemas simplemente parecen razonar mientras repiten comportamientos que han visto en los datos de Internet. Pero OpenAI y otros están construyendo sistemas que pueden responder de manera más confiable preguntas complejas que involucran materias como matemáticas, programación de computadoras, física y otras ciencias. “A medida que los sistemas se vuelvan más confiables, se volverán más populares”, dijo Nick Frosst, un ex investigador de Google que ayuda a dirigir Cohere, una empresa de inteligencia artificial. puesta en marcha. Si los chatbots razonan mejor, pueden convertirse en “ agentes de IA ”.

Agentes de IA
Mientras las empresas enseñan a los sistemas de IA cómo resolver problemas complejos paso a paso, también pueden mejorar la capacidad de los chatbots para utilizar aplicaciones de software y sitios web en su nombre. Básicamente, los investigadores están transformando los chatbots en un nuevo tipo de sistema autónomo llamado agente IA . Eso significa que los chatbots pueden usar aplicaciones de software, sitios web y otras herramientas en línea, incluidas hojas de cálculo, calendarios en línea y sitios de viajes. La gente podría entonces transferir el tedioso trabajo de oficina a los chatbots. Pero estos agentes también podrían eliminar puestos de trabajo por completo. Los chatbots ya operan como agentes en pequeñas formas. Pueden programar reuniones, editar archivos, analizar datos y crear gráficos de barras. Pero estas herramientas no siempre funcionan tan bien como deberían. Los agentes se descomponen por completo cuando se aplican a tareas más complejas.
Este año, las empresas dedicadas a I A están preparadas para presentar agentes que sean más confiables. “Debería poder delegar cualquier trabajo informático tedioso y cotidiano a un agente”, dijo Luan. Esto podría incluir realizar un seguimiento de los gastos en una aplicación como QuickBooks o registrar los días de vacaciones en una aplicación como Workday
A largo plazo, irá más allá del software y los servicios de Internet y se adentrará en el mundo de la robótica.
Robots más inteligentes
En el pasado, los robots estaban programados para realizar la misma tarea una y otra vez, como recoger cajas que siempre tenían el mismo tamaño y forma. Pero utilizando el mismo tipo de tecnología que sustenta a los chatbots, los investigadores están dando a los robots el poder de manejar tareas más complejas, incluidas aquellas que nunca antes habían visto. Así como los chatbots pueden aprender a predecir la siguiente palabra de una oración analizando grandes cantidades de texto digital, un robot puede aprender a predecir lo que sucederá en el mundo físico analizando innumerables videos de objetos que son empujados, levantados y movidos. “Estas tecnologías pueden absorber enormes cantidades de datos. Y a medida que absorben datos, pueden aprender cómo funciona el mundo, cómo funciona la física, cómo se interactúa con los objetos”, dijo Peter Chen , ex investigador de OpenAI que dirige Covariant, una nueva empresa de robótica. Este año, A.I. potenciará los robots que operan detrás de escena, como brazos mecánicos que doblan camisas en una lavandería o clasifican montones de cosas dentro de un almacén.
Titanes de la tecnología como Elon Musk también están trabajando para trasladar robots humanoides a los hogares de las personas.

Ver Nota completa en https://www.nytimes.com/2024/01/08/technology/ai-robots-chatbots-2024.html?smid=nytcore-ios-share&referringSource=articleShare