OpenAI presenta una nueva IA que puede “razonar” a través de problemas de matemáticas y ciencias

Por Cade Metz desde San Francisco para el The New York Times del 20 de Diciembre de 2024

La start-up de inteligencia artificial dijo que el nuevo sistema, OpenAI o3 https://en.wikipedia.org/wiki/OpenAI_o3, superó a las principales tecnologías de IA en pruebas que evalúan las habilidades en matemáticas, ciencias, codificación y lógica.

OpenAI presentó el viernes un nuevo sistema de inteligencia artificial, OpenAI o3, que está diseñado para “razonar” a través de problemas que involucran matemáticas, ciencias y programación informática. La compañía dijo que el sistema, que actualmente comparte solo con evaluadores de seguridad, superó a las principales tecnologías de IA de la industria en pruebas de referencia estandarizadas que evalúan las habilidades en matemáticas, ciencias, codificación y lógica.

El nuevo sistema es el sucesor de o1, el sistema de razonamiento que la compañía presentó a principios de este año. OpenAI o3 fue más preciso que o1 en más de un 20 por ciento en una serie de tareas de programación comunes, dijo la compañía, e incluso superó a su científico jefe, Jakub Pachocki, en una prueba de programación competitiva. OpenAI dijo que planea implementar la tecnología para individuos y empresas a principios del próximo año.
“Este modelo es increíble en programación”, dijo Sam Altman, director ejecutivo de OpenAI, durante una presentación on-line para revelar el nuevo sistema. Agregó que al menos un programador de OpenAI aún podría superar al sistema en esta prueba.

La nueva tecnología es parte de un esfuerzo más amplio para construir sistemas de IA que puedan razonar a través de tareas complejas. A principios de esta semana, Google presentó una tecnología similar, llamada Gemini 2.0 Flash Thinking Experimental http://Gemini 2.0 Flash Thinking Experimental, y la compartió con un pequeño número de evaluadores.

Estas dos compañías y otras tienen como objetivo construir sistemas que puedan resolver un problema de manera cuidadosa y lógica a través de una serie de pasos, cada uno basado en el anterior.
Estas tecnologías podrían ser útiles para los programadores de computadoras que usan IA. sistemas para escribir código o para estudiantes que buscan ayuda de tutores automatizados en áreas como matemáticas y ciencias.
Con el debut del chatbot ChatGPT a fines de 2022, OpenAI demostró que las máquinas podían manejar solicitudes de manera más parecida a las personas, respondiendo preguntas, escribiendo trabajos finales y generando código informático. Pero las respuestas a veces eran defectuosas.
ChatGPT aprendió sus habilidades analizando enormes cantidades de texto extraído de Internet, incluidos artículos de noticias, libros, programas informáticos y registros de chat. Al identificar patrones, aprendió a generar texto por sí solo.
Debido a que Internet está lleno de información falsa, la tecnología aprendió a repetir las mismas falsedades.
A veces, inventó cosas, un fenómeno que los científicos llamaron “alucinación”.
OpenAI construyó su nuevo sistema utilizando lo que se llama “aprendizaje de refuerzo”. A través de este proceso, un sistema puede aprender el comportamiento a través de un extenso proceso de prueba y error.
Al resolver varios problemas matemáticos, por ejemplo, puede aprender qué técnicas conducen a la respuesta correcta y cuáles no.
Si repite este proceso con una gran cantidad de problemas, puede identificar patrones. Aunque los sistemas como o3 están diseñados para razonar, se basan en la misma tecnología básica que el ChatGPT original.
Eso significa que aún pueden equivocarse o alucinar. El sistema está diseñado para “pensar” en los problemas.
Intenta dividir el problema en partes y buscar formas de resolverlo, lo que puede requerir cantidades mucho mayores de potencia informática que la que necesitan los chatbots comunes.
Eso también puede ser costoso. A principios de este mes, OpenAI comenzó a vender OpenAI o1 a particulares y empresas.
Un servicio, dirigido a profesionales, tenía un precio de 200 dólares al mes.

vER NOTA COMPLETA EN https://www.nytimes.com/2024/12/20/technology/openai-new-ai-math-science.html?smid=nytcore-ios-share&referringSource=articleShare

Texto