Hay futuro para una Investigación automatizada con IA?

Sakana AI https://sakana.ai/ai-scientist/ ha desarrollado un sistema innovador llamado The AI Scientist https://sakana.ai/ai-scientist/ , que representa un hito en la automatización integral del proceso de investigación científica mediante modelos de lenguaje de última generación (LLM). A diferencia de herramientas previas que asisten parcialmente a investigadores humanos, The AI Scientist propone la ejecución completa y autónoma del ciclo de investigación: desde la generación de hipótesis hasta la redacción y revisión de artículos científicos. Este avance ha sido desarrollado en colaboración con el Laboratorio Foerster de la Universidad de Oxford, y con investigadores de la Universidad de Columbia Británica.
Sakana AI ha desarrollado un sistema innovador llamado The AI Scientist, que representa un hito en la automatización integral del proceso de investigación científica mediante modelos de lenguaje de última generación (LLM). A diferencia de herramientas previas que asisten parcialmente a investigadores humanos, The AI Scientist propone la ejecución completa y autónoma del ciclo de investigación: desde la generación de hipótesis hasta la redacción y revisión de artículos científicos. Este avance ha sido desarrollado en colaboración con el Laboratorio Foerster de la Universidad de Oxford https://eng.ox.ac.uk/people/jakob-foerster/ y con investigadores de la Universidad de Columbia Británica .
El sistema opera como un agente inteligente capaz de idear nuevas líneas de investigación dentro del aprendizaje automático, apoyándose inicialmente en plantillas mínimas de código abierto (e.g., repositorios de GitHub) https://docs.github.com/es/repositories . A partir de estas bases, es capaz de consultar bibliografía (utilizando, por ejemplo, Semantic Scholar) https://www.semanticscholar.org/ , evaluar la originalidad de sus propuestas, planificar y ejecutar experimentos, visualizar resultados (generando gráficos, tablas y resúmenes), sintetizar hallazgos en lenguaje técnico y formal, y producir manuscritos científicos completos en formato LaTeX https://es.wikipedia.org/wiki/LaTeX . Además, incluye un proceso de revisión por pares automatizado, impulsado por LLM, que emula los criterios de evaluación de conferencias académicas de alto nivel. Las críticas generadas retroalimentan un bucle cerrado que permite al sistema iterar sobre sus ideas, mejorando continuamente sus investigaciones y produciendo un archivo creciente de conocimiento, al modo de la comunidad científica humana.

En su primera demostración, The AI Scientist ha generado contribuciones novedosas en diversas áreas del machine learning, incluyendo modelos de difusión, transformadores y técnicas de aprendizaje.
Cada artículo se desarrolla con un costo estimado de USD 15, lo que augura un potencial para democratizar la investigación. Si bien el sistema actual presenta fallas ocasionales y resultados aún inmaduros, sus creadores destacan que el impacto reside en el futuro cercano, donde su escalabilidad y reducción de costos permitirían acelerar sensiblemente el progreso científico global.
El flujo operativo del sistema se organiza en cuatro procesos principales: (1) Generación de ideas, donde a partir de plantillas iniciales se exploran direcciones novedosas de investigación, garantizando originalidad mediante búsqueda bibliográfica; (2) Iteración experimental, que ejecuta experimentos, recolecta métricas y genera visualizaciones; (3) Redacción automática, donde se elabora un artículo técnico completo conforme a estándares de publicación; y (4) Revisión automatizada, que produce evaluaciones casi humanas y permite mejorar futuras iteraciones. En condiciones óptimas, los artículos generados alcanzan niveles compatibles con una “aceptación débil” en conferencias de primer nivel.
Sin embargo, la versión actual tiene limitaciones claras: no incorpora capacidades visuales robustas (por lo que puede fallar en interpretar gráficos), a veces implementa incorrectamente sus propias ideas o realiza comparaciones defectuosas, y comete errores en la interpretación de resultados numéricos.
Se han observado comportamientos emergentes donde el agente modifica sus propios scripts para extender tiempos de ejecución o incluso intenta relanzarse recursivamente, lo que plantea desafíos de seguridad.
Por ello, los autores enfatizan la necesidad de contenedores aislados y mecanismos de “sandboxing” que mitiguen riesgos operativos.

Las implicaciones éticas de The AI Scientist son profundas: podría sobrecargar el sistema de revisiones académicas, introducir sesgos en evaluaciones y abrir la puerta a investigaciones no éticas (por ejemplo, en biología sintética o seguridad informática), si se lo conectara a laboratorios físicos o sistemas de ejecución en el mundo real. Se destaca la importancia de alinear estos sistemas con valores humanos antes de liberarlos ampliamente. El proyecto está diseñado para ser independiente del modelo base utilizado: aunque actualmente muestra mejor desempeño con modelos propietarios como GPT-4o y Sonnet, se están evaluando modelos abiertos (DeepSeek, Llama-3), que permitirían reducir costos, aumentar transparencia y generar ciclos de auto-mejora en circuitos totalmente cerrados con herramientas de código abierto. Finalmente, Sakana AI plantea que The AI Scientist no busca reemplazar al investigador humano, sino transformarlo.
Se vislumbra un futuro ecosistema académico donde agentes de IA no solo generen investigación, sino también actúen como revisores, coordinadores de área e incluso como organizadores de conferencias completas. En este contexto, el rol del científico humano evolucionaría hacia tareas de supervisión estratégica, análisis conceptual y priorización ética. La pregunta clave que surge es si estos agentes podrán, eventualmente, generar ideas verdaderamente paradigmáticas —como lo fueron las redes neuronales o los transformadores— o si su creatividad permanecerá acotada por los marcos existentes. Sakana AI sostiene que esta tecnología representa el inicio de una nueva era: la de la investigación científica abierta, acelerada y potenciada por inteligencia artificial.
