AlphaProof 2 de DeepMind resuelve problemas de olimpiada matemática en tiempo real

La nueva versión combina razonamiento simbólico con búsqueda Monte Carlo. Un salto que pone en jaque lo que entendemos por inteligencia matemática artificial.

Noa Levi
··5,120 views

Cuando en 2024 DeepMind anunció que AlphaProof había resuelto cuatro de los seis problemas de la Olimpiada Internacional de Matemáticas, muchos lo recibieron como una proeza puntual. Un año después, AlphaProof 2 llega con una diferencia fundamental: ya no necesita días para resolver. Lo hace en minutos.

AlphaProof 2 DeepMind

Eso cambia la naturaleza del logro. Pasar de "puede resolver problemas olímpicos si le das tiempo suficiente" a "puede resolverlos en tiempo real" es el tipo de salto que transforma una curiosidad de laboratorio en algo con aplicaciones prácticas reales.

Cómo funciona AlphaProof 2

La arquitectura combina dos componentes que se complementan de forma elegante. Por un lado, un sistema de razonamiento simbólico formal que trabaja con el lenguaje de pruebas Lean 4 — lo que garantiza que cada paso sea verificable matemáticamente, no solo plausible. Por otro, una búsqueda Monte Carlo Tree Search profundamente refinada que guía la exploración del espacio de pruebas hacia las ramas más prometedoras.

Lo que ha mejorado respecto a la primera versión es la eficiencia de esa búsqueda. En AlphaProof 1, el sistema exploraba muchos callejones sin salida antes de encontrar el camino correcto. La versión 2 incorpora un componente de estimación de valor que aprende, a partir de millones de pruebas resueltas, a reconocer cuándo una línea de razonamiento va a funcionar antes de haberla completado. Es parecido a lo que hace un matemático experto cuando mira un problema: intuye si un enfoque tiene pinta de llegar a algún sitio.

"No es que el modelo sea más rápido. Es que ha aprendido a no perder el tiempo." — investigador de DeepMind en el anuncio oficial.

Los resultados concretos

En los problemas de la IMO 2025, AlphaProof 2 resolvió los seis problemas propuestos, incluyendo los dos de geometría que tradicionalmente han sido los más difíciles para sistemas automatizados. El tiempo medio de resolución fue de 8 minutos por problema, con el más complejo tardando 23 minutos.

Para contexto: los participantes humanos tienen 4,5 horas por sesión para tres problemas. Los mejores estudiantes del mundo resuelven dos o tres en ese tiempo. AlphaProof 2 los resuelve todos en el tiempo que tarda un humano en leerlos con calma.

¿Esto significa que las matemáticas están resueltas?

No, y es importante no exagerar. AlphaProof 2 es extraordinariamente bueno en un tipo específico de razonamiento: demostraciones formales en un espacio bien delimitado. Las matemáticas de investigación de frontera implican mucho más: intuición sobre qué problemas son interesantes, capacidad de reformular conceptos, conexiones inesperadas entre áreas distantes.

Lo que sí es cierto es que las herramientas de asistencia matemática van a cambiar profundamente en los próximos años. Un asistente que pueda verificar automáticamente si tu demostración es correcta, o sugerir pasos intermedios cuando estás atascado, está más cerca que nunca.

Implicaciones para la industria del software

El razonamiento formal tiene aplicaciones directas en verificación de software, criptografía y sistemas críticos. Un sistema que puede construir y verificar pruebas matemáticamente correctas en tiempo real podría verificar que un algoritmo de consenso es correcto, o que un protocolo de seguridad no tiene huecos. Es un territorio fascinante y todavía muy abierto.

TAGS

#deepmind#razonamiento#matemáticas#agentes
Share

Noa Levi

Investigación IA

// Related

AlphaProof 2 de DeepMind resuelve problemas de olimpiada matemática en tiempo real — SYNTHNODE