Openai lanza una nueva serie de modelos de ia con capacidad de "razonamiento"
Por Katie Paul y Anna Tong
12 sep (Reuters) - OpenAI, respaldada por Microsoft , anunció el jueves el lanzamiento de su serie Strawberry de modelos de inteligencia artificial diseñados para dedicar más tiempo a procesar respuestas a consultas, con el fin de resolver problemas difíciles.
Los modelos, de los que Reuters informó por primera vez, son capaces de razonar a través de tareas complejas y pueden resolver problemas más complejos que los modelos anteriores en ciencia, codificación y matemáticas, dijo la empresa de IA en una entrada de blog.
OpenAI utiliza el nombre en clave Strawberry para referirse internamente al proyecto, mientras que a los modelos anunciados el jueves los denomina o1 y o1-mini. El o1 estará disponible en ChatGPT y su API a partir del jueves, según la empresa.
Noam Brown, investigador de OpenAI centrado en mejorar el razonamiento en los prototipos de la compañía, confirmó en un post en la plataforma de redes sociales X que los modelos eran los mismos que los del proyecto Strawberry.
"Me emociona compartir con todos vosotros el fruto de nuestro esfuerzo en OpenAI por crear modelos de IA capaces de un razonamiento verdaderamente general", escribió Brown.
En la entrada de su blog, OpenAI afirma que el modelo o1 obtuvo una puntuación del 83% en el examen clasificatorio de la Olimpiada Internacional de Matemáticas, frente al 13% de su modelo anterior, GPT-4o.
El modelo también mejoró su rendimiento en preguntas de programación competitivas y superó el nivel de precisión de un doctorado humano en una serie de problemas científicos, según la empresa.
De acuerdo con Brown, los modelos lograron estas puntuaciones gracias a la incorporación de una técnica de razonamiento conocida como "cadena de pensamiento", que consiste en dividir los problemas complejos en pasos lógicos más pequeños.
Los investigadores han observado que el rendimiento de los modelos de IA en problemas complejos tiende a mejorar cuando este enfoque se utiliza como técnica de estimulación. OpenAI ha automatizado esta capacidad para que los modelos puedan descomponer los problemas por sí solos, sin que el usuario tenga que darles instrucciones.
"Hemos entrenado a estos modelos para que dediquen más tiempo a pensar en los problemas antes de responder, como haría una persona. A través del entrenamiento, aprenden a refinar su proceso de pensamiento, probar diferentes estrategias y reconocer sus errores", señala OpenAI.
Reuters fue la primera en informar sobre el trabajo de OpenAI en el proyecto de razonamiento, entonces llamado Q*, en noviembre de 2023. En julio informó de que el proyecto había pasado a conocerse como Strawberry. (Reporte de Akash Sriram en Bangalore, Katie Paul en Nueva York y Anna Tong en San Francisco; Editado en español por Raúl Cortés Fernández)