OpenAI Lanza Nuevo Modelo ‘01’ Que Qupera a ChatGPT-4o

El desarrollador de inteligencia artificial dijo que está “reiniciando el contador” para los nombres de sus productos, ya que su último conjunto de modelos sobresale en todas sus pruebas.

5 min lectura

Sep 14, 2024

OpenAI ha presentado una nueva familia de modelos y los ha puesto a disposición del público el jueves en su nivel de suscripción de pago de ChatGPT Plus, afirmando que proporciona importantes mejoras en rendimiento y capacidades de razonamiento.

“Estamos presentando OpenAI o1, un nuevo Modelo de Lenguaje Grande o Large Language Model (LLM) entrenado con aprendizaje por refuerzo para realizar razonamientos complejos”, afirmó OpenAI en una publicación de blog oficial, “o1 piensa antes de responder”. Los observadores de la industria de la IA esperaban que el principal desarrollador de IA desplegara un nuevo modelo “fresa” durante semanas, aunque las distinciones entre los diferentes modelos en desarrollo no se hacen públicas.

OpenAI describe esta nueva familia de modelos como un gran avance, tanto que cambiaron su esquema de denominación habitual, rompiendo con la serie ChatGPT-3, ChatGPT-3.5 y ChatGPT-4o.

“Para tareas de razonamiento complejas, este es un avance significativo y representa un nuevo nivel de capacidad de IA”, dijo OpenAI. “Dado esto, estamos reiniciando el contador de nuevo a uno y nombrando esta serie OpenAI o1.”

La clave para el funcionamiento de estos nuevos modelos es que “se toman su tiempo” para pensar antes de actuar, señaló la compañía, y utilizan un razonamiento de “cadena de pensamiento” para hacerlos extremadamente efectivos en tareas complejas.

Cabe destacar que incluso el modelo más pequeño de esta nueva línea supera al GPT-4o de primera categoría en varias áreas clave, según las pruebas de IA compartidas por Open AI, en particular las comparaciones de OpenAI sobre desafíos considerados de complejidad a nivel de doctorado.

Los modelos recién lanzados enfatizan lo que OpenAI llama "razonamiento deliberativo", donde el sistema se toma más tiempo para trabajar internamente en sus respuestas. Este proceso tiene como objetivo producir respuestas más reflexivas y coherentes, especialmente en tareas que requieren razonamiento.

OpenAI también publicó resultados de pruebas internas que muestran mejoras sobre GPT-4o en tareas como codificación, cálculo y análisis de datos. Sin embargo, la empresa reveló que OpenAI 01 mostró una mejora menos drástica en tareas creativas como la escritura creativa. (Nuestras propias pruebas subjetivas colocaron las ofertas de OpenAI por detrás de Claude AI en estas áreas). No obstante, los resultados de su nuevo modelo fueron bien valorados en general por evaluadores humanos.

El nuevo modelo implementa el proceso de inteligencia artificial de cadena de pensamiento durante la inferencia. Esto significa que el modelo utiliza un enfoque segmentado para razonar a través de un problema paso a paso antes de proporcionar un resultado final, que es lo que los usuarios ven en última instancia.

“La serie de modelos o1 está entrenada con aprendizaje por refuerzo a gran escala para razonar utilizando una cadena de pensamiento”, dice OpenAI en la tarjeta del sistema de la familia o1. “Entrenar modelos para incorporar una cadena de pensamiento antes de responder tiene el potencial de desbloquear beneficios sustanciales, al tiempo que aumenta los riesgos potenciales derivados de una inteligencia más elevada.”

La afirmación general deja espacio para el debate sobre la verdadera novedad de la arquitectura del modelo entre los observadores técnicos. OpenAI no ha aclarado cómo el proceso difiere de la generación basada en tokens: ¿es una asignación real de recursos para el razonamiento, o un comando oculto de cadena de pensamiento—o tal vez una mezcla de ambas técnicas?

Un modelo anterior de IA de código abierto llamado Reflection había experimentado con un enfoque similar basado en el razonamiento, pero enfrentó críticas por su falta de transparencia. Ese modelo utilizaba etiquetas para separar los pasos de su razonamiento, lo que, según sus desarrolladores, supuso una mejora respecto a los resultados de los modelos convencionales.

Incrustar más directrices en el proceso de cadena de pensamiento no solo hace que el modelo sea más preciso, sino también menos propenso a técnicas de jailbreaking, ya que tiene más tiempo y pasos para detectar cuando se está produciendo un resultado potencialmente dañino.

La comunidad de jailbreaking parece ser tan eficiente como siempre en encontrar formas de eludir los controles de seguridad de la IA, con los primeros jailbreaks exitosos de OpenAI 01 reportados minutos después de su lanzamiento.

Aún no está claro si este enfoque de razonamiento deliberativo puede escalarse de manera efectiva para aplicaciones en tiempo real que requieran tiempos de respuesta rápidos. OpenAI ha anunciado que, mientras tanto, tiene la intención de ampliar las capacidades de los modelos, incluyendo la funcionalidad de búsqueda web y mejoras en las interacciones multimodales.

Además, el modelo será ajustado con el tiempo para cumplir con los estándares mínimos de seguridad, prevención de jailbreak y autonomía de OpenAI.

Se esperaba que el modelo se lanzara completamente el jueves, sin embargo, podría ser lanzado en fases, ya que algunos usuarios han informado que el modelo aún no está disponible para ser probado por ellos.

La versión más pequeña eventualmente estará disponible de forma gratuita, y el acceso a la API será un 80% más barato que OpenAI o1-preview, según el anuncio de OpenAI. Pero no te emociones demasiado: actualmente hay una tasa semanal de solo 30 mensajes por semana para probar este nuevo modelo para o1-preview y 50 para o1-mini, así que elige tus prompts sabiamente.

Get crypto news straight to your inbox--

sign up for the Decrypt Daily below. (It’s free).

Get Email!

Noticias recomendados

ARK Invest Vende Más Acciones de Coinbase en Medio del Desplome de Bitcoin

La firma de inversión centrada en tecnología de activos de Cathie Wood, ARK Invest, ha vendido casi $4 millones en acciones de Coinbase (NASDAQ: COIN)—una de las mayores acciones relacionadas con criptomonedas—mientras que Bitcoin y el resto del mercado de criptomonedas sufren una caída después de un período de ganancias masivas. El ETF Ark Fintech Innovation de ARK (ARKF) vendió 13.780 acciones de COIN por valor de $3,9 millones. COIN ahora tiene un precio de $274 por acción—tras una caída del...

La Fórmula 1 Extiende Alianza con Crypto.com Hasta 2030

La Fórmula 1 ha renovado su asociación con el exchange de criptomonedas Crypto.com, extendiendo el acuerdo hasta 2030, mientras ambas entidades buscan capitalizar su impulso compartido. La asociación renovada permitirá que Crypto.com continúe destacándose en eventos clave de la Fórmula 1, incluyendo el Gran Premio de Miami, donde ha sido el patrocinador principal desde el inicio de la carrera en 2022. El acuerdo, firmado inicialmente en 2021, marcó la incursión de la Fórmula 1 en el ecosistema c...

Binance.US Proyecta su Recuperación para 2025, CEO Norman Reed Reflexiona Sobre el Futuro

Siguiendo el impulso de los cambios anticipados en la política de criptomonedas de EE.UU., Binance.US afirmó que busca restaurar sus servicios en USD a principios de 2025, según un comunicado compartido con Decrypt. Esto marca el primer cambio operativo importante del exchange desde que la presión regulatoria le forzó a suspender el trading en fiat el año pasado. La plataforma ha operado con acceso bancario restringido desde junio de 2023, cuando las demandas civiles de la Comisión de Bolsa y Va...

Noticias

Cursos

Profundidades

Monedas

Videos