OpenAI Revela Modelos de IA de Peso Abierto: Un Giro Estratégico Tras Cinco Años

Theaiinsider

OpenAI ha presentado sus primeros modelos de IA de peso abierto en más de cinco años, marcando un giro estratégico significativo destinado a ampliar el acceso de los desarrolladores e influir en la política global de IA. El lanzamiento introduce dos potentes modelos de razonamiento, gpt-oss-120b y gpt-oss-20b, ahora disponibles públicamente en Hugging Face bajo la permisiva licencia Apache 2.0. Este movimiento significa el regreso de OpenAI a sus raíces de código abierto, una desviación de su enfoque reciente en modelos propietarios impulsados por API.

La decisión de lanzar estos modelos de peso abierto, lo que significa que sus parámetros subyacentes están libremente disponibles para descargar, modificar y desplegar, subraya un cambio hacia la democratización de la tecnología de IA. Esto permite a desarrolladores y organizaciones personalizar, ajustar y ejecutar estos modelos en su propia infraestructura, reduciendo la dependencia de las API de la nube remotas y mejorando la privacidad de los datos. La licencia Apache 2.0 es particularmente notable, ya que permite el uso comercial, la modificación y la distribución sin restricciones, incluyendo concesiones de patentes que protegen a los usuarios de reclamaciones por infracción. Esta licencia permisiva contrasta con algunos otros modelos de código abierto, que pueden incluir restricciones sobre el uso comercial o la escala.

El modelo gpt-oss-120b, con sus 117 mil millones de parámetros, está diseñado para aplicaciones de alto rendimiento y logra una paridad casi total con el o4-mini de OpenAI en los puntos de referencia de razonamiento principales. Impresionantemente, este modelo más grande puede ejecutarse eficientemente en una sola GPU Nvidia de 80 GB. El gpt-oss-20b, más ligero, con 21 mil millones de parámetros, ofrece un rendimiento comparable al o3-mini de OpenAI y está optimizado para hardware de consumo, capaz de ejecutarse en dispositivos con solo 16 GB de memoria, lo que lo hace ideal para casos de uso en el dispositivo e inferencia local. Esta accesibilidad es un cambio de juego, derribando barreras para organizaciones más pequeñas, mercados emergentes y desarrolladores individuales que pueden carecer del presupuesto para una infraestructura en la nube extensa.

Ambos modelos gpt-oss destacan en tareas de razonamiento, demuestran sólidas capacidades de uso de herramientas y admiten llamadas a funciones de pocas tomas y razonamiento de Cadena de Pensamiento (CoT). Son compatibles con la API de Respuestas de OpenAI y están diseñados para flujos de trabajo de agentes, ofreciendo esfuerzos de razonamiento ajustables para diversas tareas. Si bien los modelos son altamente capaces, OpenAI ha enfatizado la seguridad, implementando una capacitación y evaluaciones exhaustivas para minimizar los riesgos, incluso bajo un ajuste malicioso. Sin embargo, los resultados de la Cadena de Pensamiento se dejan sin filtrar para mayor transparencia, lo que puede llevar a puntuaciones de alucinación más altas, una compensación por la monitorización.

Este cambio estratégico de OpenAI se produce en medio de una creciente competencia de otras iniciativas de IA de código abierto, como LLaMA de Meta y modelos chinos como DeepSeek, que han demostrado el poder y el potencial colaborativo de los enfoques de peso abierto. El CEO de OpenAI, Sam Altman, reconoció previamente estar “en el lado equivocado de la historia” con respecto a la apertura, y este lanzamiento señala un compromiso renovado para hacer que la IA sea ampliamente accesible. La compañía tiene como objetivo fomentar la innovación a través de la colaboración abierta, creyendo que una base de desarrolladores más amplia acelerará la investigación y conducirá a un desarrollo de IA más seguro y transparente.

Además, los modelos ahora están disponibles en las principales plataformas en la nube como Amazon Bedrock y Amazon SageMaker JumpStart, ampliando su alcance a millones de clientes de AWS. Microsoft también está integrando versiones optimizadas para GPU de gpt-oss-20b en dispositivos Windows, mejorando aún más las opciones de implementación local. Esta disponibilidad generalizada y la licencia permisiva están destinadas a impulsar una nueva ola de innovación en IA, permitiendo a los creadores desarrollar y desplegar soluciones de IA en sus propios términos, desde la nube hasta el borde.