Modelos de OpenAI: La IA Abierta que Revoluciona la Comunidad

Fastcompany

OpenAI, una empresa asociada durante mucho tiempo con mantener sus modelos de inteligencia artificial más avanzados en secreto, ha realizado un giro significativo al lanzar dos potentes modelos de “peso abierto”: gpt-oss-120b y gpt-oss-20b. Esta medida, destacada por primera vez por Fast Company, marca un cambio notable con respecto a su decisión de 2019 de restringir el acceso a su investigación de vanguardia y podría proporcionar un impulso sustancial a la comunidad de IA de código abierto en general.

Los modelos recién lanzados no son de “código abierto” en el sentido tradicional, ya que sus datos de entrenamiento y el código fuente completo siguen siendo propietarios. Sin embargo, son de “peso abierto”, lo que significa que los pesos del modelo preentrenado están disponibles gratuitamente para que los desarrolladores los descarguen, usen y adapten bajo una licencia permisiva Apache 2.0, incluso para aplicaciones comerciales. Esto permite una flexibilidad sin precedentes, lo que permite a las organizaciones ejecutar y ajustar estos modelos en su propia infraestructura, garantizando una mayor privacidad y control de los datos, especialmente crucial para industrias reguladas como la atención médica y las finanzas.

Esta decisión estratégica de OpenAI se produce en medio de una creciente competencia de otros modelos de peso abierto de alta calidad, como la serie Llama de Meta, DeepSeek y Qwen, que han ganado una tracción considerable en el panorama de la IA. El CEO de OpenAI, Sam Altman, había insinuado previamente una reevaluación de la estrategia de código abierto de la compañía, sugiriendo un reconocimiento de que el futuro de la innovación en IA podría no residir únicamente a puerta cerrada. Al ofrecer estos modelos, OpenAI tiene como objetivo democratizar el acceso a la IA avanzada, acelerar la investigación y fomentar la innovación en diversas comunidades y mercados emergentes. Además, este enfoque ayuda a OpenAI a mantener su influencia al integrar estos modelos en su ecosistema existente; cualquier cosa construida con los modelos de peso abierto puede pasar sin problemas a los servicios en la nube de OpenAI.

El modelo gpt-oss-120b, con 117 mil millones de parámetros totales, demuestra un rendimiento casi a la par con el o4-mini propietario de OpenAI en puntos de referencia de razonamiento complejos y puede operar de manera eficiente en una sola GPU de alta gama. Su contraparte más pequeña, gpt-oss-20b, con 21 mil millones de parámetros totales, ofrece capacidades similares a o3-mini y es notablemente compacta, capaz de ejecutarse en dispositivos de borde o laptops de consumo con solo 16 GB de memoria. Ambos modelos aprovechan una arquitectura de Mezcla de Expertos (MoE), mejorando la eficiencia al activar solo un subconjunto de parámetros por token. Son particularmente hábiles en tareas que requieren un fuerte razonamiento, codificación, análisis científico, resolución de problemas matemáticos y uso de herramientas, admitiendo una extensa ventana de contexto de 128K.

El lanzamiento de gpt-oss-120b y gpt-oss-20b en plataformas como HuggingFace, Azure AI Foundry y Amazon Bedrock significa un momento crucial para la industria de la IA. Si bien OpenAI ha enfatizado evaluaciones de seguridad exhaustivas, incluyendo pruebas contra versiones maliciosamente ajustadas, algunos puntos de referencia indican que estos modelos de peso abierto pueden exhibir tasas de alucinación más altas en comparación con sus contrapartes de “o-series” de código cerrado. Sin embargo, este movimiento empodera fundamentalmente a desarrolladores y empresas, ofreciendo herramientas de IA potentes y adaptables que pueden personalizarse para necesidades específicas sin los costos continuos por token asociados con los servicios basados en API. Este cambio no solo intensifica la competencia en el espacio de los modelos de IA, sino que también subraya una tendencia creciente de la industria hacia el equilibrio entre los avances propietarios y el espíritu colaborativo de la innovación abierta.