Filtración: OpenAI lanzaría modelo GPT de código abierto inminente

Según se informa, OpenAI está a punto de lanzar un modelo de IA de código abierto significativo, con algunas indicaciones que sugieren un lanzamiento inminente.

Esta especulación surge de una serie de rastros digitales, principalmente capturas de pantalla de repositorios de modelos ahora eliminados en plataformas como GitHub. Estos repositorios, con nombres como yofo-deepcurrent/gpt-oss-120b y yofo-wildflower/gpt-oss-20b, estaban supuestamente vinculados a cuentas del equipo de OpenAI. La designación gpt-oss se interpreta ampliamente como ‘GPT Open Source Software’ (Software de Código Abierto GPT), lo que indica un posible regreso a los orígenes más abiertos de la compañía después de años de centrarse en modelos propietarios. La presencia de múltiples nombres en clave y tamaños de parámetros sugiere una familia de modelos planificada.

Más detalles, supuestamente de un archivo de configuración filtrado, arrojan luz sobre la versión sospechosa de 120 mil millones de parámetros. Este modelo parece estar construido sobre una arquitectura de Mixtura de Expertos (MoE). En este diseño, en lugar de un único modelo grande que maneja todas las tareas, el sistema selecciona inteligentemente unos pocos ‘expertos’ especializados –en este caso, cuatro de 128– para cada consulta. Este enfoque combina la vasta capacidad de conocimiento de un modelo grande con la eficiencia operativa y la velocidad típicamente asociadas con sistemas más pequeños, ya que solo una fracción de sus componentes está activa en un momento dado. Más allá de su arquitectura, se dice que el modelo también cuenta con un vocabulario amplio, mejorando su eficiencia en varios idiomas, y emplea Atención de Ventana Deslizante (Sliding Window Attention), lo que le permite procesar secuencias de texto extensas de manera efectiva.

Si estas especificaciones resultan ser precisas, el posible lanzamiento de código abierto de OpenAI competiría directamente con modelos establecidos en el panorama de la IA de código abierto, especialmente Mixtral de Mistral AI y la familia Llama de Meta.

El momento de dicho lanzamiento invita a la especulación sobre las motivaciones estratégicas de OpenAI. Durante años, la compañía ha sido criticada por desviarse de su compromiso fundamental con la apertura, particularmente a medida que comercializaba cada vez más sus modelos avanzados. Un potente lanzamiento de código abierto podría servir como un gesto significativo para reconectar con las comunidades de desarrolladores e investigadores que se sintieron ignoradas. Además, representa una astuta maniobra competitiva. Empresas como Meta y Mistral han demostrado cómo un ecosistema de código abierto vibrante puede acelerar la innovación y fomentar una adopción generalizada. Al introducir un modelo de código abierto de alto rendimiento, OpenAI no solo entraría en esta arena competitiva, sino que también buscaría influir en su dirección.

Si bien estos detalles no han sido confirmados por OpenAI, la evidencia de código y archivos de configuración filtrados da un peso considerable a la especulación. El posible lanzamiento de un modelo MoE de código abierto de alto rendimiento y 120 mil millones de parámetros de una compañía tan prominente como OpenAI sin duda marcaría un desarrollo significativo en el sector de la inteligencia artificial, y su llegada parece estar cerca.

Filtración: OpenAI lanzaría modelo GPT de código abierto inminente

Artículos Relacionados

Microsoft lleva el gpt-oss-20b de OpenAI a Windows 11 vía AI Foundry

OpenAI lanza modelos GPT-OSS con licencia Apache, desafiando a sus rivales

Modelos OpenAI llegan a AWS: Una Alianza Estratégica en IA en la Nube