OpenAI vs. NYT: Escala la batalla por los registros de chat

Arstechnica

En un momento crucial para el cambiante panorama de la inteligencia artificial y el derecho de propiedad intelectual, OpenAI y The New York Times están inmersos en una contenciosa batalla legal, con la última disputa centrada en el alcance del descubrimiento de datos de chat de usuarios. OpenAI ha ofrecido proporcionar 20 millones de registros de chat de usuarios como parte de la demanda en curso, una cifra drásticamente inferior a los 120 millones de registros exigidos por The New York Times. Este desacuerdo subraya la compleja interacción entre el descubrimiento legal, la privacidad del usuario y el futuro del desarrollo de la IA.

The New York Times inició su demanda contra OpenAI y Microsoft en diciembre de 2023, alegando que los gigantes tecnológicos infringieron sus derechos de autor al utilizar millones de sus artículos para entrenar sus grandes modelos de lenguaje (LLM), incluido ChatGPT, sin permiso ni compensación. The Times afirma que los modelos de OpenAI pueden, en ocasiones, reproducir o “regurgitar” su contenido protegido por derechos de autor, socavando su modelo de negocio y su integridad periodística.

Como parte de la fase de descubrimiento, The New York Times ha solicitado un acceso extenso a los datos de usuario de ChatGPT, argumentando que estos registros son cruciales para demostrar el alcance de la supuesta infracción de derechos de autor y para contrarrestar las defensas de OpenAI. La demanda del Times de 120 millones de registros de chat sugiere un amplio esfuerzo para descubrir cómo los usuarios interactúan con ChatGPT en relación con material protegido por derechos de autor, buscando potencialmente instancias en las que la IA genera contenido derivado o que imita artículos del Times.

OpenAI, sin embargo, se resiste vehementemente a esta exigencia generalizada, caracterizándola como un “exceso” que plantea riesgos significativos para la privacidad del usuario. La compañía sostiene que su oferta de 20 millones de registros de chat es suficiente para el proceso de descubrimiento y se alinea con los estándares de la industria establecidos. El director de operaciones de OpenAI, Brad Lightcap, ha criticado la demanda del NYT, afirmando que entra en conflicto con los compromisos de privacidad que OpenAI ha asumido con sus usuarios y abandona las normas de privacidad de larga data. OpenAI enfatiza que proporciona a los usuarios herramientas para controlar sus datos, incluidas opciones de eliminación, y argumenta que exigir la retención indefinida de todo el contenido del usuario, incluidos los chats eliminados, es una “solicitud inapropiada que sienta un mal precedente”.

Añadiendo otra capa a la disputa, un tribunal federal de EE. UU. emitió una orden que exige a OpenAI preservar casi todos los chats de usuarios con ChatGPT, incluidos aquellos que los usuarios habían eliminado. Esta orden de preservación, que OpenAI está apelando, ha desencadenado preocupaciones generalizadas sobre la privacidad. Los críticos argumentan que tal fallo podría sentar un precedente peligroso para la preservación masiva de datos en demandas, exponiendo potencialmente millones de conversaciones personales que los usuarios creían privadas o borradas. Expertos legales han expresado su preocupación de que esta decisión podría socavar la confianza en las herramientas de IA y conducir a un “efecto paralizador” en su uso, ya que los usuarios pueden volverse reacios a compartir información sensible.

La batalla legal se extiende más allá de los chats de usuarios. OpenAI también ha rechazado las solicitudes de descubrimiento de The New York Times, buscando acceso a la información interna de capacitación de IA del periódico y a las notas de los reporteros. OpenAI argumenta que estos materiales son relevantes para su defensa de uso justo y para determinar la protegibilidad por derechos de autor de las obras del Times. Este tira y afloja sobre el descubrimiento resalta las cuestiones fundamentales en juego: los parámetros del uso justo en el contexto del entrenamiento de la IA, la definición de material protegido por derechos de autor en la era digital y la medida en que los datos del usuario pueden ser exigidos en un litigio.

La demanda, consolidada bajo “In re: OpenAI Inc.” y avanzando hacia el juicio, está a punto de tener repercusiones significativas tanto para la industria de la IA como para la de los medios de comunicación. Su resultado podría redefinir la relación entre la IA generativa y el derecho de autor, dar forma a cómo se construyen y entrenan los modelos de IA, y establecer precedentes cruciales para la privacidad del usuario en un mundo cada vez más impulsado por la IA.

OpenAI vs. NYT: Escala la batalla por los registros de chat - OmegaNext Noticias IA