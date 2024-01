Una avalancha de demandas en una corte federal de Nueva York pondrá a prueba el futuro de ChatGPT y otros productos de inteligencia artificial que no serían tan elocuentes si no hubieran ingerido grandes cantidades de obras humanas protegidas por derechos de autor.

Pero ¿los chatbots de IA —en este caso, productos ampliamente comercializados fabricados por OpenAI y su socio comercial Microsoft— incumplen las leyes sobre derechos de autor y competencia leal? Los escritores profesionales y los medios de comunicación se enfrentarán a una difícil batalla para ganar ese argumento en los tribunales.

“Me gustaría ser optimista en nombre de los autores, pero no lo soy. Creo que tienen una ardua batalla por delante”, afirmó la abogada especializada en derechos de autor Ashima Aggarwal, quien trabajó para el gigante editorial John Wiley & Sons.

Una demanda procede de The New York Times. Otra de un grupo de reconocidos novelistas como John Grisham, Jodi Picoult y George R.R. Martin. Una tercera, de escritores de no ficción de gran éxito, incluido un autor de la biografía ganadora del Premio Pulitzer en la que se basó la exitosa película “Oppenheimer”.

Cada una de las demandas presenta argumentos diferentes, pero todas se centran en que la empresa OpenAI, con sede en San Francisco, “ha creado este producto a partir de la propiedad intelectual de otras personas”, dijo el abogado Justin Nelson, quien representa a los escritores de no ficción y cuyo despacho también representa a The New York Times.

“Lo que OpenAI está diciendo es que tiene vía libre para adueñarse de la propiedad intelectual de cualquier otra persona desde el principio de los tiempos, siempre y cuando se encuentre en internet”, dijo Nelson.

The New York Times interpuso una demanda en diciembre, alegando que ChatGPT y el chatbot Copilot de Microsoft compiten contra los mismos medios con los que se entrenan y desvían el tráfico web del periódico y de otros dueños de derechos de autor que dependen de los ingresos publicitarios que generan sus sitios para seguir produciendo su periodismo. También presentó evidencias de que los chatbots repetían artículos del Times palabra por palabra. En otras ocasiones, los chatbots atribuyeron falsamente información errónea al periódico, lo que perjudica su reputación.

Un juez federal preside hasta ahora los tres casos, así como un cuarto de otros dos autores de no ficción que presentaron otra demanda la semana pasada. El juez federal de distrito Sidney H. Stein ha estado en el tribunal de Manhattan desde 1995, cuando fue nombrado por el entonces presidente Bill Clinton.

OpenAI y Microsoft aún no han presentado contraargumentos formales sobre los casos de Nueva York, pero OpenAI hizo una declaración pública esta semana en la que se refirió a la demanda de The New York Times como “sin mérito” y señaló que la capacidad del chatbot para repetir textualmente algunos artículos era una “inusual falla”.

“El entrenamiento de modelos de inteligencia artificial con materiales de acceso público en internet es un uso legítimo, como demuestran precedentes antiguos y ampliamente aceptados”, afirmó el lunes la empresa en su blog. También insinuó que The New York Times “ordenó al modelo que lo reprodujera o seleccionó sus ejemplos de entre muchos intentos”.

OpenAI se refirió a los acuerdos de licencia que firmó el año pasado con The Associated Press, con la empresa alemana de medios Axel Springer y con otras organizaciones como ejemplos de cómo la compañía está tratando de apoyar un ecosistema de noticias saludable. OpenAI paga una cantidad no revelada por la licencia del archivo de noticias de la AP. The New York Times mantuvo conversaciones similares antes de decidir demandar.

OpenAI afirmó este año que el acceso al “archivo de textos de alta calidad y basados en hechos” de la AP mejoraría las capacidades de sus sistemas de IA. Pero su blog de esta semana restaba importancia al contenido de las noticias para el entrenamiento de la IA, argumentando que los grandes modelos lingüísticos aprenden de un “enorme conjunto de conocimientos humanos” y que “cualquier fuente de datos individual —incluido The New York Times— no es significativa para el aprendizaje previsto del modelo”.

Gran parte del argumento de la industria de la IA se basa en la doctrina del “uso justo” de la ley de derechos de autor de Estados Unidos, la cual permite usos limitados de materiales protegidos por derechos de autor, para la enseñanza, la investigación o la transformación de la obra protegida en algo diferente.

En respuesta, el equipo legal que representa a The New York Times escribió el martes que lo que OpenAI y Microsoft están haciendo “no es uso justo bajo ningún concepto”, porque están aprovechando la inversión del periódico en su periodismo “para construir productos sustitutivos sin permiso ni pago”.

Hasta ahora, los tribunales se han puesto mayoritariamente del lado de las empresas tecnológicas a la hora de interpretar cómo las leyes de derechos de autor deben tratar a los sistemas de IA. En una derrota para los artistas visuales, un juez federal de San Francisco desestimó el año pasado buena parte de la primera gran demanda contra los generadores de imágenes por IA. Otro juez de California rechazó los argumentos de la comediante Sarah Silverman de que la empresa matriz de Facebook, Meta, había infringido los derechos de su autobiografía para construir su modelo de IA.

Las demandas más recientes han aportado pruebas más detalladas de los supuestos perjuicios, pero Aggarwal dijo que cuando se trata de utilizar contenidos protegidos por derechos de autor para entrenar sistemas de inteligencia artificial que ofrecen una “pequeña parte de esos contenidos a los usuarios, los tribunales no parecen inclinados a considerar que se trata de una infracción de los derechos de autor”.

Las empresas tecnológicas citan como precedente el éxito de Google a la hora de rechazar las impugnaciones legales contra su biblioteca de libros digitales. En 2016, la Corte Suprema de Estados Unidos confirmó la resolución de un tribunal de menor instancia que rechazaba el argumento de los autores de que la digitalización de millones de libros por parte de Google y la exhibición pública de fragmentos de los mismos constituían una infracción de los derechos de autor.

Pero los jueces interpretan los argumentos del uso justo caso por caso y “en realidad depende mucho de los hechos”, en función del impacto económico y otros factores, dijo Cathy Wolfe, ejecutiva de la empresa holandesa Wolters Kluwer que también forma parte del consejo del Copyright Clearance Center, que ayuda a negociar licencias de medios impresos y digitales en Estados Unidos.

“Sólo porque algo esté gratis en internet, en un sitio web, no significa que puedas copiarlo y enviarlo por correo electrónico, y mucho menos utilizarlo para realizar negocios comerciales”, dijo Wolfe. “¿Quién va a ganar? No lo sé, pero desde luego soy partidaria de proteger los derechos de autor para todos. Eso impulsa la innovación”.

Algunos medios de comunicación y otros creadores de contenidos miran más allá de los tribunales y piden a los legisladores o a la Oficina de Derechos de Autor de la Biblioteca del Congreso de Estados Unidos que refuercen la protección de los derechos de autor en la era de la IA. Un grupo de la Comisión de Asuntos Jurídicos del Senado de Estados Unidos escuchará el miércoles el testimonio de ejecutivos y defensores de los medios de comunicación en una audiencia dedicada al efecto de la IA en el periodismo.

Roger Lynch, director general de la cadena de revistas Conde Nast, tiene previsto decir a los senadores que las empresas de IA generativa “están utilizando nuestra propiedad intelectual robada para construir herramientas de sustitución”.

“Creemos que la solución legislativa puede ser sencilla: aclarar que el uso de contenidos protegidos por derechos de autor en relación con la IA generativa comercial no es un uso justo y requiere un permiso”, dice una copia de las declaraciones preparadas por Lynch.