analisis-juridico

NYT v. Microsoft: derechos de autor, IA generativa y el futuro del fair use

NYT v. Microsoft: derechos de autor, IA generativa y el futuro del fair use

El 27 de diciembre de 2023, The New York Times Company interpuso demanda ante el Tribunal de Distrito del Distrito Sur de Nueva York contra Microsoft Corporation y OpenAI, Inc. El caso, con número de expediente 1:23-cv-11195-SHS-OTW, plantea la cuestión más relevante que ha confrontado el derecho de propiedad intelectual en la última década: si el entrenamiento de modelos de lenguaje de gran escala (large language models, LLMs) sobre obras periodísticas protegidas por derechos de autor constituye una infracción del Copyright Act de 1976 o queda amparado por la doctrina del fair use. La respuesta que ofrezcan los tribunales federales definirá las reglas del juego para toda la industria de la inteligencia artificial generativa.


Ficha del Caso

CampoDetalle
Nombre oficialThe New York Times Company v. Microsoft Corporation, et al.
TribunalU.S. District Court, Southern District of New York (SDNY)
Número de expediente1:23-cv-11195-SHS-OTW
Fecha de presentación27 de diciembre de 2023
EstadoActivo — fase de discovery
Juez asignadoJudge Sidney H. Stein; Magistrate Judge Ona T. Wang (discovery)
Causa de acciónInfracción de derechos de autor (17 U.S.C. § 501), DMCA § 1202, competencia desleal
PartesThe New York Times Company v. Microsoft Corporation, OpenAI, Inc. y entidades relacionadas
MDLIn re OpenAI, Inc. Copyright Infringement Litigation, MDL No. 25-md-3143 (SDNY, desde abril 2025)


Del raspado masivo a la demanda: cómo el NYT construyó su teoría del caso

La demanda del NYT no es una acción aislada. Es el resultado de meses de negociaciones frustradas con Microsoft y OpenAI para alcanzar un acuerdo de licencias, fracasadas a finales de 2023. El diario alega que los demandados utilizaron aproximadamente tres millones de artículos de su archivo —incluyendo piezas de investigación, columnismo de opinión y reportajes de largo aliento— para entrenar modelos como GPT-3.5, GPT-4 y sus sucesores, sin autorización ni contraprestación económica.

La teoría central de la demanda descansa en dos pilares. El primero es la infracción directa: el scraping y la ingesta de los artículos durante el entrenamiento reproduce obras protegidas sin licencia. El segundo es la infracción contributiva: ChatGPT permite a usuarios obtener reproducciones sustancialmente similares —a veces literales— de artículos publicados por el NYT, eludiendo de facto los muros de pago y privando al diario de ingresos por suscripción y por licencias. A estas reclamaciones centrales se añaden reclamaciones bajo la Digital Millennium Copyright Act (§ 1202) por supresión de información de gestión de derechos, y reclamaciones de competencia desleal bajo la ley del estado de Nueva York.


Las defensas de los demandados y la geometría del fair use

La respuesta de Microsoft y OpenAI se articula principalmente en torno a la doctrina del fair use del 17 U.S.C. § 107. Los demandados sostienen que el entrenamiento de LLMs es un uso transformativo: el modelo no reproduce artículos, sino que extrae patrones estadísticos del lenguaje para generar texto nuevo. Esta argumentación tiene precedentes favorables —Authors Guild v. Google (2d Cir. 2015) amparó la digitalización masiva de libros para un motor de búsqueda— pero enfrenta una diferencia estructural relevante: los outputs de ChatGPT pueden sustituir funcionalmente el acceso a los artículos originales, lo que impacta directamente en el cuarto factor del fair use (efecto sobre el mercado potencial de la obra).

Los demandados también argumentaron prescripción parcial —reclamando que las infracciones anteriores a 2021 están fuera del período de tres años del Copyright Act— y la insuficiencia técnica de las reclamaciones DMCA, que en su criterio no se adaptan a la arquitectura de los sistemas generativos. Ambas líneas defensivas han sido erosionadas por las resoluciones del Juez Stein.


Los hitos procesales que han conformado el litigio

27 dic. 2023Presentación de la demanda

Primera gran demanda de un medio de comunicación hegemónico contra los principales actores de la IA generativa. Establece el marco teórico que otras publicaciones adoptarán en litigios posteriores.

26 feb. 2024Motions to dismiss de OpenAI y Microsoft

Los demandados solicitan la desestimación de varias reclamaciones: prescripción de infracciones anteriores a 2021, insuficiencia de la demanda contributiva, inaplicabilidad de la DMCA § 1202 a modelos generativos, y preemption federal de las reclamaciones estatales de competencia desleal.

jun. 2024Coordinación con el caso Daily News

OpenAI solicita coordinar el discovery con Daily News v. Microsoft (24-cv-3285), dado el solapamiento de más del 90% de las obras reclamadas. Los demandantes acuerdan un calendario de discovery coordinado.

oct. 2024Denegación de Protective Order sobre el perito técnico

La Magistrada Wang deniega la solicitud de OpenAI de impedir que el experto Dr. Ricardo Baeza-Yates acceda a documentación técnica confidencial de los demandados. Señal de que el discovery técnico avanza sin restricciones indebidas sobre el trabajo pericial.

22 ene. 2025Conferencia de discovery sobre output logs

La Magistrada Wang interroga a OpenAI sobre la preservación de registros de conversaciones de ChatGPT. El NYT alega destrucción de pruebas potencialmente inculpatorias. Wang rechaza una preservación "al por mayor" pero requiere segregación técnica de datos.

26 mar. 2025Denegación parcial de motions to dismiss (adelanto)

El Juez Stein mantiene las reclamaciones nucleares de infracción directa y contributiva. La viabilidad del corazón del litigio queda confirmada judicialmente.

3 abr. 2025MDL Transfer Order — consolidación en MDL 3143

El Judicial Panel on Multidistrict Litigation centraliza doce demandas de copyright contra OpenAI en el SDNY. El caso NYT queda integrado como acción líder del MDL In re OpenAI, Inc. Copyright Infringement Litigation, bajo el Juez Stein.

4 abr. 2025Opinion & Order completa sobre motions to dismiss (Doc. 514)

Resolución interlocutoria de alcance decisivo. Se desestiman con perjuicio las reclamaciones de competencia desleal estatal. Se desestiman sin perjuicio determinadas reclamaciones DMCA § 1202 contra Microsoft. Se deniegan las mociones de desestimación de las reclamaciones de infracción directa y contributiva. El núcleo del litigio sobrevive íntegro.

29 abr. 2025Contestación de Microsoft con jury demand

Microsoft presenta su contestación formal solicitando juicio con jurado, abriendo la vía para que el caso sea decidido por un tribunal popular y no solo por el Juez Stein.

13 may. 2025Preservation Order sobre output logs (Doc. 551)

La Magistrada Wang ordena a OpenAI preservar y segregar todos los registros de conversaciones de ChatGPT que habrían sido eliminados según sus políticas internas. Primera orden judicial de preservación masiva de datos generados por IA a escala global (más de 400 millones de usuarios). OpenAI recurre inmediatamente.

26 jun. 2025Confirmación de la Preservation Order por el Juez Stein

En vista oral, el Juez Stein rechaza la objeción de OpenAI y ratifica la orden de Wang, señalando que los propios términos de uso de OpenAI ya contemplaban la conservación de datos por motivos legales.

21 jul. 2025Deposition Protocol Order

El tribunal establece el protocolo de deposiciones del MDL: los demandantes del grupo de medios de comunicación dispondrán de 130 horas de deposición con testigos de OpenAI y 112 horas con testigos de Microsoft.

27 oct. 2025Denegación de motion to dismiss las reclamaciones por output

El Juez Stein rechaza la petición de OpenAI de desestimar las reclamaciones basadas en los outputs de ChatGPT, estableciendo que los resúmenes generados pueden ser "sustancialmente similares" a las obras originales bajo el estándar del Copyright Act. Primera aplicación judicial de este estándar al contenido generado por IA en un tribunal federal.


Estado actual y la disputa que definirá la IA

El caso se encuentra en fase activa de discovery, integrado como acción líder del MDL 25-md-3143. El protocolo de deposiciones aprobado en julio de 2025 fija las coordenadas de los próximos meses: declaraciones testimoniales de ejecutivos, ingenieros y científicos de datos de OpenAI y Microsoft sobre las decisiones técnicas y comerciales relativas al entrenamiento de los modelos y a la gestión de los datos. La disputa sobre la preservación de 20 millones de logs de conversaciones de ChatGPT —en curso a principios de 2026— añade una capa de complejidad probatoria sin precedentes.

Las grandes cuestiones de fondo permanecen abiertas para summary judgment o para juicio: la aplicabilidad del fair use al entrenamiento de LLMs, la responsabilidad por outputs que reproducen obras protegidas, y el alcance de las reclamaciones DMCA. Una resolución definitiva no parece inmediata: litigios de esta complejidad técnica y probatoria, y con este volumen de partes coordinadas en un MDL, raramente alcanzan juicio antes de cuatro o cinco años desde la presentación de la demanda inicial.

Lo que resulta llamativo es que la Opinion & Order de abril de 2025 y la resolución de octubre de 2025 sobre outputs ya han trazado una línea judicial clara: el entrenamiento de LLMs no goza de inmunidad automática bajo el fair use, y la generación de contenido sustancialmente similar a obras protegidas puede constituir infracción. Estos pronunciamientos interlocutorios, aunque no sean sentencias definitivas, tienen ya un valor de señalización jurídica considerable para toda la industria.


Conclusiones y Perspectivas Prácticas

  • El caso NYT v. Microsoft es el litigio de referencia para determinar si el entrenamiento de LLMs sobre contenido periodístico protegido es fair use o infracción bajo el Copyright Act de 1976.
  • La Opinion & Order de abril de 2025 confirma que las reclamaciones de infracción directa y contributiva son jurídicamente viables; el fair use como defensa queda reservado para fases posteriores del procedimiento.
  • La Preservation Order de mayo de 2025, ratificada en junio, sienta precedente para el e-discovery en litigios de IA: los logs de conversaciones de sistemas generativos son prueba preservable, incluso a escala de cientos de millones de usuarios.
  • La consolidación en MDL 3143 convierte este caso en el marco procedimental de referencia para una docena de demandas similares de medios de comunicación; su resolución tendrá efecto expansivo sobre todos ellos.
  • Las empresas que desarrollan o despliegan LLMs entrenados con contenido de terceros deben monitorizar de cerca las decisiones de summary judgment previstas para 2026-2027, que fijarán definitivamente los estándares aplicables al entrenamiento y a los outputs generativos.
  • Un resultado favorable al NYT haría inviable el modelo de entrenamiento actual de todos los grandes LLMs sin acuerdos de licencia masivos con editores de contenido; un resultado favorable a los demandados consolidaría el entrenamiento sobre contenido público como uso no compensable.

Fuentes consultadas: CourtListener Docket 68117049 / SDNY 1:23-cv-11195; Justia Dockets 1:2023cv11195 y 1:2025md03143; JPML Transfer Order MDL No. 3143 (3 abr. 2025); SDNY Opinion & Order Doc. 514 (4 abr. 2025); DocketAlarm Docs. 551 y 559 (may. 2025); Nelson Mullins Corporate Governance Blog (jul. 2025); Deep-Lex AI Litigation Update (nov. 2025); McKool Smith AI Infringement Case Updates (nov. 2025).