analisis-juridico

Johnson v. Dunn: Inhabilitación de abogados por citas alucinadas de ChatGPT en litigación federal

Johnson v. Dunn: Inhabilitación de abogados por citas alucinadas de ChatGPT en litigación federal

La sentencia dictada el 23 de julio de 2025 por la jueza Anna M. Manasco en el asunto Johnson v. Dunn (N.D. Ala., Case No. 2:21-cv-1701-AMM) marca un punto de inflexión en la respuesta judicial al uso irresponsable de inteligencia artificial generativa en la práctica forense. Tres letrados del bufete Butler Snow —Matthew B. Reeves, William J. Cranford y William R. Lunsford— fueron objeto de reprensión pública, inhabilitación cautelar en el proceso y remisión a las autoridades disciplinarias colegiales tras quedar acreditado que los escritos procesales que suscribieron contenían citas jurisprudenciales completamente inexistentes, generadas por ChatGPT y trasladadas a los tribunales sin verificación alguna. La resolución es, hasta la fecha, la más severa dictada en los Estados Unidos frente a este tipo de conducta, y su lectura resulta imprescindible para cualquier operador jurídico que utilice —o contemple utilizar— herramientas de IA generativa en la redacción de documentos dirigidos a un órgano jurisdiccional.

Las citas fantasma: cinco alucinaciones en dos escritos procesales

El origen del procedimiento disciplinario se remonta a mayo de 2025, cuando la representación del demandado Jefferson S. Dunn —antiguo Comisionado del Departamento de Correccionales de Alabama— presentó ante el tribunal un escrito de solicitud de autorización para deponar a Frankie Johnson, demandante privado de libertad, y un escrito de requerimiento de descubrimiento. Ambos documentos contenían citas jurisprudenciales que el propio demandante, actuando sin abogado, fue capaz de identificar como espurias.

El tribunal realizó búsquedas independientes y confirmó la inexistencia o la radical desconexión temática de las cinco citas cuestionadas. A título ilustrativo, la resolución documenta que Greer v. Warden, FCC Coleman I, 2020 WL 3060362, citado como precedente que rechazaba retrasar una deposición hasta completar el descubrimiento, simplemente no existe. Wilson v. Jackson, 2006 WL 8438651, otro de los casos invocados, conduce en Westlaw a un asunto de responsabilidad marítima completamente ajeno a la materia procesal para la que fue aducido. En cuanto a Kelley v. City of Birmingham, 2021 WL 1118031, la única resolución localizable con esa denominación data de 1939 y versa sobre una infracción de tráfico ante el Tribunal de Apelaciones de Alabama.

La admisión fue inmediata y sin ambages: el letrado Reeves reconoció haber utilizado ChatGPT para obtener citas de apoyo a dos argumentos contenidos en los escritos, sin haber comprobado su exactitud en Westlaw ni en PACER antes de incorporarlas a los documentos presentados al tribunal. Cranford, autor material de los escritos y firmante de ambos, admitió no haber verificado las citas añadidas por su supervisor. Lunsford, director del grupo de práctica y firmante de uno de los escritos, reconoció haber efectuado únicamente una revisión superficial del documento sin prestar atención al sustento legal.

La arquitectura de responsabilidad profesional ante el tribunal

La jueza Manasco construyó su análisis sobre la autoridad inherente del tribunal (inherent authority), al constatarse que ninguna de las vías disciplinarias codificadas resultaba directamente aplicable al supuesto.

La Regla 11 de las Reglas Federales de Procedimiento Civil, que prohíbe la presentación de argumentos jurídicos sin fundamento tras una investigación razonable, quedó excluida por su propio artículo 11(d): desde la reforma de 1993, dicha regla no se aplica a las mociones de descubrimiento reguladas en las Reglas 26 a 37. Precisamente los escritos en cuestión tenían naturaleza de mociones de descubrimiento, lo que creó una laguna normativa que la jueza calificó de "anomalía no intencionada" del sistema de reglas. La Regla 83.1(f) del reglamento local, que remite a las Normas de Conducta Profesional de Alabama, tampoco resultaba directamente aplicable, dado que la Norma 3.3 de dichas reglas —que prohíbe las declaraciones falsas ante un tribunal— exige conocimiento de la falsedad por parte del letrado, y dos de los tres abogados sancionados desconocían que las citas habían sido generadas por IA.

Esta serie de vacíos conducía inevitablemente al ejercicio de la inherent authority judicial. La doctrina consolidada del Tribunal Supremo de los Estados Unidos, sistematizada en Chambers v. NASCO, Inc., 501 U.S. 32 (1991), reconoce que los tribunales federales poseen poderes implícitos necesarios para preservar la integridad del proceso, derivados de la naturaleza misma de la institución jurisdiccional. El umbral aplicable para sancionar bajo esta autoridad inherente es la mala fe o una conducta equivalente a ella (tantamount to bad faith), conforme al estándar establecido por el Undécimo Circuito en Purchasing Power, LLC v. Bluestem Brands, Inc., 851 F.3d 1218 (11th Cir. 2017).

La resolución aplica con rigor este estándar a cada uno de los abogados y al bufete de forma diferenciada, lo que constituye uno de sus mayores méritos analíticos.

La graduación de la responsabilidad: del dolo a la indiferencia estructural

Matthew B. Reeves: la imprudencia grave que supera la mera negligencia

Reeves es identificado como el origen directo del problema. Como socio y subdirector del grupo de litigación constitucional y de derechos civiles de Butler Snow, utilizó ChatGPT para identificar jurisprudencia de apoyo en dos argumentos contenidos en los escritos, sin verificar ninguna de las citas devueltas por la herramienta a través de bases de datos jurídicas tradicionales. Esta conducta se produjo en abierta vulneración de la política interna del bufete, que desde junio de 2023 exigía autorización escrita del director del grupo de práctica para utilizar modelos de lenguaje de gran escala como herramienta de investigación secundaria, con verificación obligatoria de los resultados mediante métodos de investigación jurídica convencionales.

La jueza razona que la conducta de Reeves trasciende la mera imprudencia. Habiendo recibido advertencias generales reiteradas de los tribunales federales sobre los riesgos de las citas generadas por IA, habiendo sido informado de las políticas y controles internos de su propio despacho, y habiendo ignorado sistemáticamente todos esos mecanismos de tutela, su decisión reiterada de trasladar al tribunal citas no verificadas refleja un "desprecio absoluto por su deber profesional de candor" (complete and utter disregard for his professional duty of candor). La resolución califica este comportamiento de imprudencia extrema equivalente a la mala fe.

William J. Cranford: la firma como acto de responsabilidad no delegable

Cranford presenta un perfil de responsabilidad distinto: no utilizó IA, pero redactó, firmó y presentó personalmente ambos escritos sin verificar las citas que Reeves había incorporado como revisiones al borrador. El tribunal recuerda que la firma de un escrito procesal no es un acto formal vacío de contenido, sino una certificación de veracidad. La doctrina del Tribunal Supremo en Pavelic & LeFlore v. Marvel Entertainment Group, 493 U.S. 120 (1989) —previa a la reforma de 1993 de la Regla 11, pero expresiva de un principio de fondo no alterado por dicha reforma— subraya que la firma impone al letrado firmante una responsabilidad personal e intransferible (personal, nondelegable responsibility).

El hecho de que Cranford admitiese en la vista oral que su práctica habitual era no verificar las citas añadidas por sus supervisores —incorporarlas directamente tras revisar únicamente errores tipográficos y gramaticales— es calificado por la jueza como "perturbadora indiferencia hacia la veracidad de sus escritos procesales." La resolución subraya que cualquier comprobación mínima, incluso superficial, habría bastado para detectar que alguna de las citas era falsa. La omisión total de ese esfuerzo fue más que simple negligencia y equivale a la mala fe.

William R. Lunsford: la responsabilidad agravada del director de grupo

El análisis más extenso y en cierta medida el más severo es el dedicado a Lunsford, socio director del grupo de práctica y depositario de la habilitación de subprocurador general del Estado de Alabama que le permitía representar al demandado y delegar esa representación en otros abogados de su firma.

La resolución documenta varios elementos que, en su conjunto, agravan la responsabilidad de Lunsford más allá de la mera omisión de verificación. En primer lugar, su solicitud inicial de ser excusado de la vista de requerimiento —presentada pocas horas después de la emisión de la orden judicial, sin haber estudiado el alcance de las citas alucinadas ni investigado si existían problemas similares en otros escritos del caso— reveló una falta de comprensión sobre la gravedad del asunto que inquietó al tribunal. En segundo lugar, su declaración ante el tribunal desveló que la práctica ordinaria de su equipo consistía en reutilizar contenido jurídico de escritos anteriores sin verificación independiente, bajo la asunción de que la primera persona que había investigado y citado la autoridad en cuestión lo había hecho correctamente. Esta práctica estructural de delegación encadenada sin punto de control efectivo no es defendible en un tribunal federal.

La jueza concluye que Lunsford, como director de grupo, principal responsable de los asuntos del Departamento de Correccionales de Alabama y único portador de la habilitación de subprocurador general, estaba en la posición que más claramente exigía asegurarse de que los escritos presentados en su nombre no contenían afirmaciones falsas. Su "utter disregard for the truth of filings bearing his name" es calificado como particularmente grave, superior a la mera imprudencia y equivalente a la mala fe, especialmente a la luz de su posición institucional.

Butler Snow y los demás letrados: conducta conforme y exoneración

La resolución exonera sin sanción al bufete Butler Snow, así como a los letrados Daniel J. Chism y Lynette E. Potter. En cuanto al bufete, la jueza reconoce que sus respuestas preventiva y reactiva fueron razonables: implementó políticas de uso restringido de IA en 2023, creó un comité interno sobre la materia, publicó artículos de advertencia, y tras el incidente encargó a Morgan Lewis & Bockius una revisión independiente de más de 2.400 citas en 330 escritos presentados en 40 expedientes judiciales de Alabama y el Undécimo Circuito, sin hallar alucinaciones adicionales. Asumió íntegramente el coste de esa revisión sin repercutirlo al cliente estatal. Este comportamiento, concluye la jueza, no puede ser calificado de mala fe ni de conducta equivalente a ella.

Las sanciones impuestas y su lógica disuasoria

La jueza parte de un diagnóstico explícito sobre la insuficiencia de las sanciones convencionales para este tipo de conducta. Repasa los precedentes más relevantes —Mata v. Avianca, Inc., 678 F. Supp. 3d 443 (S.D.N.Y. 2023); United States v. Hayes, 763 F. Supp. 3d 1054 (E.D. Cal. 2025); Wadsworth v. Walmart Inc., 348 F.R.D. 489 (D. Wyo. 2025)— en los que las sanciones oscilaron entre 500 y 5.000 dólares por letrado, acompañadas de obligaciones de notificación. Su conclusión es directa: si las multas y la vergüenza pública fueran disuasorios eficaces, no existirían tantos casos que citar. Los tribunales federales de todo el país continúan registrando nuevos incidentes de alucinaciones IA en escritos judiciales a un ritmo que evidencia la ineficacia de las sanciones económicas modestas.

Con esta premisa, el tribunal impone tres categorías de sanciones:

La reprensión pública (public reprimand), formalizada mediante la publicación de la resolución en el Federal Supplement, junto con la obligación de los tres letrados sancionados de remitir copia íntegra de la orden a sus clientes, a los letrados de la parte contraria, al juez que presida cada asunto en el que tengan personación activa en cualquier tribunal estatal o federal, y a todos los abogados de su firma, en el plazo de diez días.

La inhabilitación en el proceso (disqualification), que priva a los tres letrados de la facultad de continuar participando en Johnson v. Dunn. La jueza justifica esta medida en la necesidad de garantizar a las partes que las falsedades documentadas no se reiterarán en el mismo procedimiento, y en la lógica de que quien ha incumplido su deber de veracidad no puede continuar como oficial del tribunal en ese asunto.

La remisión a las autoridades colegiales (referral to licensing authorities), que la resolución describe como el mínimo exigible dada la naturaleza de la infracción. La jueza ordena al Secretario del Tribunal notificar la resolución al Colegio de Abogados de Alabama y a cualquier otra autoridad de licenciatura aplicable.

Por el contrario, la resolución se abstiene de imponer la suspensión del ejercicio profesional en el Distrito Norte de Alabama, valorando favorablemente los resultados de la revisión independiente de Morgan Lewis, la sinceridad y prontitud de las disculpas de los letrados y, en particular, el compromiso de Reeves de desarrollar programas formativos sobre los riesgos de la IA en facultades de derecho de Alabama.

Las implicaciones doctrinales para la práctica forense con IA

La resolución Johnson v. Dunn aporta al debate jurídico sobre la IA en la abogacía varias contribuciones de relieve sistemático.

En materia de responsabilidad por omisión de verificación, el tribunal sienta con claridad que la ignorancia de que una cita ha sido generada por IA no es un eximente de responsabilidad cuando el letrado firmante omite toda comprobación. El estándar de diligencia que impone la firma de un escrito procesal es objetivo y no depende de que el letrado conozca el origen del contenido que suscribe. Esta lectura es coherente con la doctrina general de la Regla 11, cuyo estándar de "investigación razonable" el Tribunal Supremo y el Undécimo Circuito han caracterizado reiteradamente como objetivo, y la extiende al ámbito de la autoridad inherente del tribunal.

En materia de supervisión jerárquica, la resolución rechaza que la posición de supervisor excluya la responsabilidad del letrado que firma sin revisar, y afirma, a contrario, que la posición de dirección agrava esa responsabilidad. La práctica de delegar la verificación en quien ha generado el contenido —y de asumir sin comprobación que el supervisor ha realizado correctamente su investigación— es descrita como un fallo estructural del equipo que no puede ampararse en la confianza depositada en un colega con experiencia.

En cuanto a la suficiencia de las políticas internas de IA, la exoneración del bufete no supone que la mera adopción de políticas restrictivas sobre el uso de herramientas de IA sea suficiente para eximir de responsabilidad a la firma en todo caso. Lo que el tribunal valora es la combinación de una política razonable y previa, una respuesta reactiva diligente y exhaustiva, y la ausencia de evidencia de que la firma actuara con indiferencia o encubrimiento. Una política de papel que no va acompañada de formación efectiva, controles de cumplimiento y auditoría posterior no ofrecería la misma protección.

Finalmente, la resolución contribuye al debate sobre el ámbito de la Regla 11. La constatación de que las mociones de descubrimiento quedan fuera del ámbito de esa regla —y de que las reglas 26 y 37 no contemplan mecanismos para sancionar las falsedades jurídicas en esas mociones— es descrita por la jueza como una "anomalía no intencionada" que deja al tribunal sin más recurso que su autoridad inherente. Esta lectura invita al Advisory Committee on Civil Rules a examinar si la excepción de 1993 debería ser reformada para incluir mecanismos explícitos de sanción frente a las declaraciones jurídicas falsas en escritos de descubrimiento.

Conclusiones y Recomendaciones Prácticas

La orden de sanciones en Johnson v. Dunn es, en lo esencial, una sentencia sobre el deber de veracidad en la práctica forense y sobre las consecuencias de subordinarlo a la conveniencia o a la confianza acrítica en una herramienta tecnológica. Sus lecciones son aplicables con independencia de la jurisdicción y del sistema jurídico de que se trate.

  • La firma de un escrito procesal es una certificación personal de veracidad, no delegable. El letrado que suscribe un documento asume plena responsabilidad por su contenido, incluidas las citas que otros hayan añadido. La ignorancia del origen de una cita no excusa su falsedad si el firmante omitió toda verificación.

  • Las políticas internas de uso de IA deben ir acompañadas de controles efectivos. La existencia de una política restrictiva no protege al bufete ni al letrado si esta no se acompaña de formación activa, mecanismos de cumplimiento y protocolos de revisión previos a la presentación de escritos. El incumplimiento de la política propia agrava, además, la valoración de la conducta del letrado infractor.

  • La supervisión jerárquica no cancela la responsabilidad del supervisor. El director de grupo que permite que escritos firmados en su nombre se presenten sin que nadie haya verificado su contenido jurídico responde solidariamente por las falsedades que contengan, con agravación de la sanción en función de su posición institucional.

  • Las multas económicas modestas no son disuasorias suficientes frente a la alucinación de citas. Los tribunales que adopten sanciones inferiores a las impuestas en Johnson v. Dunn deben ser conscientes de que el precedente disponible sugiere que esas sanciones no están modificando el comportamiento de los letrados. La inhabilitación y la remisión colegial son instrumentos cualitativamente distintos y, según la lógica de esta resolución, necesarios para hacer efectiva la disuasión.

  • Todo sistema de verificación debe ser independiente del sistema que generó la cita. Utilizar ChatGPT para verificar una cita generada por ChatGPT no es verificación: es tautología. La comprobación en PACER, Westlaw, Lexis o bases de datos jurisprudenciales primarias constituye el estándar mínimo exigible.

¿Necesitas un análisis personalizado sobre el uso de IA generativa en tu práctica jurídica? Contacta aquí