A finales de 2025, se habían documentado en todo el mundo más de 700 casos judiciales en los que se habían presentado alucinaciones generadas por IA —citas legales inventadas, comillas atribuidas a terceros, precedentes inexistentes— presentadas por abogados, consultores e incluso jueces. El estudio de Stanford HAI de 2025 más citado midió que los LLM de uso general alucinaban entre un 69% y un 88% de las veces en consultas jurídicas. Incluso las herramientas premium de IA jurídica de LexisNexis y Thomson Reuters siguen alucinando entre un 17% y un 33% de las veces. Deloitte Australia tuvo que reembolsar parte de un contrato público de 440.000 AU$ después de que se descubriera que un informe sobre plantilla contenía citas académicas inventadas. Cinco meses después, en noviembre de 2025, un plan de salud de Deloitte por 1,6 millones de CA$ para Terranova fue sorprendido con al menos cuatro citas inventadas a artículos de investigación inexistentes.
El patrón que se observa en estos incidentes es coherente y contraintuitivo. Las organizaciones que salen perjudicadas no son las que tienen menos datos, sino las que tienen más. La promesa de la IA era que la escala generaría conocimiento. La realidad es que más datos, introducidos en modelos sin una gobernanza sobre lo que producen, generan errores más plausibles. Este artículo explica por qué sucede, qué está funcionando realmente para solucionarlo y qué marcos están desplegando los equipos empresariales en 2026 para dejar de ser el siguiente caso de estudio.
El problema de las alucinaciones: por qué más datos no significa mejor IA
La alucinación en los modelos de lenguaje de gran tamaño no es un fallo, en ningún sentido convencional. Es una característica de cómo funcionan estos sistemas. Un LLM no “sabe” nada de forma verificable: genera continuaciones estadísticamente probables del texto de entrada. Cuando el modelo se encuentra con una pregunta para la que no tiene una respuesta fundamentada, genera igualmente una respuesta plausible, porque generar algo es precisamente lo que el modelo está diseñado para hacer.
La intuición de que “más datos de entrenamiento arreglan esto” resulta ser parcialmente errónea. La escala mejora la fluidez y reduce algunas categorías de error, pero no corrige el mecanismo subyacente. Persisten tres modos de fallo independientemente del tamaño del modelo:
- Confabulación: El modelo fabrica citas, estadísticas, comillas o fuentes que no existen. Un estudio de Mount Sinai de 2025 sobre LLM clínicos halló una tasa de alucinación del 64,1% en casos clínicos extensos sin mitigación, que descendía al 23% con el mejor modelo (GPT-4o) más optimización del prompt. Incluso al 23%, una IA clínica que alucina una de cada cuatro veces no se puede desplegar sin verificación humana.
- Deriva contextual: El modelo recupera información real, pero la aplica al contexto equivocado. Que la IA recurra a un baremo salarial de 2020 para responder a una pregunta sobre retribución de 2025 es técnicamente usar datos reales, pero producir una conclusión falsa.
- Sesgo heredado: El modelo perpetúa patrones de sus datos de entrenamiento. La polémica de los límites de crédito de Apple Card en 2019, en la que a las mujeres se les ofrecían sistemáticamente líneas de crédito más bajas que a sus maridos, se remontó a datos de concesión de préstamos que codificaban discriminación histórica. El modelo funcionaba correctamente. Los datos, no.
El factor multiplicador en las implantaciones empresariales es que ahora las herramientas de IA tienen acceso a muchos más datos internos de los que los humanos que las operan pueden auditar razonablemente. Microsoft Copilot, cuando se despliega sin restricciones, indexa todo lo que un usuario puede leer en SharePoint, OneDrive, Teams y Outlook. Eso es estructuralmente útil para la productividad y estructuralmente peligroso para la integridad de los resultados, ya que el modelo resumirá encantado un documento de política desactualizado o un borrador de contrato como si fuera la fuente autorizada vigente.
Tasas de alucinación documentadas por contexto (2025)
| Contexto | Tasa de alucinación | Fuente |
|---|---|---|
| LLM de uso general en consultas jurídicas | 69-88% | Stanford HAI / RegLab, 2024-2025 |
| IA jurídica premium (Lexis+, Westlaw AI) | 17-33% | Stanford, Journal of Empirical Legal Studies, 2025 |
| Investigación jurídica de Stanford CodeX | 30-45% | Stanford CodeX, 2025 |
| LLM clínicos, casos largos (sin mitigación) | 64.1% | Mount Sinai, 2025 |
| LLM clínicos, GPT-4o con optimización | 23% | Mount Sinai, 2025 |
| artículos de NeurIPS 2025 (revisados por pares) | 53 artículos con citas inventadas | análisis de GPTZero, enero de 2026 |
Casos del mundo real: cuando la IA indujo a error en decisiones reales
La abstracción «a veces la IA se equivoca» se vuelve mucho más concreta cuando recorres los incidentes específicos que definieron la ola de alucinaciones de 2024-2025.
- Mata v. Avianca (junio de 2023): El caso que inauguró la era. El abogado neoyorquino Steven Schwartz presentó un escrito jurídico citando seis casos generados por ChatGPT. No existía ninguno. Schwartz incluso había pedido a ChatGPT que confirmara que las citas eran reales, y el modelo lo confirmó. El tribunal le impuso una sanción de $5,000 y ahora el incidente se enseña en cursos de ética de las facultades de Derecho.
- chatbot de Air Canada (febrero de 2024): Un tribunal de Columbia Británica dictaminó que Air Canada estaba legalmente obligada por una política de reembolso que su chatbot de atención al cliente había inventado. La aerolínea sostuvo que el chatbot era una «entidad jurídica separada». El tribunal no estuvo de acuerdo. Air Canada pagó.
- chatbot NYC MyCity (2024): El chatbot para pequeñas empresas de la ciudad de Nueva York, impulsado por Microsoft, aconsejó repetidamente a los usuarios infringir las leyes municipales, incluido animar a los dueños de restaurantes a quedarse con parte de las propinas de los trabajadores, lo cual es ilegal según la legislación laboral de Nueva York. El chatbot siguió en producción durante meses después de que los problemas se hicieran públicos.
- Morgan & Morgan (2025): El bufete estadounidense fue sancionado con $5,000 después de que uno de sus abogados presentara 8 citas de casos inventadas de un total de 9 en un escrito. La respuesta del bufete consistió en una política obligatoria de uso de la IA para toda la firma.
- abogado de Alabama (2025): Un abogado en ejercicio individual presentó un escrito con 21 citas de casos inventadas de un total de 23, una tasa de alucinación del 91%. El tribunal le impuso una multa y lo denunció al colegio de abogados del estado.
- Deloitte Australia (mediados de 2025): Un equipo de consultores utilizó GPT-4o para ayudar a redactar un informe sobre tendencias laborales para el Gobierno australiano. La mayoría de las referencias académicas y varias citas textuales eran inventadas. Deloitte reembolsó parte del contrato de AU$440,000.
- Deloitte Newfoundland (noviembre de 2025): Un plan de recursos humanos para la salud de CA$1.6 millones contenía al menos cuatro citas a artículos de investigación inexistentes. Informado por The Independent.
- Ponencias de la conferencia NeurIPS 2025 (enero de 2026): GPTZero analizó más de 4.000 artículos aceptados y encontró citas alucinadas por la IA en al menos 53 de ellos, a pesar de la revisión por pares. Las citas falsas se colaron porque el formato era correcto y los títulos inventados sonaban plausibles.
La idea central es que las alucinaciones no se detectan porque suenen mal. Se detectan cuando alguien hace clic para verificar. En todos los casos anteriores, la persona en el circuito no verificó, y la confianza de la IA en una salida fabricada era indistinguible de su confianza en una salida factual.
Del gobierno de entrada al gobierno de salida
La mayor parte de la estrategia de IA empresarial en 2022-2024 se centró en el gobierno de entrada: restringir qué datos podía ver el modelo, clasificar la información sensible y establecer controles de acceso. Ese enfoque ha topado con un muro estructural. La cantidad de datos que fluye hacia los sistemas de IA es ahora demasiado grande para gobernarla manualmente, y los patrones de acceso son demasiado dinámicos como para cerrarlos sin romper, de entrada, el argumento de productividad a favor de la IA.
El cambio en 2026 apunta hacia el gobierno de salida: asumir que la entrada es caótica y, en su lugar, validar, supervisar y filtrar la salida antes de que llegue a un responsable de la toma de decisiones. Cuatro prácticas definen un gobierno de salida maduro:
- Evaluación previa al despliegue: Ejecutar el sistema de IA a través de un conjunto de pruebas estandarizado que incluya indicaciones adversarias, casos límite y tareas de verificación específicas del dominio. El HHEM (Hallucination Evaluation Model) de código abierto de Vectara y el benchmark HalluLens de ACL 2025 son ahora puntos de referencia estándar.
- Fundamentación mediante generación aumentada por recuperación (RAG): Restringir al modelo para que responda solo a partir de una base de conocimiento controlada y recuperable, con citas explícitas a los documentos fuente. Incluso RAG no es una solución completa: la evaluación de Stanford de Lexis+ AI y Westlaw AI mostró que los sistemas basados en RAG siguen alucinando entre el 17 y el 33 % del tiempo; aun así, supone una mejora significativa frente a la generación sin base.
- Monitorización de la salida en tiempo real: Registrar cada respuesta de la IA, compararla con las barreras de seguridad (restricciones de hechos, afirmaciones prohibidas, requisitos de citación) y señalar anomalías. Herramientas como Guardrails AI, NVIDIA NeMo Guardrails, Galileo, Patronus AI y la capa de grounding contextual de Glean son las principales opciones comerciales.
- Trazabilidad de las fuentes: Exigir que las respuestas de la IA citen los documentos de los que se nutren, de modo que la persona que revise la salida pueda verificar la fuente subyacente y no la interpretación que la IA hace de ella.
Los marcos que realmente se aplican
Tres marcos dominan el gobierno de la IA empresarial en 2026. Se solapan, pero resuelven problemas distintos.
| Estructura | Origen | Alcance | Situación en 2026 |
|---|---|---|---|
| NIST AI Risk Management Framework (AI RMF 1.0) | NIST de EE. UU., 2023, perfil de IA generativa añadido en 2024 | Marco voluntario basado en el riesgo | Estándar de facto para empresas en EE. UU. |
| Ley de IA de la UE | Unión Europea, en vigor desde agosto de 2024 | Regulación obligatoria, escalonada por niveles de riesgo | Sanciones de hasta el 7% de los ingresos globales; obligaciones para sistemas de alto riesgo efectivas en 2026-2027 |
| ISO/IEC 42001 | ISO, diciembre de 2023 | Norma de sistema de gestión de IA | Certificable, se alinea con las prácticas de ISO 27001 y 9001 |
| Microsoft Responsible AI Standard v2 | Microsoft, 2022, actualizado en 2024-2025 | Norma interna para productos de Microsoft | Utilizado como referencia por clientes de Copilot/Azure AI |
La Ley de IA de la UE es la realmente significativa desde el punto de vista operativo para cualquier organización con clientes u operaciones en Europa. Las obligaciones para sistemas de alto riesgo —que abarcan la IA utilizada en decisiones de crédito, contratación, educación, infraestructuras críticas y aplicación de la ley— se hicieron exigibles por fases a partir de 2026. La sanción máxima (un 7% de la facturación anual global por usos prohibidos de IA) es más agresiva que el 4% del RGPD. Las organizaciones que construyeron su IA partiendo de la premisa de que «la regulación llegará tarde o temprano» ahora se están apresurando a adaptar la gobernanza.
El AI RMF de NIST es voluntario, pero se ha convertido en el estándar por defecto para las empresas en EE. UU., en parte porque la contratación pública federal lo referencia cada vez más y en parte porque es el único marco lo bastante específico como para ser útil operativamente sin ser tan prescriptivo como para frenar la innovación. El perfil de IA generativa publicado en 2024 añadió orientación específica para LLM sobre alucinaciones, inyección de prompts y procedencia de los datos de entrenamiento.
La configuración práctica de gobernanza de resultados en 5 pasos
Para equipos que despliegan IA sin perder ocho semanas en seleccionar un marco, el manual operativo en 2026 es el siguiente:
- Inventaria tus despliegues de IA. La mayoría de las empresas tienen más IA en producción de la que cree el IT central. El uso de IA en la sombra —equipos de ventas pegando datos de clientes en ChatGPT, equipos de marketing generando textos de campaña en Claude— es el mayor riesgo no gestionado en la mayoría de las organizaciones.
- Clasifica por nivel de riesgo. El marco de la Ley de IA de la UE es útil aquí incluso fuera de la UE: clasifica cada caso de uso de IA según el daño que podría causar una salida incorrecta. Los chatbots de atención al cliente que hacen afirmaciones sobre políticas, las decisiones crediticias, el asesoramiento médico y la investigación jurídica se sitúan en la parte superior.
- Implementa grounding (RAG) para aplicaciones de alto riesgo. No dejes que los LLM en producción respondan únicamente a partir de los datos de entrenamiento en nada que afecte a una decisión real. Recupera la información desde un repositorio de documentos controlado, versionado y de confianza, y exige citas.
- Despliega monitorización de alucinaciones. Vectara HHEM, Guardrails AI, NeMo Guardrails, Patronus AI y Glean ofrecen validación en la salida. Elige una. Trata las alertas como incidentes de producción.
- Forma a las personas sobre el modo de fallo real. La conclusión más citada en la base de datos de alucinaciones jurídicas es que los abogados no verificaron porque asumieron que la IA se habría negado si no lo supiera. Enseña a los equipos que los LLM no se niegan por defecto. Confabulan.
Qué ocurre sin gobernanza de la salida
La carta de diciembre de 2025 de una coalición de fiscales generales de varios estados de EE. UU. advirtió explícitamente que desplegar LLM sin mecanismos de verificación podría vulnerar las leyes de protección al consumidor. Los más de 700 casos judiciales documentados en los que intervino salida alucinada de IA no son el final de la tendencia: son la parte visible inicial. Las demandas por difamación, las reclamaciones por mala praxis, las sanciones regulatorias y las demandas colectivas están empezando a aparecer a medida que el sistema jurídico se pone al día con hasta qué punto se está tratando la salida de la IA como una fuente autorizada.
Las organizaciones que sobrevivirán a la siguiente fase de adopción de la IA no son las que tienen los conjuntos de datos de entrenamiento más grandes ni los modelos más sofisticados. Son las que resolvieron primero el problema más sencillo y menos vistoso: saber cuándo su IA se equivoca antes de que ese error llegue a un decisor, a un cliente o a una presentación ante el tribunal.
La conexión entre la optimización de la fabricación y la integridad de la salida de la IA es más estrecha de lo que parece. Una IA de línea de producción que toma una decisión incorrecta sobre el estado del equipo o el control de calidad genera un coste medible, como se recoge en nuestro análisis de datos de fabricación análisis de IA. La misma disciplina de gobernanza se aplica a integraciones de IA en ciberseguridad como las despliegues de ciberseguridad con GPT-4 que Microsoft ha ido implementando, y a las preguntas estratégicas más amplias planteadas en eventos como el Cumbre Skift Data + AI.
Preguntas frecuentes: alucinación de la IA y gobernanza
¿Qué es una alucinación de IA?
Una alucinación de IA se produce cuando un modelo de lenguaje grande genera información que suena autorizada y plausible, pero que es objetivamente incorrecta, fabricada o inventada. El modelo no está mintiendo en ningún sentido intencional: está produciendo texto estadísticamente probable sin basarse en hechos verificados.
¿Con qué frecuencia alucinan las herramientas de IA?
La tasa varía enormemente según el contexto y la herramienta. Los LLM de uso general alucinan entre el 6 y el 88% de las veces en consultas jurídicas (Stanford HAI). Las herramientas premium de IA jurídica (Lexis+ AI, Westlaw AI) siguen alucinando entre el 17 y el 33% (Stanford 2025). Los LLM clínicos alucinan hasta un 64,1% en casos largos sin mitigación (Mount Sinai 2025). Las tasas de alucinación descienden de forma considerable con la generación aumentada por recuperación y un prompting adecuado, pero nunca llegan a cero.
¿Se pueden prevenir las alucinaciones de la IA?
Pueden reducirse de forma importante, pero no eliminarse. La generación aumentada por recuperación (RAG), las herramientas de validación de salida (Vectara HHEM, Guardrails AI, NeMo Guardrails, Patronus AI), los requisitos de citación de fuentes y la verificación humana reducen materialmente la tasa. El mecanismo estructural que produce las alucinaciones —generación estadística de texto sin una verdad fundamentada— no se ha resuelto a nivel de modelo.
¿Qué es la Ley de IA de la UE y se aplica a mi empresa?
La Ley de IA de la UE es la regulación de la Unión Europea sobre IA basada en niveles de riesgo, en vigor desde agosto de 2024 y con una aplicación escalonada hasta 2027. Se aplica a cualquier empresa que ofrezca sistemas o servicios de IA a clientes de la UE, con independencia de dónde esté radicada la empresa. Las sanciones alcanzan el 7,1 % de la facturación anual global por usos prohibidos de la IA. Las obligaciones de los sistemas de alto riesgo abarcan la IA en crédito, contratación, educación, aplicación de la ley e infraestructuras críticas.
¿Qué es el Marco de Gestión de Riesgos de IA de NIST?
NIST AI RMF 1.0 es un marco voluntario basado en el riesgo publicado por el Instituto Nacional de Estándares y Tecnología de EE. UU. en 2023, al que se añadió en 2024 un perfil de IA generativa. Es el estándar de facto en EE. UU. para la gobernanza de la IA en las empresas y cada vez se cita más en la contratación pública federal.
¿Qué herramientas detectan realmente las alucinaciones de la IA?
Las herramientas de detección de alucinaciones de nivel de producción en 2026 incluyen Vectara HHEM (código abierto), Guardrails AI, NVIDIA NeMo Guardrails, Galileo, Patronus AI, la capa de grounding contextual de Glean, Arize, Fiddler y WhyLabs. Cada una adopta un enfoque diferente —comparación de patrones, puntuación estadística de confianza o evaluación modelo frente a modelo— y la mayoría de los equipos combinan dos o más.


