En ECTRIMS 2025, médicos y científicos de datos presentaron ejemplos concretos de cómo los conocimientos de la IA pueden transformar los fragmentados historiales médicos electrónicos en sólidos registros de grado de investigación para la esclerosis múltiple (EM). Los nuevos métodos automatizan la abstracción a partir de notas no estructuradas e informes de resonancia magnética, lo que permite una medición escalable de las recaídas, la progresión de la discapacidad y los patrones de tratamiento. El trabajo descrito por Rebekah Foster y John Foley ilustra implantaciones prácticas, asociaciones de proveedores y arquitecturas técnicas que llevan los conocimientos de la IA de los proyectos piloto al uso clínico y normativo. A continuación se presentan breves resúmenes basados en pruebas que exploran las arquitecturas de los modelos, las estrategias de validación, los ecosistemas de proveedores y las implicaciones para la atención clínica y las partes interesadas del sector.
AI insights for EHR abstraction in multiple sclerosis: Modelo CHARM y creación de registros en el mundo real
La adopción de herramientas automatizadas de curación ha creado nuevas posibilidades para obtener datos estructurados a partir de contenidos de HCE históricamente desestructurados. Los datos de IA se refieren aquí a los elementos específicos extraídos: confirmación del diagnóstico, subtipo de enfermedad, recaídas, estimación de la EDSS, recuento de lesiones por resonancia magnética y plazos de tratamiento. El esfuerzo CHARM (Century Health Abstraction and Retrieval Model) presentado en ECTRIMS demuestra la viabilidad a escala, extrayendo la EDSS estimada para casi todas las visitas en una cohorte de HCE desidentificada de Utah que abarca de 2011 a 2025.
Planteamiento del problema: HCE fragmentada y variables ausentes
Las historias clínicas de EM suelen almacenarse en múltiples sistemas y dependen en gran medida de notas narrativas e informes radiológicos. Los registros tradicionales que dependen de campos estructurados o de la abstracción manual pierden matices clínicos críticos y limitan el tamaño de la cohorte. Los conocimientos de la IA permiten la recuperación automatizada de esos matices, lo que mejora el tamaño y la representatividad de la muestra.
- Elementos comunes que faltan en los registros manuales: descripciones de lesiones, secuencias de RM, tiempo de recaída.
- Oportunidad: recuperar los motivos de interrupción y las secuencias terapéuticas a partir de las notas de los clínicos.
- Impacto: ampliación de las cohortes y reducción del tiempo de análisis para los estudios de seguridad y eficacia.
CHARM optimizó un proceso basado en LLM para asignar frases en lenguaje natural a variables discretas. El ámbito de abstracción del modelo incluía el diagnóstico de EM, el subtipo de enfermedad, los detalles de la terapia y los motivos de interrupción, la EDSS estimada, las recaídas y los resultados de la RM. Los resultados más destacados del estudio incluyeron la estimación de la EDSS para el 97,9% de las visitas y una EDSS media derivada de 3,0; el 79,5% de los pacientes tenían al menos una recaída documentada en el conjunto de datos. Estas cifras son ilustrativas de cómo las perspectivas de la IA hacen que las métricas, de otro modo inaccesibles, estén disponibles para los análisis posteriores.
Elementos técnicos y flujos de trabajo
Las canalizaciones de abstracción de HCE de éxito combinan varias capas técnicas: ingestión y normalización, análisis sintáctico de textos con reconocimiento de entidades con nombre, alineación temporal de eventos y adjudicación basada en reglas para casos ambiguos. Las integraciones con API de proveedores y proveedores en la nube aceleran el despliegue, pero la gobernanza es crucial para mantener la reproducibilidad.
- Introducción de datos: desidentificación y normalización seguras en todos los sistemas hospitalarios.
- Modelos lingüísticos: LLM ajustados y clasificadores de conjuntos para la extracción de entidades.
- Reglas de adjudicación: heurística para conciliar declaraciones contradictorias en notas e informes de diagnóstico por imagen.
Desde el punto de vista de la implantación, las asociaciones con proveedores de tecnología sanitaria establecidos facilitan la integración. Los servicios en la nube de Microsoft y Google Health suelen proporcionar servicios básicos de computación y gestión de datos. Soluciones específicas de proveedores como IBM Watson Health y Siemens Healthineers aportan cadenas de herramientas de procesamiento de imágenes para la normalización de informes de IRM. La estrecha colaboración con grupos clínicos como Rocky Mountain MS Clinic y empresas de datos como Nira Medical agiliza la validación clínica y la implementación pragmática.
Un ejemplo concreto: una consulta de neurología de tamaño medio se asoció con una empresa emergente de análisis para realizar una abstracción al estilo de CHARM de cinco años de datos de HCE. En cuestión de semanas, la consulta identificó patrones inesperados de cambio de terapia y dos grupos de pacientes con progresión temprana de la discapacidad que no se habían registrado previamente en su registro manual. La consulta utilizó estos datos de IA para dar prioridad a determinados pacientes en las intervenciones de gestión de la atención.
Variable extraída | CHARM Rendimiento | Caso de uso clínico |
---|---|---|
EDSS estimada | Derivado de 97,9% de visitas | Estudios longitudinales de progresión de la discapacidad |
Recaídas | Documentado para el 79,5% de los pacientes | Eficacia y seguridad de los DMT |
Descriptores de lesiones por IRM | Presencia y localización automática de lesiones | Criterios de valoración por imagen en estudios reales |
Los puntos clave para los implementadores incluyen la desidentificación robusta, la validación iterativa clínico-en-el-bucle, y el monitoreo continuo de la deriva. Estos conocimientos de IA se vuelven realmente valiosos cuando se integran con análisis posteriores para la seguridad de los medicamentos, la eficacia comparativa y la mejora operativa. Visión final: la curación automatizada de la HCE desbloquea datos a escala, pero la gobernanza y la supervisión del médico siguen siendo los factores decisivos para un despliegue fiable.
Inteligencia artificial para generar resultados sintéticos y medidas de discapacidad en la EM
Uno de los avances más importantes de los que se informó en ECTRIMS fue la capacidad de producir medidas clínicas sintéticas -sobre todo puntuaciones EDSS sintéticas- derivadas de notas no estructuradas. Estos conocimientos de IA permiten a los investigadores cuantificar las trayectorias de la discapacidad sin necesidad de escalas de ensayo estandarizadas registradas en cada visita. Los resultados sintéticos amplían el alcance analítico más allá de los ensayos estrictamente controlados para abarcar poblaciones heterogéneas del mundo real.
Por qué son importantes las medidas sintéticas
Las puntuaciones sintéticas de la EDSS y los criterios de valoración derivados de forma similar abordan una importante carencia: los entornos de atención observacional rara vez registran métricas de resultados estandarizadas a intervalos constantes. La IA ayuda a inferir señales de progresión, lo que facilita la investigación comparativa de la eficacia y la farmacovigilancia en cohortes más grandes y representativas.
- La EDSS sintética permite modelar la trayectoria vital de la progresión de la enfermedad.
- Permite realizar análisis de seguridad en poblaciones de pacientes más amplias, incluidos los grupos desatendidos.
- Permite la evaluación retrospectiva del impacto de las nuevas terapias en el mundo real antes que los registros prospectivos.
La validación práctica proviene de los estudios de concordancia que comparan la EDSS sintética con las puntuaciones asignadas por el clínico en subconjuntos en los que se dispone de ambas. En la cohorte de Utah, la EDSS derivada coincidió con las impresiones clínicas en un alto porcentaje, lo que permite confiar en los análisis de tendencias longitudinales. Además, las recaídas sintéticas identificadas por modelos de tipo CHARM permiten una rápida detección de señales de seguridad para terapias biológicas, como los tratamientos de células B, que representaron el 84,1% de los pacientes tratados en la cohorte.
Consideraciones reglamentarias y metodológicas
Los organismos reguladores aceptan cada vez más las pruebas del mundo real cuando los métodos son transparentes y están validados. Para que los resultados sintéticos sean aceptables para su uso regulatorio o por los pagadores, el proceso de generación debe ser auditable, reproducible y estar anclado a la verdad clínica siempre que sea posible. Esto requiere una documentación sólida de los datos de entrenamiento del modelo, las métricas de rendimiento y los resultados de la adjudicación del clínico.
- Linaje del modelo documental y corpus de formación.
- Informar de la sensibilidad, especificidad y calibración de los criterios de valoración clave.
- Incluir la adjudicación por un clínico y cohortes de validación ciegas.
Los proveedores y socios, como IQVIA y Tempus, aportan experiencia en la generación de pruebas reales de calidad reglamentaria y pueden ayudar a poner en práctica marcos analíticos. La colaboración con patrocinadores farmacéuticos como Biogen y Roche suele centrarse en la armonización de criterios de valoración y la vigilancia posterior a la comercialización. Los agentes del sector también deberían considerar la validación entre proveedores utilizando marcos descritos en recursos como los artículos sobre observabilidad y riesgo de la IA disponibles para los equipos técnicos.
Caso de ejemplo: un equipo de farmacovigilancia utilizó recuentos de recaídas sintéticas para detectar un aumento de acontecimientos adversos tras un cambio en el formulario. La colaboración con los médicos del centro confirmó la señal, lo que dio lugar a una revisión específica de los historiales y a una rápida comunicación de seguridad. La velocidad y la escala de esa detección ilustran cómo los conocimientos de la IA proporcionan capacidades de alerta temprana que antes eran inalcanzables.
Visión esencial: las medidas sintéticas deben tratarse como instrumentos validados y no como resultados de caja negra. Una gobernanza adecuada y una validación transparente convierten los conocimientos de IA en pruebas creíbles para médicos, reguladores y patrocinadores.
Información sobre IA para las partes interesadas del sector: Farmacia, sistemas sanitarios y proveedores de tecnología
Los conocimientos de la IA modifican las prioridades de varios grupos interesados en la investigación y el tratamiento de la EM. Las empresas farmacéuticas obtienen mejores pruebas de seguridad y eficacia. Los sistemas sanitarios obtienen herramientas de gestión de enfermedades a nivel poblacional. Los proveedores de tecnología ofrecen canales integrados para hacer operativa la abstracción de la HCE. La coordinación de estas partes interesadas requiere propuestas de valor claras y normas de interoperabilidad.
Aplicaciones específicas para las partes interesadas
Cada parte interesada utiliza los conocimientos de la IA de forma diferente, y el éxito de su implantación depende de la armonización de los incentivos y las capacidades técnicas. Por ejemplo, los pagadores pueden hacer hincapié en el coste de la atención y los resultados funcionales, mientras que los patrocinadores se centran en la integridad de los criterios de valoración y la comparabilidad de las cohortes.
- Pharma (Biogen, Roche): pruebas posteriores a la comercialización, ampliaciones de la etiqueta y enriquecimiento de los ensayos.
- Sistemas sanitarios y clínicas: gestión de la salud de la población e iniciativas de mejora de la calidad.
- Proveedores tecnológicos (Microsoft, IBM Watson Health, Siemens Healthineers, Google Health): infraestructura, análisis de imágenes y gobernanza de modelos.
Las integraciones entre estos grupos suelen implicar a proveedores de la nube y plataformas especializadas en IA sanitaria. Las iniciativas sanitarias de Microsoft y las herramientas de diagnóstico por imagen de Google Health proporcionan capacidades básicas. Philips Healthcare y GE Healthcare contribuyen a la interoperabilidad de los dispositivos de imagen y al cumplimiento de la norma DICOM. Por su parte, IQVIA y Tempus ofrecen servicios analíticos y de armonización de datos a gran escala, lo que permite a los patrocinadores y a los sistemas sanitarios ampliar sus conocimientos en todas las regiones.
Partes interesadas | Uso principal de los conocimientos de la IA | Proveedores/socios representativos |
---|---|---|
Farmacia | Validación de criterios de valoración en el mundo real, vigilancia de la seguridad | Biogen, Roche, IQVIA |
Sistemas sanitarios y clínicas | Gestión de poblaciones, apoyo a la toma de decisiones clínicas | Clínica de EM de las Montañas Rocosas, Nira Medical |
Proveedores de tecnología | Infraestructura en nube, análisis de imágenes, despliegue de modelos | Microsoft, Google Health, IBM Watson Health, Siemens Healthineers, Philips Healthcare, GE Healthcare |
Los proyectos piloto de colaboración suelen demostrar su valor rápidamente. Por ejemplo, una asociación piloto entre una clínica de neurología y un proveedor de servicios en la nube utilizó información de IA para identificar a pacientes de alto riesgo para la gestión de la atención, lo que redujo los días de hospitalización no planificados. El proyecto aprovechó las API de proveedores existentes y la información se integró en los flujos de trabajo de los médicos a través de un panel de apoyo a la toma de decisiones.
- Mejor práctica: desarrollar conjuntamente métricas de rendimiento e indicadores clave de rendimiento con todos los grupos interesados.
- Mitigación de riesgos: abordar la soberanía de los datos, la dependencia del proveedor y la reproducibilidad con salvaguardias contractuales y técnicas.
- Escala: empezar con proyectos piloto locales, validar con criterios de valoración clínicos y, a continuación, ampliar a todos los sistemas.
Las lecciones de implementación incluyen dar prioridad a la interoperabilidad y mantener a los médicos comprometidos a través de bucles de retroalimentación frecuentes. Las empresas también deben abordar los riesgos de la IA de terceros y los marcos de cumplimiento; recursos como los artículos sobre el riesgo de la IA de terceros y el cumplimiento en la era de la IA proporcionan orientación práctica para los gestores de riesgos y los ingenieros. Conclusión: alinear los incentivos y los requisitos técnicos entre las partes interesadas acelera la conversión de los conocimientos de IA en resultados clínicos y comerciales cuantificables.
Validación técnica, observabilidad y ciberseguridad de los conocimientos sobre IA para su implantación en el ámbito clínico
La transición de prototipos de investigación a herramientas de calidad clínica requiere rigurosos procesos de validación, observabilidad y controles de ciberseguridad. El rendimiento de los modelos debe supervisarse continuamente para detectar desviaciones, sesgos y alucinaciones. Los marcos de observabilidad ayudan a garantizar que los conocimientos de la IA sigan siendo reproducibles y explicables a pesar de los cambios en las prácticas de documentación clínica.
Prácticas de validación y observabilidad
La validación comienza con los conjuntos de datos retenidos y la validación externa entre centros. Se extiende a la supervisión posterior al despliegue, en la que los resultados del modelo se comparan con las adjudicaciones de los médicos y las medidas de resultados. La observabilidad incluye el registro de las entradas, las decisiones del modelo y las métricas de desviación para permitir el análisis de la causa raíz cuando aparecen discrepancias.
- Antes de la implantación: validación entre sitios, evaluación de sesgos y controles de explicabilidad.
- Después de la implantación: detección de desviaciones, reciclaje periódico y retroalimentación de los médicos.
- Auditabilidad: modelos versionados, instantáneas de conjuntos de datos y vías de decisión documentadas.
Las consideraciones de ciberseguridad son igualmente vitales. Las canalizaciones derivadas de la HCE manejan datos sanitarios sensibles y deben ajustarse a las mejores prácticas de cifrado, control de acceso y respuesta a incidentes. Los recursos publicados sobre alucinaciones de IA y ciberseguridad proporcionan escenarios de ataque prácticos y mitigaciones para los equipos responsables de los sistemas de producción. Además, es necesario prestar atención a las dependencias de terceros y a la postura de seguridad de los proveedores; una revisión específica del riesgo de la cadena de suministro suele evitar infracciones embarazosas.
Zona | Controles clave | Preocupaciones pertinentes |
---|---|---|
Validación del modelo | Cohortes de validación externa, adjudicación por clínicos | Sobreajuste, sesgo específico del lugar |
Observabilidad | Registro de entrada/salida, detección de deriva | Degradación silenciosa, cambios no documentados |
Ciberseguridad | Cifrado, control de acceso, manuales de incidencias | Exfiltración de datos, manipulación de modelos |
Los proveedores experimentados pueden respaldar estos controles: los proveedores en la nube y las empresas como Microsoft y Google Health ofrecen herramientas integradas de observabilidad y seguridad. Los proveedores independientes centrados en la observabilidad de la IA y las pruebas de adversarios pueden complementar las capacidades internas. La aplicación práctica también se beneficia del compromiso a nivel político, incluida la alineación con las normas y la educación de las partes interesadas sobre los límites del modelo y la incertidumbre.
- Recomendación operativa: desplegar modelos inicialmente en modo consultivo con revisión clínica obligatoria.
- Recomendación de seguridad: realizar auditorías periódicas de red teaming y de terceros para los componentes de los proveedores.
- Recomendación sobre gobernanza: mantener juntas de gobernanza interdisciplinarias que incluyan a médicos, científicos de datos y responsables de seguridad.
Ejemplo: un sistema hospitalario implantó un canal de abstracción al estilo de CHARM en un entorno de estricto control de acceso. Tras un periodo de observabilidad de seis meses y una auditoría de seguridad específica, el sistema pasó al modo de apoyo a la toma de decisiones para las reuniones de revisión terapéutica. Los registros de observabilidad permitieron realizar mejoras precisas en el rendimiento de la extracción de entidades, reduciendo los falsos positivos en la detección de recaídas en un margen cuantificable.
Idea final: la validación, la observabilidad y la seguridad sólidas no son opcionales, sino que constituyen la base que convierte los conocimientos de la IA en instrumentos clínicos fiables.
Nuestra opinión
Los conocimientos de la IA ofrecen ahora una vía pragmática para convertir las HCE fragmentadas en pruebas de alto valor en el mundo real para la esclerosis múltiple. El ejemplo de CHARM y el trabajo debatido por los expertos demuestran que los resultados sintéticos, la abstracción automatizada y las canalizaciones de validación escalables pueden proporcionar métricas clínicamente relevantes a escala. La combinación de la infraestructura en la nube, las capacidades de los proveedores y la supervisión de los médicos es la receta práctica para lograr un impacto.
Recomendaciones estratégicas para las partes interesadas
Para los patrocinadores y los sistemas sanitarios que deseen aprovechar los conocimientos de la IA, la estrategia es sencilla: dar prioridad a los proyectos piloto que incluyan la adjudicación por parte de los médicos, seleccionar pilas de proveedores interoperables y comprometerse con la observabilidad y las prácticas de seguridad. La colaboración con socios establecidos, ya sean proveedores en la nube o proveedores especializados en atención sanitaria, acelera la obtención de valor.
- Empiece con proyectos piloto bien definidos que respondan a una pregunta clínica o normativa clara.
- Implicar a los médicos desde el primer día para definir normas de referencia y reglas de adjudicación.
- Invierta en observabilidad, documentación y seguridad para mantener la confianza y el cumplimiento.
Los recursos prácticos y las lecturas complementarias son abundantes y deben ser consultados por los responsables técnicos. Entre los temas de interés figuran los costes y las estrategias de gestión de la IA, los riesgos de la IA para terceros y la postura de ciberseguridad para los sistemas de IA. Para los equipos que deseen ampliar su competencia técnica, los materiales sobre arquitectura de observabilidad de la IA y pruebas prácticas de IA ayudan a salvar la distancia entre el prototipo y la producción. Entre los enlaces de ejemplo que proporcionan un contexto técnico y estratégico se encuentran los artículos sobre costes y estrategias de gestión de la IA, riesgos de la IA para terceros y arquitectura de observabilidad de la IA.
Por último, la colaboración del sector con proveedores establecidos -Microsoft, IBM Watson Health, Siemens Healthineers, Google Health, Philips Healthcare, GE Healthcare- y socios orientados a la investigación como IQVIA, Tempus, Biogen y Roche seguirá siendo fundamental para ampliar los conocimientos de IA. Estas alianzas combinan la perspectiva clínica, los conocimientos normativos y el alcance tecnológico para que los registros basados en IA sean útiles y cumplan las normativas.
- Acción inmediata: identificar un proyecto piloto de 6-12 meses utilizando la abstracción automatizada para un resultado definido de EM.
- Medida a medio plazo: validar los resultados sintéticos con respecto a las métricas asignadas por los médicos y publicar los métodos en aras de la transparencia.
- Acción a largo plazo: integrar los conocimientos en los itinerarios asistenciales y las presentaciones reglamentarias como pruebas fiables y auditables.
Invitar a la reflexión: las partes interesadas deben sopesar la velocidad y la escala que ofrecen los conocimientos de IA frente a la obligación de validar, proteger y gobernar esos sistemas. Cuando estas compensaciones se gestionan deliberadamente, los conocimientos de la IA se convierten en un acelerador esencial para una mejor atención, una investigación más receptiva y una vigilancia postcomercialización más inteligente. Se anima a los lectores a explorar los recursos técnicos y los estudios de casos de toda la industria para alinear sus próximos pasos con las prácticas probadas y las capacidades de los proveedores.
Otras lecturas y recursos técnicos: explore guías prácticas y estudios de casos sobre IA en sanidad, el papel de la observabilidad en la producción de IA y estrategias de gestión de costes y gobernanza de IA de fuentes y comunidades técnicas de confianza: Inteligencia artificial Gestión de EM, riesgos de la IA para terceros, Arquitectura de observabilidad de la IA, Costes y estrategias de gestión de la IA, y Alucinaciones de la IA y amenazas a la ciberseguridad.