Libérer la puissance de l'IA : comment NMC Healthcare exploite les solutions cloud de Snowflake pour obtenir des informations basées sur les données

Résumé : L'adoption par NMC Healthcare de l'AI Data Cloud natif de Snowflake marque un changement stratégique vers des analyses centralisées et en temps réel qui améliorent la prise de décision clinique et l'efficacité opérationnelle. Cet article analyse la façon dont Snowflake s'intègre aux principaux fournisseurs de cloud et plateformes d'entreprise pour briser les silos de données, accélérer l'apprentissage automatique et assurer une gouvernance solide. Des exemples pratiques, des choix d'architecture et l'interopérabilité des fournisseurs sont présentés pour guider les responsables informatiques et les ingénieurs de données qui cherchent à rendre l'IA opérationnelle dans des environnements de soins de santé complexes.

Libérer l'IA avec Snowflake : La stratégie Data Cloud de NMC Healthcare

Le passage de systèmes cliniques fragmentés à une plateforme unifiée prête pour l'IA nécessite une architecture claire et un plan d'exécution pragmatique. NMC Healthcare a choisi Flocon de neige pour centraliser des ensembles de données disparates provenant des dossiers médicaux électroniques (DME), des systèmes d'imagerie, de la facturation et des outils d'engagement des patients. Cette consolidation permet une ingénierie cohérente des fonctionnalités et une itération rapide des modèles.

Trois principes de conception sont au cœur de l'architecture : l'évolutivité, la gouvernance des données et l'accès à faible latence. La séparation du stockage et du calcul de Snowflake prend en charge à la fois les archives historiques massives et le calcul élastique pour l'entraînement et l'inférence. Il en résulte un environnement dans lequel les data scientists peuvent travailler sur des modèles sans perturber le reporting opérationnel.

Composants de l'architecture et flux de données

Les éléments clés du déploiement de NMC Healthcare :

  • Flocon de neige en tant que plateforme de données centrale pour l'entreposage et le partage sécurisé des données.
  • Connecteurs vers les DSE sur site et les systèmes PACS pour les métadonnées d'imagerie.
  • Pipelines d'ingestion de données à l'aide d'outils ETL/ELT pour normaliser et enrichir les enregistrements.
  • Environnements de développement de modèles reliés à Snowflake par des connecteurs natifs.
  • Couches d'opérationnalisation permettant l'inférence au point de soins.

Ces composants sont orchestrés de manière à maintenir la lignée et à minimiser les doublons. Par exemple, un ensemble de données cardiologiques stockées dans Snowflake peut être utilisé à la fois pour l'analyse des cohortes et pour l'entraînement d'un modèle prédictif du risque de réadmission, en tirant parti des mêmes ensembles de caractéristiques.

Scénarios d'utilisation et avantages concrets

Des cas d'utilisation pratiques démontrent une valeur mesurable :

  • Assistance au triage en temps réel : Agrégation des notes de triage avec les données vitales pour une priorisation plus rapide des urgences.
  • Prévision de réadmission : Modèles formés à partir de données cliniques et de demandes de remboursement intégrées pour réduire les réadmissions à 30 jours.
  • Optimisation de la chaîne d'approvisionnement : Prévision de la demande liée à l'inventaire afin d'éviter les ruptures de stock des fournitures essentielles.

Dans chaque scénario, les caractéristiques de performance de Snowflake permettent à la fois une analyse ad hoc par les cliniciens et des travaux programmés par lots pour le recyclage des modèles. Le référentiel de modèles centralisé réduit les écarts entre les modèles de développement et les modèles de production.

Couche Rôle Technologies représentatives
Ingestion Collecte des données des DSE, de l'imagerie, de la télémétrie des appareils, des demandes de remboursement Fivetran, API personnalisées, interfaces HL7
Stockage et informatique Entrepôt de données et traitement consolidé Snowflake, Amazon S3, Azure Blob Storage
ML et analyse Développement d'un modèle, d'un magasin de fonctionnalités, d'un système d'information décisionnel (BI) Databricks, Snowpark, Tableau, Python

Les mesures opérationnelles font l'objet d'un suivi rigoureux. Par exemple, le délai de visibilité pour certaines tâches d'analyse est passé de plusieurs jours à quelques minutes après la centralisation. Les équipes chargées des données ont fait état de cycles d'itération plus rapides et d'une diminution des conflits de plate-forme.

  • Principaux résultats pour l'organisation : amélioration de la satisfaction des cliniciens, réduction du gaspillage et accélération de l'établissement des rapports de conformité.

Aperçu : La centralisation des données dans Snowflake a créé une source unique de vérité qui a accéléré le développement de l'IA et renforcé la gouvernance, permettant aux équipes d'étendre les analyses à l'ensemble du réseau d'établissements de NMC Healthcare.

LIRE  L'administration Trump élimine les restrictions de Biden sur les investissements en crypto-monnaies dans les plans 401(k).

NMC Healthcare Real-Time Analytics on Microsoft Azure and Amazon Web Services with Snowflake (en anglais)

La conception d'une résilience et d'une performance multi-cloud est essentielle pour un fournisseur national de soins de santé. NMC Healthcare a opté pour une approche qui s'appuie sur les éléments suivants Microsoft Azure et Amazon Web Services en tandem avec Snowflake afin d'équilibrer les besoins réglementaires, l'optimisation des coûts et la présence régionale.

L'architecture agnostique de Snowflake permet la réplication des données à travers les nuages. La stratégie adoptée consiste à utiliser des services spécifiques au nuage pour certaines charges de travail tout en conservant Snowflake comme moteur de requête central. Par exemple, les fichiers d'imagerie des patients peuvent résider dans Azure Blob Storage pour tirer parti de la proximité d'Azure avec certains centres de données hospitaliers, tandis que l'archivage et le calcul en masse peuvent être acheminés via AWS S3 pour des raisons de rentabilité.

Pourquoi une double stratégie d'informatique dématérialisée est-elle judicieuse ?

La répartition des charges de travail est motivée par de multiples raisons :

  • Localité réglementaire : Hébergement d'ensembles de données sensibles dans une région en nuage conforme aux réglementations locales en matière de protection de la vie privée.
  • Services sensibles aux temps de latence : Placer l'informatique à proximité des systèmes en contact avec les patients pour minimiser le temps d'aller-retour.
  • L'arbitrage des coûts : Sélection du nuage le plus rentable pour le stockage en vrac par rapport à la formation basée sur le GPU.

Les exemples incluent l'exécution d'un entraînement de modèle intensif en GPU sur des instances GPU AWS EC2, tandis que les points finaux de prédiction en temps réel pour les cliniques pourraient utiliser Azure Kubernetes Service (AKS) lié aux réseaux hospitaliers sur site pour une latence de réseau plus faible.

Modèles d'intégration et meilleures pratiques

Modèles d'intégration pratiques déployés chez NMC Healthcare :

  • La réplication inter-cloud : Utilisation des fonctions de réplication de Snowflake pour maintenir des copies de données synchronisées entre les fournisseurs de cloud.
  • Contrôles d'accès fédérés : Mise en œuvre de politiques cohérentes de RBAC et de masquage sur les ressources hébergées par Azure et AWS.
  • Pipelines pilotés par les événements : Exploiter les bus d'événements cloud-native pour déclencher des tâches ELT dans Snowflake pour une ingestion en temps quasi réel.

Sur le plan opérationnel, les métadonnées et le catalogue consolidés dans Snowflake ont permis aux ingénieurs de données de suivre la lignée à travers les nuages, évitant ainsi les problèmes de shadow IT qui surviennent généralement lorsque des départements individuels choisissent différents fournisseurs pour des raisons de commodité.

Fournisseur de services en nuage Utilisation principale au CMN Flocon de neige complémentaire
Microsoft Azure Hébergement de proximité pour les applications cliniques, intégration d'Active Directory Étapes externes, SSO basé sur AD
Amazon Web Services Archivage rentable, calcul par le GPU pour la formation Réplication entre nuages, étapes externes vers S3

Pour réduire les risques, NMC Healthcare utilise des versions canaris et des tests AB pour les déploiements de modèles. La validation en conditions réelles est effectuée en mode " shadow " dans les flux de travail cliniques avant le déploiement complet. Cette approche garantit la sécurité et fournit une piste d'audit bien documentée pour la conformité.

  • Liste de contrôle opérationnelle : calendrier de réplication, politiques de sauvegarde, surveillance des coûts et analyses de sécurité inter-cloud.

Aperçu : Un déploiement multi-cloud avec Snowflake comme point d'ancrage offre flexibilité et résilience, permettant à NMC Healthcare de placer les charges de travail là où elles ont le plus de sens tout en maintenant une couche d'analyse unifiée.

Intégration de Databricks, Tableau et Salesforce pour des informations cliniques et opérationnelles

Le rapprochement de l'ingénierie des données, de l'analyse avancée et des tableaux de bord opérationnels de première ligne nécessite une intégration délibérée. NMC Healthcare a combiné Les banques de données pour les pipelines de ML, Tableau pour le tableau de bord, et Salesforce pour l'engagement des patients et les flux de travail CRM. Ces intégrations convertissent les résultats des modèles en flux de travail exploitables pour les cliniciens et les administrateurs.

LIRE  Les dirigeants d'ECS partagent leurs points de vue sur la manière dont l'IA agentique pourrait révolutionner les secteurs de la défense et du renseignement

Databricks est principalement utilisé pour le traitement de données à grande échelle et pour l'exécution de tâches de formation distribuées. Les scientifiques des données utilisent Databricks pour développer et valider des modèles à l'aide de Spark, puis persistent les ensembles de fonctionnalités validées et les artefacts de modèles vers Snowflake. Tableau se connecte directement à Snowflake pour fournir des visualisations en temps quasi réel à travers les métriques opérationnelles et les KPI cliniques.

Flux de bout en bout, du modèle au tableau de bord

Un flux de production typique se présente comme suit :

  1. L'ingestion de données dans Snowflake à partir des DSE et des appareils.
  2. Ingénierie des fonctionnalités dans Databricks avec des résultats stockés dans Snowflake.
  3. Modèles enregistrés dans un registre de modèles et artefacts stockés référencés dans Snowflake.
  4. Visualisations de tableaux de bord dans Tableau qui interrogent Snowflake pour obtenir des prédictions actualisées.
  5. Déclencheurs opérationnels dans Salesforce pour la gestion des dossiers et la sensibilisation des patients.

Par exemple, un modèle prédictif signale les patients diabétiques à haut risque. Des tableaux de bord Tableau mettent en évidence les tendances régionales et Salesforce automatise les tâches de sensibilisation des coordinateurs de soins. Cette chaîne permet aux équipes cliniques d'être informées et de réduire le temps de triage manuel.

Considérations relatives à la gouvernance et à la reproductibilité

Les principales pratiques de gouvernance utilisées :

  • Versionnement du modèle : Stockage des métadonnées d'entraînement et des hyperparamètres dans Snowflake pour garantir la reproductibilité.
  • Contrats de données : Définir des schémas et des accords de niveau de service pour les pipelines de fonctionnalités entre les équipes.
  • Contrôles d'accès : Mise en œuvre de l'accès au moindre privilège entre Databricks et Tableau via les rôles Snowflake.

Ces pratiques empêchent la dérive du modèle et garantissent que les mesures du tableau de bord sont traçables à des sources de données spécifiques et à des versions du modèle. La direction utilise les tableaux de bord Tableau pour suivre l'adoption et l'impact sur les indicateurs clés de performance tels que la durée moyenne de séjour et les taux de réadmission.

Composant Fonction principale Modèle d'intégration
Les banques de données Pipelines de ML distribués et ingénierie des fonctionnalités Écrire des fonctionnalités dans Snowflake via JDBC/connecteur
Tableau Tableaux de bord exécutifs et cliniques Requêtes directes vers Snowflake avec mise en cache pour plus de performance
Salesforce Sensibilisation des patients et gestion des dossiers APIs déclenchées par des résultats d'emploi basés sur Snowflake

Parmi les exemples d'impact, on peut citer la réduction des goulets d'étranglement dans les services d'urgence lorsque les modèles de triage prédictif détectent plus tôt les admissions probables, et l'amélioration de la fidélisation des patients grâce à des actions de sensibilisation ciblées automatisées par Salesforce.

  • Liste de contrôle pour l'adoption : tableaux de bord instrumentés, formation des cliniciens, flux de travail automatisé des prédictions à l'action.

Aperçu : Lorsque Databricks, Tableau et Salesforce sont intégrés à Snowflake, les résultats prédictifs deviennent des leviers opérationnels plutôt que des artefacts analytiques isolés, entraînant des améliorations mesurables dans la prestation des soins.

Gouvernance, sécurité et interopérabilité IBM Watson-Oracle dans le domaine de l'IA pour les soins de santé

La sécurité et la gouvernance ne sont pas négociables dans le secteur de la santé. NMC Healthcare a mis en œuvre une approche stratifiée qui combine les concepts de sécurité de Snowflake avec des systèmes d'identité d'entreprise et des outils tiers tels que IBM Watson pour les services de PNL et Oracle des bases de données pour les systèmes transactionnels existants.

Snowflake offre des fonctionnalités telles que le masquage des données, le contrôle d'accès au niveau de l'objet et le chiffrement de bout en bout, qui constituent l'épine dorsale de la gouvernance. Ces fonctionnalités sont complétées par l'intégration de l'IAM de l'entreprise afin d'appliquer des politiques d'authentification et d'autorisation cohérentes entre les systèmes.

Politique, audit et conformité

Une gouvernance efficace au sein du NMC couvre plusieurs domaines :

  • Classification des données : Marquage des données en fonction de leur sensibilité et application de règles de masquage automatisées.
  • Pistes d'audit : Capture de l'historique des requêtes et des journaux de modifications pour l'examen médico-légal et les rapports de conformité.
  • Gestion du consentement : Veiller à ce que les métadonnées relatives au consentement du patient soient appliquées au moment de l'interrogation.
LIRE  Découvrir la puissance de l'IA : nouvelles perspectives et tendances

Par exemple, lorsque les chercheurs accèdent à des ensembles de données dépersonnalisées, des politiques de masquage automatisées garantissent que les informations personnelles ne sont jamais exposées. Les journaux d'audit stockés dans Snowflake permettent d'extraire rapidement les schémas d'accès lors d'un examen réglementaire.

Interopérabilité avec IBM Watson et Oracle

NMC s'appuie sur IBM Watson pour des tâches NLP avancées telles que l'extraction de notes cliniques et la normalisation de concepts. Les résultats de Watson sont acheminés vers Snowflake pour l'analyse en aval et l'entraînement des modèles.

  • Intégration d'Oracle : Les systèmes transactionnels hérités restent sur Oracle ; les flux de capture de données modifiées s'écrivent sur Snowflake pour maintenir les analyses à jour.
  • Gouvernance de la transformation : Les travaux d'ETL comprennent des étapes de validation pour s'assurer que les champs mappés conservent leur exactitude clinique.

Ces intégrations préservent la continuité historique tout en permettant une analyse moderne de l'IA. Le flux d'Oracle vers Snowflake comprend des journaux CDC, des couches de mise en scène et un rapprochement automatisé pour détecter les anomalies ETL.

Domaine de la gouvernance Contrôle mis en œuvre Avantage
Cryptage Cryptage au repos et en transit avec rotation des clés Conformité réglementaire et atténuation des violations
Gestion de l'accès Accès basé sur les rôles et SSO via l'IdP de l'entreprise Réduction du risque d'accès non autorisé

Les tests opérationnels comprennent des exercices d'équipe rouge et des tests de modèles adverses pour évaluer le comportement des systèmes en cas d'attaque. Les enseignements tirés de ces exercices sont pris en compte dans les cycles de correctifs et les plans d'intervention en cas d'incident.

  • Les éléments essentiels du manuel de sécurité : alertes automatisées, escalade des incidents et exercices de récupération des données.

Aperçu : Une gouvernance solide combinée à une intégration interopérable des systèmes IBM Watson et Oracle a permis à NMC Healthcare de moderniser l'analyse sans sacrifier la conformité réglementaire ou la lignée des données.

Opérationnalisation de l'IA générative et feuille de route future avec Google Cloud Platform et ses partenaires

À mesure que les capacités d'IA générative se développent, NMC Healthcare trace une voie prudente pour rendre ces modèles opérationnels de manière responsable. La feuille de route comprend l'utilisation sélective de grands modèles de langage, le partenariat avec des fournisseurs de services en nuage tels que Plateforme Google Cloudet en tirant parti d'un écosystème d'outils et de partenaires pour gérer le cycle de vie, l'observabilité et l'atténuation des biais.

Les modèles génératifs sont appliqués dans des contextes cliniques contraignants : résumer les notes de sortie, générer des documents d'information pour les patients et aider les cliniciens à synthétiser la littérature. Chaque application est régie par des garde-fous, un examen humain dans la boucle et un suivi pour détecter les hallucinations et les biais.

Écosystème de partenaires et outils

Pour rendre l'IA générative opérationnelle, le NMC fait appel à un réseau de partenaires et d'outils :

  • Modèle d'hébergement : Utilisation de l'outil Google Cloud AI pour le service de modèles gérés avec des points d'extrémité à faible latence.
  • Observabilité : Mise en œuvre de plateformes d'observabilité de l'IA pour suivre la performance des modèles et la dérive des données.
  • Validation par un tiers : Audits externes pour vérifier l'équité et la pertinence clinique.

Ces mesures garantissent que les résultats générés sont sûrs pour la consommation clinique et respectent les normes politiques. Par exemple, les documents destinés aux patients générés par les LLM sont soumis à l'approbation des cliniciens avant d'être distribués.

Étapes de la feuille de route et points de contrôle de la gouvernance

Les initiatives prévues sont les suivantes

  1. Opérationnaliser les registres de modèles et les pipelines de déploiement qui s'intègrent à Snowflake pour l'accès aux fonctionnalités.
  2. Accroître la capacité des GPU pour affiner les modèles nécessitant une adaptation clinique.
  3. Intégration de l'aide à la décision clinique (CDS) aux flux de travail des DSE pour des recommandations validées.

Les partenariats stratégiques avec les fournisseurs permettent d'accélérer ces étapes. Par exemple, l'intégration avec Vertex AI de Google Cloud Platform simplifie la gestion du cycle de vie des modèles et réduit les frais généraux opérationnels pour la mise à disposition des modèles.

Initiative Chronologie Mesure de la réussite
Documentation assistée par le LLM Pilotes de déploiement au troisième trimestre 30% réduction du temps de documentation du clinicien
Éducation automatisée des patients Déploiement progressif sur 12 mois Amélioration des scores de compréhension des patients

Afin d'élargir le partage des connaissances et des idées pratiques, les équipes ont référencé des ressources externes et des analyses contemporaines sur l'IA dans les soins de santé et les opérations. Les exemples incluent les cadres de mise en œuvre et les leçons tirées des déploiements de l'IA dans l'ensemble du secteur. D'autres lectures sur la maturité et la sécurité de l'IA sont disponibles auprès de sources externes telles que L'IA au service de la santé et du matériel sur Stratégies de cybersécurité de l'IA.

  • Liste de contrôle de l'état de préparation opérationnelle : approbation du conseil de gouvernance, résultats du projet pilote, boucles de rétroaction des cliniciens et suivi des coûts.

Pour conserver une longueur d'avance, NMC continue de piloter des technologies adjacentes et de consulter des études de cas sur l'adoption, le risque et l'intégration au marché. Des ressources telles que Intelligence d'entreprise Databricks et l'IA agentique dans les tâches cliniques des choix pratiques éclairés en matière d'orchestration et de sécurité.

Aperçu : Un déploiement mesuré de l'IA générative avec une intégration et une gouvernance solides des partenaires permet à NMC Healthcare d'exploiter des capacités avancées tout en protégeant la sécurité des patients et en maintenant la confiance des cliniciens.