Nous tenons à remercier Aurélien Couloumy, dirigeant de la société Novaa Tech pour sa contribution.
La santé comme tout secteur d’activité, comporte des activités de cœur de métier liées au soin des patients, ainsi que des services transverses rendant possible la réalisation de la mission.
Le secteur de la santé s’adresse à l’ensemble de l’humanité et de manière consubstantielle, est amené à collecter, traiter et analyser de la donnée massive.
Les données en question concernent autant la santé de la patientèle, que sa couverture assurantielle, ou bien encore la gestion des ressources (humaines, systèmes d’information, bâtiments, équipements, intrants, recouvrement…) de l’ensemble de la chaîne de valeur du secteur.
L’objet de cette contribution est de proposer un panorama synthétique des derniers développements en matière d’IA, notamment Générative dans les services de santé et, de manière liée, les besoins suscités par la data générée (collecte, traitement, modélisation). Celui-ci permettra ensuite de centrer le propos sur les transformations nécessaires pour les compétences de la filière, afin d’accompagner ces évolutions.
I. Derniers développements en matière d’IA : application aux services de santé
Les progrès de l’IA, notamment générative sont fulgurants. Au cours des six derniers mois de l’année 2023, leur capacité a été multipliée par 200 A la différence des précédents algorithmes, l’IA générative peut traiter des données de nature différente : en associant par exemple des fichiers vidéo avec des données textuelles et des données quantitatives, des profils de patients peuvent ainsi être finement catégorisés. Un tel applicatif peut ainsi se révéler particulièrement précieux lors d’interventions dans des situations de crise nécessitant des prises en charge de grande ampleur (ex. accidents, attentats).
A/ Qu’est ce que l’IA générative ?
L'IA générative (Gen AI) est un sous-domaine de l'apprentissage profond qui permet de générer des données de nature diverse (nombres, textes, images, etc.). Il peut s’agir en santé de :
• Générer de nouveau jeux de données tabulaires synthétiques dans le
cadre de tests médicaux ayant pour objet de
préciser la qualité du diagnostic. L’IA générative repose sur des
algorithmes pour automatiser des prises de décisions,
en usant de systèmes experts. Ainsi, si l’on se réfère au cœur de
métier, la qualité de diagnostic peut puiser dans des
bases de données réunissant des millions de cas présentant une même
pathologie, augmentant ainsi la compétence des
équipes médicales à une mesure dépassant très significativement le
nombre de cas qu’elles pourraient connaître à
l’échelle de leur propre carrière.
• De mettre en forme et synthétiser des comptes-rendus de rapports
d’expert, permettant d’arbitrer sur la prise en
charge de cas, à la lumière des données antérieures disponibles.
• De produire des images radiologiques, pouvant les associer à des
pathologies. L’IA générative connaît également des
applicatifs dans l’exécution de certains services de soins, notamment
des actes chirurgicaux accomplis par des robots.
Ces innovations ne récusent pas la compétence médicale humaine, elles en
amplifient plutôt la portée, en permettant à
des experts de faire bénéficier de la qualité de diagnostic, de
prescription voire d’intervention, sans limite
géographique ou de langue (L’augmentation de compétence avait été
annoncée par Helen Papagiannis en 2017, dans Augmented
Human).
B/ Approches
Quand on parle d’IA générative on fait souvent référence implicitement à un type de réseaux de neurones appelés Transformers qui permet (entre autres) cette génération d’information à partir de contenu.
Les tâches associées à ce type de modèle vont bien au-delà de la simple « génération » car elles permettent notamment les applicatifs suivants :
• Pour du texte : classifier, extraire, résumer, interpréter, etc.
• Pour des images : classifier, segmenter, détecter, etc.
Pour bien appréhender l’architecture de ces modèles, il faut saisir leur attribut « sur étagère », qui repose la superposition de briques technologiques pour accomplir de nouvelles tâches ou augmenter les capacités de tâches existantes : aussi par modèles de fondations, ces modèles pré-entrainés sur des données non-étiquetées sont particulièrement utiles car exploitables tel quels et capables d’une grande diversité d'actions. La programmation permet de les faire évoluer selon les typologies de données à y intégrer. C’est le cas des LLM (pour “Large Language Models”) les plus connus, qui génèrent du texte, permettent de traduire voire de prédire : Mistral, Llama ou encore GPT4 (il en est de même pour les modèles de vision).
C/ Pour quoi ?
Notre propos étant centré sur les activités servicielles de la santé, il
convient de restituer principalement des gains
d’efficience dans l’allocation des ressources.
• Bien comprendre les données : les modèles d’IA Générative constituent
de puissants leviers pour faire parler des
données de natures diverses autour d’une même problématique. En
combinant par exemple des données textuelles avec des
matériaux vidéo et des bases de données quantitatives, la spécification
des phénomènes ou situations abordées peut être
affinée.
• Prévoir, prédire, faciliter l’aide à la décision : les IA Génératives
permettent de faciliter la prise de décision sur
la base de routines intégrant la complexité. Il est toutefois essentiel
de rappeler le principe de responsabilité
associé à la prise de décision, laquelle décision ne peut être déléguée
à une intelligence artificielle qui demeure, en
l’état actuel du Droit, associée à une personnalité juridique
référente.
• Automatiser pour viser un gain en efficience opérationnelle : par la
masse de données collectées et traitées, les IA
Génératives permettent d’atténuer le risque d’erreur dans l’assemblage
des ressources, considérant le principe
d’optimisation sous contrainte.
D/ Avantages
Nous identifions des bénéfices tant pour le cœur des métiers de santé que
pour les services support, pouvant être
résumés ci-après :
• Efficacité : après avoir développé le principe d’efficience, les IA
Génératives permettent d’amplifier la réussite de
la mission, de fournir une valeur instantanée (possibilité d'automatiser
de nombreuses tâches).
• Capacité : avoir de bonnes performances avec de faibles exigences (peu
ou pas d'apprentissage court, même pour les
tâches expertes).
• Adaptabilité : les services peuvent être personnalisés pour s'adapter
à des cas ou des scénarios spécifiques (modèle
"unique").
• Évolutivité : le modèle est capable de s'adapter à un très grand
volume de données avec un temps de latence
raisonnable (entrées de taille et de forme très diverses).
E/ Limites
Nous les aborderons plus spécifiquement sous l’angle de la gestion des données, de la culture des organisations.
La gestion des données
• Le traitement peut être rendu plus complexe en raison de la mauvaise
qualité ou de l’aléa sur celle-ci (processus non
systématiques liés à des données non structurées).
• Taille et éparpillement : la longueur du contexte peut être
problématique et nécessiter des inspections plus
approfondies des propriétés des modèles ainsi que des stratégies de
regroupement avancées et personnalisées.
• Les réglementations peuvent constituer un obstacle : la
confidentialité des données ou l'abondance des données
sensibles peuvent créer d'autres obstacles tels que les contraintes
informatiques et commerciales et les délais de
développement.
• L'annotation peut être difficile en raison de l'indisponibilité des
experts (coût, désaccords possibles), du manque
d'outils ou de bonnes pratiques, ou bien encore de la difficulté à
trouver un modèle de données commun, pouvant
notamment être issu de la formation des experts.
La culture des organisations
S’agissant des experts, la confrontation des cultures en matière de Data, d’Intelligence Artificielle et de modèles, peut aboutir à quelques malentendus, considérant des formations différentes, des visions menant à des intuitions erronées, des attentes non-satisfaites ou bien encore, une pénurie d’expertise là où elle est cruciale. Des réorganisations peuvent s’avérer de ce fait, impératives.
Ces limites principalement managériales pourraient être complétées de limites techniques et technologiques. Elles seront abordées sous l’angle particulier des besoins en compétences en partie II.
F/ Cas d’usages
Nous partageons ci-dessous quelques cas d’usage observés sur le marché ces derniers mois.
• Dans le domaine des soins de santé, une clinique aux Etats Unis a, dès
l’année 2023, introduit massivement l’IA
générative de Microsoft (Copilot) à son personnel clinique, ses médecins
et travailleurs de la santé. L’objectif est de
permettre aux praticiens de gagner un maximum de temps dans les tâches
bureautiques chronophages afin de se concentrer
sur l’accompagnement de leurs patients.
• Dans le domaine de l’assurance, un spécialiste du marché médical et
responsabilités professionnelles hospitalières, a
développé des modèles pour mieux comprendre et normaliser les
événements, les causes et les responsabilités impliqués
dans ses différents dossiers de sinistres. Les LLM sont utilisés dans ce
cas pour améliorer la perception du risque et
la connaissance par l’entreprise de ses dossiers, à des fins de
provisionnement ou de prévention par exemple.
• Dans le domaine de l’oncologie, une startup lyonnaise propose une
plateforme permettant aux cliniciens de prédire le
pronostic des patients atteints de cancer. Les modèles de vision
associés à des algorithmes experts, permettent aux
oncologues de définir plus facilement un traitement personnalisé et donc
de garantir aux médecins et patients des
recommandations oncologiques rapides dès les premiers tests.
La révolution de l’IA générative présente une différence majeure par rapport aux précédentes révolutions industrielles et technologiques qui substituaient à l’homme, l’automatisation de tâches basiques mais préservaient la valeur ajoutée du travail intellectuel. Celui-ci se voit désormais parfois dépassé par certaines IA : revues de littérature exhaustives en recherche, traitement des données massives, recherches de jurisprudence ciblant l’optimisation des décisions de justice en Droit, augmentation de la qualité du diagnostic en médecine, basée sur des millions de cas, rédaction de documents, création artistique (musique, dessin, poésie…). Cette donne implique une réflexion compétences, que nous allons désormais aborder.
II. Quelles compétences pour accompagner le développement de l’IA générative dans le secteur de la santé ?
Une approche prospective suppose de mesurer l’importance relative des évolutions, en tenant compte de la permanence de certaines logiques d’action.
Le « passé récent » (au sens de Schwartz) nous a enseigné que la formation aux compétences mobilisant la technologie, pour être durablement déployables, devait reposer sur des fondamentaux relativement permanents.
En matière d’IA générative et de données pour les services de santé, les auteurs recommandent une attention particulière à :
• L’ingénierie des données
• La création et le suivi de la modélisation
• La capacité à normer et pérenniser un cadre informatique
• Une compétence juridique solide
• Une compréhension en matière de bilan énergétique
A. La collecte, le nettoyage et le tri des données. La permanence de ces compétences tient au fait que l’automatisation du traitement est souvent fragilisée par une inégale qualité des données entrantes, pouvant générer des erreurs de traitement et d’interprétation. Un premier ensemble de compétence repose donc sur la capacité à standardiser l’acquisition, la structuration et la mise à disposition de ces données, peu importe leur nature : tabulaire, textuelle, image, etc.
B. La modélisation : les IA Génératives permettent des développements avancés en matière d’automatisation, de génération ou de modélisation, lesquels suscitent des compétences relativement pérennes en matière d’architecture des modèles, de programmation afin d’intégrer des variables spécifiques, d’évaluation de ces modèles à travers des mesures scientifiques illustrant les tâches à accomplir, de rationalisation afin de les rendre les plus efficace tout en étant rapide. Il semble important de rappeler que ces compétences ne sont pas “techno-dépendantes” mais a contrario destinées à être mobilisées en des contextes évolutifs turbulents.
C. La capacité à normer et pérenniser un cadre informatique. Une compétence en matière de systèmes d'information qui, si elle n’apparaît pas au premier plan des effets visibles de l’IA générative, demeure essentielle pour fournir le soubassement technologique adéquat (infrastructures informatiques) aux nécessités techniques de l’IA Générative. En particulier un point d’attention doit être porté sur l’intégration de ces nouveaux services aux systèmes plus anciens, en garantissant en tout temps la sécurité du parc informatique.
D. Une compétence juridique solide en matière de tri et d’utilisation des données, ainsi que de propriété intellectuelle ou de responsabilité civiles professionnelles associés à ces modèles. En effet, si à l’échelle d’un territoire relativement homogène comme l’Europe, le cadre réglementaire peut être unique, le caractère mondial des collectes peut faire se côtoyer des normes différentes. Nous observons déjà des organisations faire jouer une concurrence entre zones du monde par le libéralisme des normes, pour y installer des sièges de décision. La même logique peut totalement prévaloir en matière de localisation d’une activité portant sur l’IA, laquelle serait amenée à collecter et stocker de la donnée, voire mobiliser des actifs relevant de la propriété intellectuelle. La capacité à agir et faire dire le Droit de la part de leurs co-contractants ou parties prenantes concernées, sera directement affectée par ce point. Les risques de cybercriminalité suscitent également des compétences juridiques capables de les encadrer, tant dans l’élaboration des lois, règlements et normes, que pour protéger les acteurs de leur occurrence. Une note de janvier 2024 de l’Institut Montaigne pointait précisément ce risque dit de “jailbreaking”, consistant à casser les barrières de sécurité des IA.
E. Une compétence en matière de bilan énergétique de la donnée. Parmi les exigences de communication extra-financière, les organisations doivent intégrer le bilan de gaz à effet de serre de leurs activités. La donnée, quand bien même stockée sur des serveurs en ligne, est une contributrice à ce bilan de gaz à effet de serre. Il a pu être qualifié le phénomène de « data bulimia » qui consiste à collecter et conserver des données inutilisées. L’IA en tant que système expert repose sur de l’apprentissage et progresse à mesure qu’elle engramme de la donnée, ce qui plaiderait plutôt pour sa conservation. Par ailleurs, l’avenant des modèles d’IA génératives à l’image des Large language Models (LLM) comme Mixtral, impose de par leur procédé d’entrainement et leur taille (plusieurs dizaines voire centaines de Go) des infrastructures toujours plus performantes (GPU, TPU, LPU), énergivores et nécessiteuses de composants rares qu’il convient de piloter en tout temps et pour lesquelles il faut aussi quantifier l’emprunte carbone.
Des compétences individuelles à la compétence collective, les services de santé devront œuvrer rapidement à la transformation des métiers pour perpétuer l’accomplissement de leur mission. L’IA Générative représente une formidable opportunité d’augmentation des performances de tous les maillons de la chaîne de valeur. Pour autant, le renforcement de la protection des systèmes d’information à l’encontre d’attaques malveillantes (cybercriminalité) semble constituer un prérequis hautement prioritaire à accomplir.
Ce papier s’est proposé de diffuser quelques évolutions récentes de l’IA Générative, appliquées aux services de santé. Il a pointé des enjeux majeurs en matière de transformation des compétences et de cybersécurité. Ils pourront être relevés au prix d’un accompagnement managérial puissant et volontariste, tant pour le partage du caractère stratégique et crucial de cette révolution, que pour l’intégration par les métiers, des compétences essentielles à leur évolution par l’IA Générative.