DeepScience — Artificial Intelligence

DeepScience · Artificial Intelligence · Digest quotidien

L'IA ment moins. Vous pensez moins. À quel prix ?

Fiabilité des agents, mémoire humaine et données médicales : trois angles sur la même question — peut-on faire confiance à l'IA ?

            July 03, 2026
          

Quarante-trois papiers dans la pile ce matin — et franchement, beaucoup de bruit pour peu de signal. Mais trois textes ont retenu mon attention, chacun à leur manière, parce qu'ils tournent autour du même nœud : la fiabilité. Fiabilité de l'IA, fiabilité de nous quand on l'utilise, fiabilité des données qu'on lui donne. Je vous propose de dérouler les trois ensemble.

Les histoires du jour

              01 / 03
            

Comment empêcher un agent IA d'entreprise d'inventer des faits

Votre IA consulte la base de données de votre entreprise — et invente quand même des réponses qu'elle n'y trouve pas.

C'est le problème quotidien de beaucoup d'équipes qui déploient des agents IA sur leurs systèmes internes : l'agent est censé répondre à des questions en s'appuyant sur la base de données de l'entreprise, mais il « hallucine » — il fabrique des informations plausibles qui n'existent pas dans la source. L'approche SCAIR, proposée dans ce papier, ressemble à donner à l'agent un plan de ville avant de l'envoyer naviguer. Concrètement : avant de raisonner, l'agent reçoit le schéma de la base de données — c'est-à-dire sa carte, sa structure, les catégories d'informations qu'elle contient et leurs relations. À chaque étape de son raisonnement, il revient vérifier que ce qu'il cherche à affirmer est cohérent avec cette carte. Si la carte dit qu'il n'y a pas de rue là, il n'invente pas de rue. Le raisonnement est aussi itératif : l'agent pose une question, reçoit une réponse partielle, affine, pose une nouvelle question — comme un enquêteur qui recoupe ses sources au lieu de conclure trop vite. Pourquoi ça compte ? Les entreprises accumulent des années de données dans des graphes de connaissances — relations entre clients, produits, contrats, fournisseurs. Si l'agent qui y navigue invente, les décisions prises sur cette base sont faussées. Le hic : le papier ne présente aucun résultat chiffré dans ce que j'ai pu lire — pas d'expérience sur des benchmarks publics, pas de comparaison avec une ligne de base. C'est une approche décrite, pas encore une performance mesurée. À suivre, mais avec le recul qui s'impose.

Glossaire

graphe de connaissances — Une base de données structurée en réseau, où les entités (personnes, produits, lieux) sont reliées entre elles par des relations typées — par exemple : « Jean travaille pour Acme », « Acme vend à Renault ».

hallucination — Quand un modèle de langage produit une information qui semble plausible mais est fausse ou inventée, sans signaler qu'il ne sait pas.

schéma — La structure d'une base de données : les types d'objets qu'elle contient et les relations autorisées entre eux — son plan, avant les données elles-mêmes.

Source: SCAIR: schema-conditioned agentic iterative reasoning for enterprise knowledge graphs

              02 / 03
            

Déléguer sa réflexion à l'IA tous les jours : ce que ça fait au cerveau

Et si utiliser ChatGPT à la place de chercher vous-même, c'était un peu comme prendre le bus tous les jours au lieu de marcher — confortable, mais avec un coût invisible ?

Ce papier ne présente pas d'expériences en laboratoire. C'est une réflexion théorique, adossée à la psychologie cognitive et aux neurosciences de l'apprentissage. Je vous le résume parce que l'argument mérite d'être entendu, même sans données fraîches derrière. L'auteur distingue deux choses que l'on confond souvent : utiliser un outil pour produire un résultat, et apprendre. Quand vous demandez à un modèle de langage de vous rédiger une synthèse, vous obtenez un résultat. Mais votre cerveau n'a pas construit la structure de connaissances que cette synthèse représente. Il n'a pas encodé, récupéré, organisé — les trois étapes qui forgent ce qu'on appelle l'expertise. L'analogie proposée est musculaire : la mémoire biologique est un muscle. Si vous ne la sollicitez pas — si vous externalisez systématiquement la recherche, le résumé, la décision — elle s'atrophie. L'auteur parle de « dette cognitive » : une accumulation de raccourcis qui allège le quotidien mais creuse un déficit de compétence à long terme. Pourquoi ça compte pour vous ? Parce que si vous travaillez dans un domaine d'expertise — droit, médecine, ingénierie, design critique — votre valeur tient à votre jugement indépendant. Ce jugement se construit dans la friction, pas dans le confort. Le hic, et il est important : ce papier n'a pas de données empiriques propres. Il mobilise des cadres existants de psychologie cognitive, mais aucune expérience ne mesure directement l'effet de l'usage de l'IA générative sur la mémoire à long terme. C'est une hypothèse bien argumentée — pas encore une démonstration. La recherche empirique sur ce sujet est, franchement, encore très mince.

Glossaire

externalisation cognitive — Le fait de déléguer une tâche mentale — se souvenir, calculer, rédiger — à un outil externe plutôt que de la traiter soi-même.

encodage — En psychologie de la mémoire, le processus par lequel une information est transformée en souvenir durable — ça nécessite un effort actif, pas une lecture passive.

Source: Beyond Prompting: Biological Memory, Cognitive Offloading, and Human Expertise in the Age of GenAI

              03 / 03
            

Des hôpitaux qui entraînent une IA ensemble sans s'échanger leurs données patients

Un hôpital de Lyon et un de Marseille veulent apprendre ensemble à détecter un cancer — mais ni l'un ni l'autre ne veut montrer ses dossiers médicaux à l'autre.

C'est le casse-tête central de l'IA médicale : les modèles sont meilleurs quand on les entraîne sur beaucoup de données variées, mais les données médicales sont privées par nature, souvent protégées par la loi, et les hôpitaux ne peuvent pas simplement se les envoyer. L'apprentissage fédéré — federated learning en anglais — propose une sortie de ce dilemme. Voici comment ça fonctionne, avec une analogie culinaire : imaginez que dix cuisiniers de dix villes différentes veulent mettre au point une recette ensemble, mais refusent de partager leur carnet de recettes. Alors ils partagent uniquement leurs observations — « j'ai ajouté du sel, le résultat était trop salé » — et un coordinateur central combine ces retours pour améliorer la recette commune. Chaque cuisinier garde son carnet fermé. Dans le cas médical : chaque hôpital entraîne un modèle localement sur ses propres données. Il envoie non pas les données, mais les ajustements du modèle — les modifications mathématiques apprises. Un serveur central les agrège et renvoie un modèle amélioré à tous. Pourquoi ça compte ? Un modèle entraîné sur des données de dix hôpitaux différents — âges, pathologies, équipements variés — généralise mieux qu'un modèle enfermé dans un seul centre. Le hic, et soyons honnêtes : ce papier est une revue narrative sans expérience propre. Il ne présente aucun résultat mesuré. Les défis qu'il identifie — hétérogénéité des données entre hôpitaux, risques de cybersécurité sur les échanges de modèles, absence de validation clinique réelle — restent largement non résolus. C'est le portrait d'un chantier prometteur, pas d'un chantier terminé.

Glossaire

apprentissage fédéré — Une méthode d'entraînement où plusieurs acteurs (hôpitaux, appareils) entraînent un modèle localement et partagent uniquement les ajustements appris — pas les données brutes.

modèle — Dans ce contexte, un programme mathématique entraîné à reconnaître des patterns — par exemple, des signes précoces d'une maladie sur une image médicale.

Source: APRENDIZADO FEDERADO EM DIAGNÓSTICO MÉDICO POR INTELIGÊNCIA ARTIFICIAL TREINAMENTO COLABORATIVO ENTRE HOSPITAIS SEM COMPARTILHAMENTO DE DADOS CONFIDENCIAIS

La vue d'ensemble

Ce que ces trois textes partagent, c'est une même tension : l'IA devient plus utile, mais l'utilité a un prix caché. SCAIR essaie de rendre les agents moins menteurs en les contraignant à consulter une carte avant d'avancer — une forme de discipline architecturale. Le papier sur la mémoire biologique nous rappelle que déléguer à ces agents a un coût cognitif que personne ne mesure encore sérieusement. Et l'apprentissage fédéré ouvre une voie pour entraîner des modèles médicaux sans briser la confidentialité — mais la route est encore longue. Ce qui me frappe : les trois sujets sont en réalité des versions du même problème — comment faire en sorte que l'IA serve sans trahir, sans inventer, sans appauvrir. On parle beaucoup de puissance des modèles. On parle encore trop peu de leurs garde-fous. C'est là, je crois, que se joue l'essentiel du travail de recherche en ce moment.

À surveiller

Sur l'apprentissage fédéré médical, surveillez les publications autour de l'initiative MELLODDY — un consortium pharmaceutique européen qui a publié des résultats sur l'entraînement fédéré sur des données de criblage moléculaire. Sur la question de la mémoire et de l'IA, la vraie percée sera empirique : une étude longitudinale qui suit des professionnels sur plusieurs années avec et sans usage intensif d'IA générative. Personne ne l'a encore publiée. Quand elle sortira, ce sera un papier à ne pas rater.

Pour aller plus loin

Bonne lecture — et si vous avez une question sur l'un de ces sujets, répondez directement à ce mail. À demain. — JB

DeepScience — Intelligence scientifique interdisciplinaire
deepsci.io

Unsubscribe