Intelligence artificielle et santé animale

Pauline EZANNO; Sébastien PICAULT; Nathalie WINTER; Gaël BEAUNÉE; Hervé MONOD; Jean-François GUÉGAN

doi:10.20870/productions-animales.2020.33.2.3572

Articles

Pauline EZANNO, Sébastien PICAULT, Nathalie WINTER, Gaël BEAUNÉE, Hervé MONOD, Jean-François GUÉGAN

Vol. 33 No 2 (2020) 95-108

Publié : 15 septembre 2020

DOI : https://doi.org/10.20870/productions-animales.2020.33.2.3572

Chapeau

Les recherches à l’interface entre Santé Animale (SA) et Intelligence Artificielle (IA) sont en plein essor. Elles permettent de s’engager sur de nouveaux fronts de science en SA, de lever des verrous méthodologiques et d’identifier les défis de demain en agriculture. Portés par le regain d’intérêt récent pour l’IA, de nouveaux outils d’aide à la détection en médecine animale et d’aide à la gestion sanitaire émergent, ouvrant des horizons nouveaux pour la sécurité sanitaire.

Introduction

L’IA correspond à un large ensemble de théories et technologies mobilisées pour résoudre des problèmes de forte complexité logique ou algorithmique (Villani, 2018). Nous retiendrons ici une acception large de l’IA, en tenant compte des interactions et complémentarités avec les disciplines connexes que sont l’informatique, l’algorithmique, les mathématiques et les statistiques. Concept introduit dans les années 1950, notamment par A. Turing, nombre de méthodes ont été développées ou étendues relativement récemment avec l’amélioration des performances des ordinateurs. Ainsi, l’apprentissage automatique (« machine learning ») se développe dès les années 1980. Une des méthodes de l’IA les plus connues du grand public, elle correspond à analyser des données pour en déduire des règles à suivre, voire permet de s’autocorriger avec l’arrivée de nouvelles données. À partir des années 2000, avec l’essor des données massives (« big data ») et des infrastructures de calcul, l’apprentissage devient profond (« deep learning »), i.e. explore ces données massives que ne peuvent traiter les méthodes statistiques. Par ailleurs, des algorithmes apprenant sont développés, aboutissant par exemple aujourd’hui aux réseaux de neurones artificiels et aux machines vecteur support (SVM). Les développements récents se sont nourris des interfaces créées entre l’IA et les autres disciplines, comme par exemple la biomédecine, ainsi que des données massives issues de différents champs disciplinaires, notamment associés à la santé (Hosny et al., 2018 Karczewski et Snyder, 2018).

L’IA s’attache à adresser trois défis qui font également sens en SA : i) la compréhension d’une situation et de sa dynamique, telle qu’une dynamique épidémique ii) la perception de l’environnement qui se traduit en SA par la détection de patrons, de formes ou de signaux à différentes échelles iii) la prise de décision par l’ordinateur, ou, de manière plus réaliste, l’aide à la décision humaine (systèmes experts, aide au diagnostics, allocation de ressources…). Pour cela, un large panel de concepts et méthodes sont développés en IA (FranceIA, 2017), parmi lesquels les méthodes d’apprentissage, mais aussi les méthodes de résolution de problèmes complexes, d’automatisation de tâches ou de raisonnements, d’intégration d’informations provenant de sources hétérogènes, ou encore d’aide à la décision (figure 1).

Figure 1. Structure de l’article et positionnement de quelques thèmes de recherche en santé animale (en noir) et de concepts et méthodes d’intelligence artificielle utiles pour les développer (en vert).

Save View full size Expand inline Collapse inline

Une partie des recherches menées aux fronts de science en SA prend une ampleur nouvelle en mobilisant de telles méthodes d’IA, mais aussi par le développement de données massives. Ainsi, les recherches en SA bénéficient des avancées sur les méthodes d’apprentissage, par exemple en épidémiologie prédictive, en médecine de précision individualisée, et dans l’étude des relations hôtes × pathogènes (Zhang et al., 2017 Karczewski et Snyder 2018). Ces méthodes facilitent le diagnostic et la détection de cas, fiabilisent les prédictions et réduisent les erreurs, accélèrent les décisions, améliorent la précision des analyses de risque et permettent de mieux cibler les interventions (Saria et al., 2018). Les recherches en SA bénéficient aussi d’avancées scientifiques en IA sur la représentation des connaissances et la modélisation des raisonnements (Bedi et al., 2015), des processus décisionnels et de gestion de l’incertitude (Lynn, 2019), sur les parcours de vie des patients (Pinaire et al., 2017), en résolution de problèmes avec allocation de ressources sous contrainte (Vrakas et Vlahavas, 2008), sur les agents autonomes (Shakshuki et Reid, 2015) et les systèmes multi-agents (Roche et al., 2008) voire multi-niveaux (Picault et al., 2017), ainsi que sur la génération automatique de code informatique (Russell et Norvig, 2010). Ces avancées méthodologiques permettent ainsi des représentations plus réalistes et lisibles par des non informaticiens de systèmes biologiques complexes tels que rencontrés en SA, ainsi que la production de modèles pour anticiper l’effet de décisions de maîtrise ou de conduite à différentes échelles (animal, troupeau, région...).

Mener des travaux de recherche à l’interface entre IA et SA conduit aussi à identifier de nouveaux challenges pour l’IA, pour partie sur des thématiques communes avec la santé humaine, pour partie du fait des spécificités des recherches en SA (Ducrot et al., 2011), et qui peuvent constituer des verrous particuliers. Premièrement, le contexte agro- et socio-économique est crucial pour ces systèmes biologiques gérés par l’humain et sources de revenus (animaux de rente), et qui sont fortement soumis aux attentes sociétales en termes d’éthique et de bien-être animal (Connehaye et Duée, 2015). Les mesures conventionnelles de maîtrise des maladies animales peuvent ne plus être acceptables (par exemple l’abattage sanitaire, l’utilisation d’antibiotiques Hur et al., 2019). Des alternatives doivent être identifiées et évaluées, et l’IA peut y contribuer. Par exemple, le recours à une médecine vétérinaire individualisée est une alternative qui mobilise des méthodes d’IA ainsi que des données différentes de celles de la santé humaine (Behmann et al., 2016). L’intégration des données issues du séquençage massif en SA, incluant les technologies émergentes d’étude du métabolome et de l’épigénome, est aussi un challenge à relever rapidement (Suravajhala et al., 2016 Goldansaz et al., 2017). Deuxièmement, les interactions entre espèces, notamment entre faune domestique et sauvage, entraînent des risques infectieux particuliers (pathogènes partagés comme pour la peste porcine africaine, passage de la barrière d’espèce facilitée par des contacts fréquents). L’intensité de ces interactions pourrait croître du fait des actions seules ou combinées des pressions environnementales (artificialisation des terres et occupation par le bétail), démographiques (demande mondiale croissante en productions animales) et sociétales (conduite en plein air du bétail). Vu sous un autre angle, travailler sur des réseaux de maladies multi-espèces fournit des informations cruciales sur les mécanismes moléculaires sous-jacents (Anvar et al., 2011). Troisièmement, les populations animales sont soumises à des prises de décision récurrentes qui concernent aussi la gestion de la santé (commerce, mesures de maîtrise...) notamment pour les maladies non réglementées (décisions adaptatives des éleveurs). Les critères économiques et l’impact sur le revenu des éleveurs sont alors des indicateurs incontournables pour évaluer les stratégies de maîtrise, parfois en contradiction avec les attentes sociétales. Toutes ces spécificités font de l’interface entre IA et SA un thème d’intérêt pour stimuler de nouveaux travaux méthodologiques et lever certains des verrous auxquels sont confrontés les recherches en SA.

Sur la base d’une revue de la littérature des articles scientifiques à l’interface entre IA et SA publiés entre 2009 et 2019 (encadré 1), complétée d’entretiens conduits avec des chercheurs et enseignants-chercheurs français positionnés à cette interface (encadré 2), nous avons déterminé les grands domaines de recherche en SA dans lesquels l’IA était aujourd’hui mobilisée (figure 1). Nous avons exploré comment les méthodes d’IA contribuent à revisiter les questions de recherche en SA et permettent de lever des verrous méthodologiques. Nous avons également analysé comment des questions de recherche en SA interrogent et stimulent de nouveaux travaux en IA. Nous nous attacherons ici à discuter de la collecte, de l’organisation et de l’accessibilité aux données en SA (partie 1), puis à discuter comment les méthodes d’IA nous permettent de revisiter notre compréhension des pathosystèmes (partie 2), à améliorer la détection de cas et le diagnostic à différentes échelles (partie 3), et à prévoir et scénariser le devenir des pathosystèmes pour en améliorer la gestion, faciliter les prises de décision, et stimuler les innovations (partie 4). Enfin, nous discuterons des freins et leviers possibles au développement de l’IA en SA (partie 5), avant de conclure sur des recommandations pour se saisir au mieux des enjeux que représente cette interface SA/IA (partie 6).

Encadré 1. Analyse bibliométrique systématique.

Les publications ont été recherchées dans PubMed et ISI Web of Knowledge pour la période allant de 2009 à 2019. Les mots-clés ont été recherchés dans les titres, mots-clés auteurs et résumés des publications. Seuls les articles en anglais ont été conservés. Dans ISI Web of Knowledge, toutes les bases de données ont été mobilisées, mais les catégories de recherche visiblement en dehors de la thématique ont été retirées pour limiter le nombre de résumés à parcourir. Les doublons ont été retirés (mêmes auteurs, titre, année, support) lors de la lecture des titres et résumés.

Mots-clés recherchés : (health OR disease OR pathogen OR epidem*) AND ("artificial intelligence" OR "machine learning" OR "multi-agent" OR "multilevel agent" OR "markov decision process" OR "hidden markov") AND (animal OR livestock OR cattle OR pig OR poultry OR wildlife) NOT cancer.

Les publications visiblement hors thème à la lecture des titres et résumés ont été retirées, puis à nouveau à la lecture des articles. D’autres publications qui ne ressortaient pas sur ces bases de données mais connues des auteurs pour être dans ce thème (connaissance des travaux des équipes concernées par ces publications) ont été rajoutées. Au final, 110 publications ont été retenues (tableau 1). La liste de ces références est disponible sur demande.

Tableau 1. Sélection des articles publiés à l’interface entre intelligence artificielle et santé animale.

Expand inline Collapse inline

Base de données	« *PubMed* »	« *Web of* *Knowledge* »	Total
Nombre d’articles identifiés	128	395	*
Sélection sur titres et résumés	35	58	77
Références complémentaires			33
Publications retenues			110

^*Il existait des doublons entre les deux bases de données, le total n’est donc pas calculable avant lecture des titres et résumés des publications.

Encadré 2. Conduite des entretiens.

Toutes les unités du Département Santé Animale (DSA) d’INRAE ont été contactées. Des personnes ont été ciblées sur avis des directeurs d’unité et des membres du groupe de travail. Des entretiens complémentaires ont été menés dans d’autres départements d’INRAE et hors d’INRAE, pour avoir une vision plus précise des forces et compétences en présence en France à l’interface IA/SA, de l’intérêt des scientifiques pour cette interface, et des illustrations de collectifs organisés à une interface comparable (dans le domaine de la santé s.l.).

À INRAE, au sein du DSA, ont été contactés : C. Citti, I. Oswald, P. Martin, D. Concordet et A. Bousquet-Mélou (Toulouse), S. Picault, G. Beaunée, A. Madouasse et P. Ezanno (Nantes), N. Winter (Tours), projet CaSciModOT (région Val-de-Loire), J.-F. Guégan (Montpellier). Au sein du département Mathématiques et Informatique Appliquées (MIA), ont été contactés : H. Monod (Chef du Département, Jouy-en-Josas), F. Garcia et T. Schiex (Toulouse), E. Vergu (Jouy-en-Josas). Par ailleurs, ont été contactés : C. Lannou (Chef du Département Santé des Plantes et Environnement (SPE), Jouy-en-Josas), C. Bastien (Chef du Département Ecologie des Forêt, Prairies et milieux Aquatiques (EFPA), Grand-Est-Nancy), et A. Franc (EFPA, Bordeaux), ainsi que R. Thiébaut (Inserm/Inria, Bordeaux), Charline Smadi (Irstea, Grenoble), et Maguelonne Teisseire (Irstea, Montpellier). Les entretiens abordaient les points suivants :

- Quelles recherches menées dans l’équipe en lien avec l’IA ? Quelle plus-value pour les recherches en SA ? Quel positionnement par rapport à la liste des thèmes retenus ?

- Ces recherches sont-elles menées en collaboration ? Quelles compétences clés sont mobilisées ?

- Quel est le principal verrou (données, compétences, méthodes, collaborations...) ?

- Quel front de science à cette interface IA/SA ? Positionné en SA (on peut aborder de nouvelles questions ou revisiter des questions) ou en IA (développement de nouvelles méthodes, nouveaux concepts) ?

- Quel exemple concret pour illustrer le propos ?

- Qui d’autre devrions-nous contacter ?

Les thèmes en IA retenus étaient les suivants :

- Représentation des connaissances : langage domaine-spécifique, ontologie.

- Méta-modélisation symbolique ou numérique, génération automatique de code informatique, adaptation de code en autonomie.

1. Collecter, organiser et rendre accessibles des données de qualité

Un point central pour les recherches en SA reste le lien aux données d’observation, lesquelles sont structurées entre échelles d’organisation du vivant, ainsi qu’entre échelles spatio-temporelles (Ezenwa et al., 2015). Les données d’intérêt sont diverses : elles peuvent concerner des zones plus ou moins grandes, des troupeaux, ou des groupes d’animaux (données épidémiologiques, de détention d’animaux et de mouvements commerciaux, météorologiques, parcellaires...). Elles peuvent aussi concerner l’animal lui-même, en lien avec le système de production (température corporelle, production et composition du lait, reproduction, poids, alimentation...) ou ses caractéristiques propres (données génomiques, métaboliques...). Certaines données existent déjà (mais ne sont pas toujours accessibles aux académiques), d’autres (métabolome par exemple) représentent un enjeu dont il convient de se saisir. Le processus de mondialisation et d’échanges d’animaux à large échelle conduit aussi à inclure le niveau global dans les recherches en épidémiologie quantitative et plus généralement en SA (transferts d’agents infectieux, génétique et gestion des races…).

L’ensemble de ces données massives et hétérogènes peuvent être collectées : i) automatiquement (capteurs, systèmes de vidéo-surveillance...) ii) spécifiquement pour certains animaux ou troupeaux lors de programmes de suivi de cohortes par exemple iii) réglementairement (mouvements commerciaux des bovins, plateforme d’épidémio-surveillance) iv) par des entreprises privées (mouvements des porcs, collecte du lait), et v) de manière ad hoc dans le cadre de projets de recherche. Cette caractéristique entraîne une très grande diversité de propriétés des données, et donc de leur gestion, accès et usages possibles.

Il convient de réfléchir aux futurs systèmes d’observation, de collecte et de gestion de ces données, et aux pratiques visant à une meilleure collaboration entre les parties-prenantes. Si la gestion des données a toujours été un élément important en recherche finalisée pour faciliter leur utilisation et leur valorisation, il s’agit aujourd’hui d’une question stratégique tant en recherche théorique que plus appliquée couplée aussi à un challenge technique (Pfeiffer et Stevens, 2015). Il apparaît nécessaire de rendre interopérables les sources hétérogènes de données, requérant des développements méthodologiques dédiés. Par ailleurs, une grande partie des données relève de la sphère privée, avec une propriété à caractère souvent hétérogène (propriétaires multiples, données non centralisées, données fermées), et parfois floue (méconnaissance du propriétaire réel de la donnée entre, par exemple, l’éleveur et le collecteur des données) ce qui tend à complexifier grandement l’accès aux données, interroge sur la propriété intellectuelle, et pose un certain nombre de questions en lien avec un Règlement Général sur la Protection des Données (RGPD) adapté à la SA dans le respect de la confidentialité des données mobilisées. Quel est le modèle économique pertinent au regard de la collecte de données ou de l’accès à des bases de données existantes ? Quid de l’ouverture des données de SA (dualité entre la notion de bien public et le caractère privatif de certaines données) pour rendre possible l’expérimentation en situations réelles et comparer les performances des algorithmes d’IA (Prospective, 2019) ? Lever ces interrogations faciliterait aussi la collecte de données ad hoc. L’IA, notamment par les systèmes experts et les systèmes multi-agents, aide à construire une représentation réaliste de systèmes biologiques complexes et se révèle ainsi un outil efficace pour favoriser la participation des acteurs d’une filière donnée à la prise de décision optimisée, voire l’évaluation de l’impact de modifications des usages et pratiques (Binot et al., 2015).

Permettre l’expérimentation des technologies IA sur des territoires est un enjeu crucial pour favoriser leur développement, valider leur performance et mesurer leur qualité prédictive (Prospective, 2019). En santé, l’accès simplifié à des structures génératrices de données permettrait d’expérimenter à plus grande échelle des solutions innovantes et accélérerait leur mise au point et leur évaluation. Une expertise conséquente existe (plateforme de données épidémiologiques, grandes cohortes, fermes expérimentales, zones ateliers...) qui pourrait être mise à profit. De plus, l’IA pourrait contribuer à revisiter les méthodes d’échantillonnage pour la collecte de données de terrain en santé et en épidémio-surveillance animale, en ciblant mieux et de manière dynamique les données à collecter tout en évitant les données colinéaires redondantes.

2. Apports de l’IA pour la compréhension des pathosystèmes

2.1. Mieux comprendre l’évolution des pathosystèmes à large échelle

Les méthodes d’apprentissage peuvent être utilisées pour réaliser des reconstructions phylogénétiques et ainsi proposer des scénarios évolutifs, notamment d’agents infectieux et de leurs modes de transmission. Ainsi, les modèles phylogénétiques offrent une perspective intéressante pour identifier les lignées bactériennes environnementales à fort potentiel infectieux (Bailly, 2017), ou encore prédire les espèces réservoirs et vecteurs arthropodes en jeu (Babayan et al., 2018). Ensuite, aller vers des modèles de niches plus phénoménologiques contribuerait à surveiller les infections émergentes et anticiper la diffusion épizootique ou épidémique d’agents infectieux. Des modèles multi-agents dans un contexte spatial explicite ont ainsi été développés pour des transmissions d’agents pathogènes vectorisés, et sont suffisamment ergonomiques pour être adaptés à des contextes particuliers (Roche et al., 2008). Enfin, des réseaux de neurones ont permis d’identifier le niveau d’introgression génétique entre des populations sauvages et des populations domestiquées dans un contexte spatialisé (Lek et Guégan, 2000), ce qui aide à comprendre la diffusion de gènes dans les systèmes hôtes × pathogènes à multi-espèces hôtes. Notons ici que plusieurs de ces travaux révèlent le caractère relativement ancien de cette recherche en IA. Ces recherches ont souvent permis d’identifier des signaux (par exemple la tendance d’introgression génétique) voire des patrons ou des propriétés particulières (par exemple l’importance de la densité-dépendance dans la transmission d’infections par des insectes vecteurs) moins visibles ou absents dans les traitements statistiques plus conventionnels.

2.2. Garantir fiabilité, reproductibilité et flexibilité des modèles épidémiologiques

Pour comprendre et prédire la propagation de pathogènes, il est utile de représenter de manière explicite et intégrative dans un modèle mathématique (équations) ou informatique (simulations) les mécanismes sous-jacents à la dynamique du pathosystème, et ce à différentes échelles (intra-hôte : Go et al., 2019 ; filières de production primaire : Ferrer Savall et al., 2016 territoire : (Qi et al., 2019) continent : (Buhnerkempe et al., 2014). Ces modèles dits mécanistes permettent d’anticiper les effets de mesures de maîtrise conventionnelles, mais aussi innovantes (nouvelles molécules candidates, capteurs, index de sélection génomique Ezanno et al., 2015). Cependant, ils requièrent d’intégrer des données et expertises multiples en biologie, épidémiologie, évolution, écologie, agronomie, économie, etc. Leur développement pose alors des enjeux de fiabilité, de transparence, de reproductibilité, et de flexibilité d’usage. De plus, ces modèles sont souvent développés de novo, mobilisant peu les modèles d’autres pathosystèmes. Enfin, ces modèles peuvent être considérés comme des boîtes noires par leurs utilisateurs finaux (gestionnaires de la santé) alors qu’ils reposent sur des hypothèses biologiques explicites mais souvent cachées dans le code ou les équations.

Bien qu’incontournables, les bonnes pratiques de programmation (Sandve et al., 2013) seules ne peuvent répondre à ces enjeux (Leek et Peng, 2015). L’approche la plus aboutie à ce jour en épidémiologie requiert encore d’écrire beaucoup de code (O’Hare et al., 2016). Des méthodes adaptées manquent pour faciliter le développement de ces modèles, notamment pour représenter des systèmes multi-échelles. Ainsi, les processus intra-hôtes sont rarement considérés pour prédire la propagation de pathogènes dans des populations, alors que l’hétérogénéité individuelle des hôtes est un facteur crucial de cette propagation (par exemple les interactions microbiote × pathogène × immunité, Vodovotz et al., 2016).

Mobiliser l'IA pour répondre à ces enjeux s’avère prometteur. Premièrement, les méthodes de représentation des connaissances permettent d’expliciter la structure des modèles mécanistes et de réduire le code à écrire, accélérant et fiabilisant leur développement. La séparation entre le développement logiciel et la représentation des connaissances permet à des scientifiques de discipline non informatique de contribuer à concevoir puis à évaluer les modèles. Au lieu de n’exister que sous forme de code informatique, les constituants du modèle (hypothèses, ontologie des connaissances, structure, paramètres, fonctions, règles...) sont accessibles dans un fichier texte structuré, lisible et révisable par les non-informaticiens, scientifiques ou gestionnaires, rendant les modèles plus transparents. À ce jour, un langage domaine spécifique dédié à l’épidémiologie concerne les modèles à équations différentielles, dits à compartiments de type Susceptible-Infecté-Résistant (SIR) (Bui et al., 2015). Deuxièmement, l'utilisation d'agents logiciels autonomes permet de représenter des niveaux d'abstraction et d'organisation variés à plusieurs échelles (Mathieu et al., 2018), rendant les modèles plus flexibles. Très récemment, un logiciel générique (EMULSION, figure 2, Picault et al., 2019b) a été développé, mobilisant à la fois un langage dédié et une architecture logicielle à base d'agents. Cette approche double a l’ambition de répondre le mieux possible aux besoins récurrents de transparence, fiabilité et flexibilité en modélisation des maladies transmissibles. Un simulateur interprète les fichiers textes décrivant le système pour produire le code du modèle, ce pour tout type de formalismes (modèles à compartiments, individu-centrés) et d’échelles (individu, population, territoire). Des briques de code complémentaires peuvent être ajoutées pour des processus spécifiques au pathosystème étudié. La révision des hypothèses du modèle ne nécessite plus de réécrire le code. Ce type d’approche devrait aussi faciliter la production d'outils d'aide à la décision destinés aux gestionnaires et aux décideurs publics de la SA et de la sécurité sanitaire plus généralement.

Figure 2. L’IA au service de la modélisation mécaniste en épidémiologie (Source : EMULSION, Picault et al., 2019b).

Save View full size Expand inline Collapse inline

A. Les modélisateurs développent chaque modèle épidémiologique de novo, et produisent des codes spécifiques non lisibles par des scientifiques d’autres disciplines ou par les utilisateurs finaux des prédictions.

B. Mobiliser des approches d’IA pour combiner un langage dédié et une architecture logicielle à base d'agents contribue à rendre les modèles épidémiologiques plus reproductibles, transparents, flexibles, et transférables aux gestionnaires de la santé sous forme d’outils d’aide à la décision. Un simulateur interprète les fichiers textes décrivant le système pour produire le code du modèle. Des briques complémentaires de code peuvent être ajoutées si nécessaire.

2.3. Extraire des connaissances des données massives de biologie fondamentale en santé animale

Les méthodes d’apprentissage facilitent aussi des travaux de biologie fondamentale, en mobilisant par exemple des analyses morphologiques pour étudier la mobilité cellulaire (Sebag et al., 2015). L’utilisation d’approches de classification et de filtres intelligents permet aujourd’hui de trier des données massives de biologie moléculaire (données issues du séquençage massif et de la métagénomique). Des voies de signalisation métabolique, physiologique ou immunologique sont explorées et des métabolites sont identifiés et quantifiés dans des mélanges biologiques complexes. Cet aspect constituait jusqu’alors un défi majeur pour tester a priori des hypothèses liées à la caractérisation exhaustive du métabolome (Tardivel et al., 2017). Par ailleurs, le temps de diagnostic est réduit en facilitant les analyses d’images (par exemple la détection accélérée de patrons cliniques, Dórea et al., 2013), souvent nécessaires pour étudier les interactions hôte-pathogènes en pathologie animale. Par exemple, l'utilisation de méthodes optimales a permis de mieux comprendre la formation des assemblages de prions, permettant ainsi un diagnostic plus précoce de ces maladies animales de type neurodégénératives, et ouvrant la voie pour identifier des cibles thérapeutiques potentielles (Chyba et al., 2016). En santé humaine, on a assisté dans la seconde moitié du XX^ème siècle à un développement conséquent de nouvelles disciplines aux interfaces entre IA et disciplines-phares, notamment la biologie cellulaire et l’immunologie. Des disciplines d’interface se sont développées, comme la biologie et l’immunologie computationnelles, qui doivent aujourd’hui fertiliser les différents secteurs de la SA. L’immunologie humaine actuelle repose sur la description de mécanismes moléculaires et cellulaires fins (par exemple le nombre d’interleukines connues aujourd’hui a augmenté de manière considérable par rapport aux années 1970). La volonté de comprendre les processus sous-jacents aux réponses immunitaires a provoqué une révolution en invitant cette discipline à s’intéresser à la biologie des systèmes complexes et aux approches issues de l’IA (Bassaganya-Riera et Hontecillas, 2016). Toutefois, les déséquilibres entre les effectifs d’immunologistes et de modélisateurs en immunologie constituent un frein à l’essor pourtant fantastique de cette nouvelle discipline.

3. Revisiter les méthodes de détection de cas à différentes échelles

Une gestion rationnelle des troubles de santé en élevage repose sur des méthodes performantes de détection de cas, que ce soit à l’échelle individuelle voire infra-individuelle (organe), du groupe d’animaux, ou de territoires. Les méthodes d’apprentissage permettent de détecter des patrons et des signaux dans les grandes masses de données, et en particulier dans les séries spatiales ou temporelles de cas en santé, et contribuent ainsi à l’essor d’une agriculture intelligente et de la télémédecine. Des alertes peuvent être produites, et contribuer aux conseils de gestion en agriculture numérique (Liakos et al., 2018 figure 3) ou dans la pratique vétérinaire (Jones-Diette et al., 2019). Cela aboutit parfois à une détection plus précoce des troubles de santé et contribue à la rationalisation des traitements anti-infectieux (notamment antibiotiques) chez les animaux de production. Cela peut reposer sur l’analyse de données collectées à partir d’objets connectés (Morota et al., 2018), le typage de la santé individuelle ou de groupe (Dórea et al., 2013), voire des modèles mécanistes prédictifs de l’occurrence des détections de nouveaux cas à traiter (Picault et al., 2019a). Ensuite, une optimisation multicritère permet de raisonner les stratégies thérapeutiques en identifiant qui traiter dans un groupe, quand, selon quel protocole et pendant quelle durée, de manière à maximiser la probabilité de guérison tout en minimisant le risque de résistance et les doses utilisées (médecine individualisée et médecine de précision).

Néanmoins, la qualité des alertes reste assujettie à la qualité et à la représentativité des jeux de données utilisés par les algorithmes d'apprentissage. De nombreux biais (d'origine matérielle, logicielle, humaine) peuvent entacher le bien-fondé des prédictions. De plus, des alertes produites après un apprentissage reflètent nécessairement les spécificités du système dont les données sont issues (lieu, période, pratiques d'élevage...), de sorte qu'une transposition à un autre pathosystème ou la prise en compte d'évolutions environnementales ou réglementaires est hasardeuse. Par ailleurs, si les méthodes d’apprentissage (classification, analyse d’images, reconnaissance de formes, fouille de données...) apportent des solutions pour un large panel de questions de recherche en biomédecine et biosanté, il est crucial de bien démontrer par des méthodes de validation éprouvées la performance de ces méthodes en mesurant leur qualité prédictive et en les comparant lorsque c’est possible aux méthodes statistiques alternatives.

À l’échelle des populations, la détection de cas repose sur une surveillance directe (détection des troubles) ou indirecte, mobilisant des informations connexes (proxies) à l’occurrence des troubles. Ainsi, l’émergence de certaines maladies est détectée par une surveillance syndromique, en détectant des signaux anormaux dans des données collectées en routine (mortalité, reproduction, comportement, production laitière, utilisation médicamenteuse plus importante... Marceau et al., 2014). Ici les méthodes d’IA et les statistiques sont fortement complémentaires, devant s’appuyer sur un large panel de données, fortement hétérogènes, parfois massives et souvent éparses, pour détecter des signaux souvent faibles (Forbes et al., 2013 Perez et al., 2009) ou leurs proxies (ex : émergence de maladies infectieuses suite aux perturbations de l’environnement), ou encore des symptômes et voies métaboliques en cascades précurseurs de pathologies chroniques ou dégénératives. L’IA permet aussi de mobiliser les informations disponibles sur Internet, par des méthodes semi-automatiques de fouille de textes (data mining) pour identifier et traiter des signaux d'émergence pour la veille internationale sur les maladies animales infectieuses (Arsevska et al., 2018).

À large ou très large échelle (territoire, pays, continent...), l’analyse des données de mouvements commerciaux d’animaux entre élevages (Dutta et al., 2014 figure 4) permet de prédire le risque épidémique associé (Hoscheit et al., 2016). Ces mouvements sont difficilement prévisibles, notamment car les échanges commerciaux reposent sur de nombreux facteurs associés aux activités et décisions humaines. Des méthodes de reconnaissance de patrons spatio-temporels et des développements méthodologiques pour l’analyse de graphes relationnels dynamiques orientés et pondérés sont requis dans ce domaine car très peu des méthodes permettent à ce jour d’étudier des systèmes à grande échelle alors que les jeux de données sont souvent de très grande taille (plusieurs dizaines voire centaines de milliers d’exploitations en interaction dynamique).

Figure 4. Mouvements commerciaux de bovins en France en 2009 (Source : Base de données nationale d’identification des bovins - BDNI).

Save View full size Expand inline Collapse inline

Ces mouvements forment un réseau dynamique, orienté et pondéré. Le prédire est un challenge scientifique et technique, pour lequel de nouvelles méthodes sont requises et auquel l’IA pourrait contribuer.

4. Cibler les interventions, intégrer l’humain au système et soutenir ses décisions

4.1. Choisir parmi toutes les alternatives

Un enjeu des gestionnaires de la santé est d’identifier les combinaisons de mesures de maîtrise les plus pertinentes selon les spécificités locales (caractéristiques des élevages, objectifs de production...) et territoriales (ressources collectives disponibles, localisation des élevages, priorités de gestion...), pour anticiper les effets de changements sanitaires, environnementaux et réglementaires, et promouvoir des conseils sanitaires de qualité. La question se pose aussi de comment favoriser l’innovation en SA, par exemple anticiper les caractéristiques requises de molécules candidates (Schneider, 2019), ou évaluer l’avantage concurrentiel de stratégies innovantes (sélection génomique d’animaux résistants, nouveaux vaccins...) par rapport aux stratégies conventionnelles. Les gestionnaires privés (éleveurs, conseillers des éleveurs) et collectifs (groupements d’éleveurs, pouvoirs publics, ...) ont besoin d’outils d’aide à la décision (OAD) pour cibler les incitations publiques, identifier les investissements à privilégier par l’éleveur (Ezanno et al., 2018) et cibler au mieux les mesures : qui cibler (quels élevages, quels animaux) ? avec quelle(s) mesure(s) ? quand et pendant combien de temps ? etc. Ces questions deviennent incontournables pour raisonner l’usage des intrants (antibiotiques, pesticides, biocides...).

Le recours à la modélisation mécaniste est une solution qui permet in silico d’évaluer, comparer, hiérarchiser un large panel d’options à moindre coût (figure 5 Beaunée et al., 2017). Cependant, la plupart des modèles disponibles n’intègre pas explicitement l’humain et sa décision, alors que les décisions de maîtrise sont souvent de l’initiative des éleveurs (ex : maladies non réglementées), avec des conséquences sanitaires et décisionnelles parfois à large échelle (diffusion infectieuse, diffusion de l’information et des rumeurs, zone d’influence, ...). Des travaux récents visent à intégrer l’humain et ses décisions dans le système en mobilisant du contrôle optimal et des stratégies adaptatives issues de l’IA (Viet et al., 2018) ou encore des méthodes d’économie de la santé (Tago et al., 2016 Krebs et al., 2018). Ces travaux sont précurseurs en SA et doivent être poursuivis et étendus dans le cadre du développement de l’agroécologie, de la demande sociétale actuelle en matière de qualité des produits et de respect des écosystèmes et de leur biodiversité, et plus généralement de la sécurité sanitaire internationale.

Figure 5. Identifier les stratégies pertinentes pour maîtriser la paratuberculose bovine à l’échelle régionale (d’après Beaunée et al., 2017).

Save View full size Expand inline Collapse inline

Classiquement, identifier les stratégies pertinentes revient à les définir a priori puis à les comparer, par exemple par modélisation. Généralement, seul un faible nombre d’alternatives est considéré. Ici, toutes les alternatives sont considérées, aboutissant à une multitude de scénarios dont l’analyse peut devenir un challenge. Chaque point correspond à la situation épidémiologique après 9 ans de propagation du pathogène sur un réseau de 12 500 troupeaux bovins laitiers pour une stratégie donnée (astérisque : pas de maîtrise). Initialement, 10 % des animaux sont infectés en moyenne dans 30 % des troupeaux. Les points les plus bleus correspondent aux stratégies les plus favorables. Mobiliser dans un tel cadre des approches d’IA, notamment d’optimisation sous contraintes, faciliterait l’identification des stratégies pertinentes en explorant l’espace des possibles de manière plus ciblée.

4.2. Tenir compte des attentes et des peurs des gestionnaires de la santé

Les gestionnaires de la santé animale doivent disposer des prédictions issues de modèles dans un temps compatible avec les besoins de gestion. Face à des émergences imprévisibles (nouveaux pathosystèmes, nouvelles conditions de circulation, mesures de maîtrise à déterminer...), cela peut s’avérer problématique. Envisager une bibliothèque de modèles ayant un cadre commun renforcerait la réactivité des épidémiologistes, permettant de développer des modèles pertinents plus rapidement et de les mettre à jour avec des données actualisées (« real-time system modeling ») lors de la progression des épidémies. Néanmoins, si cela accélèrerait le passage du modèle conceptuel (dérivé des connaissances et des hypothèses biologiques sous-jacentes) à l’outil d’aide à la décision, un gain de réactivité serait encore obtenu par la génération automatique de code informatique performant et l’adaptation de code en autonomie ce qui reste à ce jour un verrou méthodologique important à lever en IA. Par ailleurs, il est souvent nécessaire de réaliser un très grand nombre de calculs ou d’analyser de très grandes bases de données, ce qui appelle à une utilisation raisonnée des ressources informatiques. Ainsi, les outils logiciels transférés vers les gestionnaires requièrent parfois l’usage de ressources privées de type cloud (logiciels qui ne fonctionnent pas sur de simples ordinateurs), mettant en exergue le compromis entre coût de simulation, continuité de service (par exemple la gestion des pannes) et temps requis pour obtenir les résultats de simulations (Pham et al., 2017). Ces questions relèvent pour l’heure de la recherche en informatique, et des collaborations sont souhaitables entre ces chercheurs et ceux de SA.

Les gestionnaires souhaitent aussi s’appuyer sur des prédictions précises provenant de représentations réalistes des systèmes biologiques. Avant d’être utilisés, le comportement des modèles doit être analysé. Se posent alors les questions d’exploration dans l’espace des incertitudes et des données, et d’optimisation sous contraintes. Cela requiert souvent des simulations intensives, qui bénéficieraient d’algorithmes d’optimisation pour parcourir plus efficacement l’espace des possibles. En retour, cela permettrait par exemple d’identifier automatiquement comment atteindre un objectif fixé (ex : réduction de la prévalence d’une maladie sous un seuil acceptable) tout en tenant compte des ressources disponibles. Si cette question trouve des solutions en statistique moderne pour des systèmes relativement simples, elle représente un front de science pour les systèmes complexes (large échelle, multi-hôtes, multi-pathogènes, multi-systèmes...) qui deviennent la norme. De plus, des objectifs d’optimisation spécifiques à la SA peuvent engendrer des besoins méthodologiques ad hoc (Shah et al., 2019). Les besoins en capacité d’abstraction et d’analyse sont massifs et pourraient bénéficier des complémentarités entre IA (exploration raisonnée, utilisation intelligente des ressources informatiques, calculs optimisés...) et statistiques pour tirer autant d’information que possible des données : i) explorer, analyser, prédire ii) inférer des processus et des propriétés émergentes. Des développements méthodologiques sont encore requis et qui bénéficieraient à de nombreuses problématiques de santé, notamment en lien avec les notions actuellement en pleine évolution de réservoir-hôte, d’hôte relais (« edge-host »), et de barrière d’espèces (Han et al., 2019). Les développements méthodologiques et la diffusion des méthodes existantes sont à poursuivre (par exemple le réseau français pluri-organismes Mexico : « Méthodes pour l’EXploration Informatique des modèles Complexes » organise des écoles-chercheurs sur « Analyse de sensibilité, métamodélisation et optimisation de modèles », https://reseau-mexico.fr/).

Enfin, trois limites ont été identifiées quant au développement d’OAD pour les gestionnaires de la santé, liés à l’acceptabilité de l’IA au sens large comme facteur majeur de progrès (Prospective, 2019). Premièrement, les questions d’éthique, flagrantes lorsqu’il s’agit de santé humaine, sont aussi importantes à prendre en compte en SA. Quels OAD souhaitons-nous pour demain, pour quels objectifs ? Dans un esprit de surveillance contrôlée, ces OAD ne risquent-ils pas d’entraîner une dérive de discrimination des élevages selon leur statut sanitaire, même lorsque ce statut sanitaire ne peut être géré par les seules interventions de l’éleveur ? Les nouvelles technologies issues de l’IA peuvent en effet revêtir un caractère double, offrant par exemple la possibilité d’un contrôle des cheptels par des groupes internationaux de l’agro-alimentaire parfois propriétaires des données collectées. Deuxièmement, il existe aussi en SA une crainte de voir l’outil remplacer l’expertise humaine. Pourtant, automatiser ne signifie en rien remplacer l’humain, son expertise et sa décision (Reddy et al., 2019). Il s’agit plutôt de renforcer ses capacités d’abstraction et d’analyse, accélérer le processus global, fiabiliser les prédictions, guider les recherches complémentaires. Néanmoins, un développement important des ressources et matériels informatiques n’est pas sans impacts sur l’environnement en termes de bilan carbone (serveurs énergivores, recyclage des capteurs…), ce qu’il faut aussi prendre en compte dans le cadre du développement de l’agroécologie. Troisièmement, la très grande complexité d’analyse et d’acculturation des résultats et connaissances issus de la recherche académique, notamment de l’IA, constitue un obstacle à l’appropriation des OAD par leurs utilisateurs et peut conduire à préférer des méthodes plus simples et faciles d’accès. Toutefois, ces dernières peuvent se révéler ne pas toujours être les plus pertinentes ou les plus fiables. Des projets de science participative (« citizen science »), aussi nommée participation communautaire en épidémiologie humaine (« community health »), permettront en SA de co-concevoir et co-construire les OAD de demain avec leurs utilisateurs. Cet effet d’entraînement permettra de mieux répondre aux attentes et aux besoins des utilisateurs mais aussi des citoyens, de rendre moins opaques les systèmes et les approches informatiques, et d’accroître leur confiance dans les prédictions de modèles académiques parfois obscurs, notamment lorsqu’ils ne sont pas lisibles (lignes de code sans filtre). Les OAD pourront alors être élaborés avec l’aide des décideurs publics, des éleveurs, des industries agro-alimentaires et des syndicats sectoriels. La co-construction donne le temps d’expliciter la science derrière les outils et de les rendre plus transparents et utiles. Cette participation communautaire, voire citoyenne, soutenue aujourd’hui dans de très nombreux pays, est garante de prises de décisions plus conformes à l’aspiration des citoyens et correspond à une tendance à se généraliser de « structured-decision making ». L’IA doit contribuer à cette démocratisation de l’aide et de la participation à la décision publique en SA.

5. Freins et leviers

Les recherches menées à l’interface entre IA et SA nécessitent de fortes interactions entre disciplines de la biologie (infectiologie, immunologie, sciences cliniques, génétique, écologie, évolution, épidémiologie, zootechnie...) et disciplines plus théoriques (mathématiques, statistiques, informatique). Mener des recherches à cette interface requiert de renforcer les quelques équipes déjà positionnées, mais également d’associer des équipes travaillant autour des concepts « One Health », « Ecohealth » et « Planetary Health » pour bénéficier des réalisations récentes en écologie et modélisation des maladies infectieuses, en santé des plantes et en santé de l’environnement (Guégan et al., 2018). Ces travaux doivent s’appuyer sur un large panel de compétences méthodologiques (méthodes d’apprentissage, fouille de données et de textes, systèmes d’information, représentation des connaissances, systèmes multi-agents, résolution de problèmes, métamodélisation, optimisation, architecture de simulation, réduction de modèles, modèles décisionnels...). Les besoins de recherche, de formation, et d’appui autour de ces questions constituent des enjeux cruciaux, aux échelles nationale, européenne et internationale (essor actuel pris par des pays comme la Chine et l’Inde sur ces thèmes alors que la France dispose de compétences reconnues internationalement). Enfin, une connexion facilitée et de confiance est requise entre académiques et instituts techniques et partenaires privés, qui sont souvent les détenteurs ou collecteurs des données d’intérêt pour résoudre des questions de recherche en santé via des approches d’IA. La réflexion pour une meilleure coordination intersectorielle doit se faire au niveau national français, tant ce thème apparaît hyper-compétitif et certains cloisonnements actuels allant encore à l’encontre du partage d’information.

Une acculturation des chercheurs à l’IA, ses méthodes et ses potentiels développements, mais aussi ses limites, doit être proposée pour répondre aux défis de l’agriculture du XXI^ème siècle. En effet, il existe des freins à mener des recherches sur ce front de science. Nouer les nouvelles collaborations requises entre équipes menant des travaux méthodologiques et équipes des domaines d’application reste difficile vus les faibles effectifs académiques sur ces problématiques, leur très forte mobilisation actuelle dans cette recherche et la faible capacité à pouvoir collaborer sur de nouveaux sujets, ainsi que la difficulté d’appréhender et maîtriser ces méthodes. Il existe un besoin de veille et de formation sur les méthodes disponibles ou en cours de développement, les nouveaux logiciels/packages et leur applicabilité, etc. Pour développer des collaborations clés et asseoir un positionnement stratégique, une interconnexion peut aussi se faire via des équipes transversales (par exemple l’équipe projet SISTM « Statistiques pour la médecine translationnelle » Inserm / Inria / Université de Bordeaux) qui nous apparaît être une voie à privilégier. Des solutions sont aussi à trouver pour favoriser la percolation des méthodes dans la communauté et la montée en compétences des scientifiques et ingénieurs.

Enfin, les méthodes d’IA, notamment de classification / apprentissage / fouille de données, et les innovations en SA auxquelles ces méthodes peuvent conduire ne sont que très peu abordées en enseignement vétérinaire, alors que ces étudiants représentent les futurs professionnels de la SA (van der Waal et al., 2017). La communauté scientifique gagnerait aussi à accroître encore ses compétences et son expérience en valorisation, transfert et protection de la propriété intellectuelle sur ces méthodes d’IA et les résultats associés.

6. Recommandations

6.1. Partager et protéger les données

Aucun développement à l’interface entre IA et SA n’est envisageable sans un soutien extrêmement fort pour l’organisation du dépôt, de la gestion, de l’analyse, du calcul, et de la restitution des données. Le risque majeur est de voir l’inflation des demandes pour des développements IA non soutenue par les ressources humaines disponibles. De plus, il est nécessaire de pouvoir s’appuyer sur des compétences en droit, juridiction et déontologie quant à l’acquisition, la détention, l’utilisation, et la protection des données en SA. Cette question doit se penser à l’échelle interinstitutionnelle, en s’appuyant sur la réflexion similaire conduite en santé humaine. Il s’agit d’être en capacité d’accompagner tout changement au regard de ces données quant à leur traçabilité jusqu’à leur propriété, qu’elles soient publiques ou privées.

Les nouvelles données sont riches et doivent être valorisées le mieux possible, non par chaque propriétaire séparément, mais en les mutualisant et en mobilisant nos capacités d’analyse de données hétérogènes et complexes. La plateforme française interinstitutionnelle « Épidémiologie en Santé Animale » (ESA) constitue un lieu privilégié pour discuter avec tous les acteurs et trouver des solutions de partage et de protection des données. Des compétences quant à l’interopérabilité des données sont requises et doivent être développées.

Enfin, pour pouvoir lancer des expérimentations ambitieuses de méthodes d’IA sur des données réelles comme recommandé (Prospective 2019), il convient de i) lever les non-autorisations d’accès aux données en négociant en région et auprès des entreprises ii) analyser et comprendre l’effet de ces levées sur les développements méthodologiques et iii) le cas échéant, étendre de telles initiatives à d’autres régions voire à l’échelon national et communautaire.

6.2. Attirer les compétences nécessaires

Un frein incontestable à conduire de telles recherches vient des ressources humaines, notamment la trop faible capacité actuelle d’encadrement par les scientifiques permanents. Les collaborations sont un moyen d’attirer des compétences nouvelles. Cependant, initier des collaborations à l’interface IA/SA devient très compliqué car les équipes compétentes sont sur-sollicitées au regard de leurs effectifs, même à l’international. La montée en puissance des compétences est à poursuivre et soutenir, la croisée des disciplines étant incontournable. Une veille sur les méthodes doit aussi être réalisée, accompagnée d’une explicitation aux domaines applicatifs, pour former chercheurs et ingénieurs. Inciter financièrement des séjours de chercheurs et ingénieurs dans des laboratoires spécialisés permettrait d’accroître les compétences sur des méthodes de pointe, tout en facilitant les collaborations futures, nationales ou internationales. Enfin, recruter de nouveaux chercheurs permettrait de capitaliser des compétences spécifiques difficiles à acquérir en interne. Dans un contexte de ressources (postes) et de vivier (compétences) limités, faciliter l’accueil de post-doctorants et de chercheurs français en formation continue et d’experts étrangers devient crucial.

Concernant plus spécifiquement les recherches en immunologie, biologie cellulaire et infectiologie, l’apport de l’IA a été plus largement réfléchi en santé humaine, ce qui pourrait nourrir une réflexion similaire en SA (verrous et avancées peu spécifiques). Avant de se lancer sur les fronts de science (par exemple l’épigénomique et la métabolomique émergentes en SA), il est nécessaire que quelques personnes de ces disciplines biologiques s’acculturent en IA, voire acquièrent une autonomie d’usage des méthodes (Schulze, 2015), ce qui tend internationalement à être la tendance (Bassaganya-Riera et Hontecillas, 2016). Cela peut se faire via le partage d’expériences et des formations de base sur les méthodes existantes, leurs avantages et limites par rapport aux méthodes conventionnelles.

Enfin, pour consolider le vivier des futurs chercheurs en SA, promouvoir un enseignement de base en IA dans les formations initiales est à construire avec l’IAVFF (Institut Agronomique, Vétérinaire et Forestier de France).

6.3. Favoriser le montage de projets en intelligence artificielle et santé animale

Les projets à l’interface IA / SA, comme tout projet interdisciplinaire, doivent mobiliser des équipes des deux groupes de disciplines et permettre à chacun d’avancer dans sa discipline propre. Cependant, identifier les questions partagées entre disciplines les plus pertinentes demande une bonne acculturation des disciplines entre elles, ainsi que d’une volonté à se comprendre, ce qui n’est pas encore le cas à cette interface. L’organisation de séminaires scientifiques à l’interface IA-SA permettrait d’inviter des équipes cibles et faciliter cette connaissance mutuelle, prérequis à des projets ambitieux. Cela permettrait aussi de fédérer et coordonner les quelques initiatives locales.

En termes de financement, les appels à projets européens offrent des possibilités intéressantes, mais un important déséquilibre persiste entre la capacité à générer des données et analyser des questions complexes, et la disponibilité en ressources et compétences humaines pour traiter de telles questions via des méthodes d’IA ou des méthodes modernes en statistiques, mathématique et informatique. Les grandes fondations internationales (par exemple Bill et Melinda Gates) sont également mobilisables sur les maladies émergentes à l’interface animal / humain (caractérisation de signaux faibles, de phénologies, précurseurs d’émergence), avec une valence méthodologique plus prégnante. Cependant, la prise de risque est rarement permise par les agences de financement nationales, alors qu’elle est cruciale pour initier des travaux interdisciplinaires. Des financements incitatifs (inter-)institutionnels permettraient de soutenir les projets en phase initiale. Un projet de plus grande ampleur pourrait émerger après consolidation des interactions disciplinaires nécessaires.

Enfin, ces projets reposent généralement sur l’utilisation de ressources informatiques conséquentes. Les instituts de recherche ont intérêt à inscrire plus largement dans leur politique informatique une contribution financière ou matérielle au développement mutualisé d’infrastructures numériques/datacenter/centres de calcul intensif à l’échelle nationale.

6.4. Promouvoir l’innovation et les interactions recherche académique - recherche privée

Inciter le partenariat public-privé favoriserait un effet de levier aux financements publics et permettrait d’inscrire les recherches et développements en IA sur le long terme. Réaliser une cartographie du paysage très mouvant des entreprises du secteur IA en SA, qu’il s’agisse de structures internationales ou de start-up, apporterait une meilleure lisibilité des interactions possibles. De même, mobiliser les outils existants (dépôts à l’Agence de Protection des Programmes (APP)) pour effectuer une cartographie des productions informatiques réalisées à cette interface permettrait d’en accroître la visibilité et de communiquer sur leur potentiel de valorisation ou de transfert. Enfin, considérer la production d’algorithmes documentés comme des livrables scientifiques, au même titre que les publications, contribuerait à soutenir ces recherches plus opérationnelles. Plus largement, il conviendrait d’initier une politique de communication et d’éducation/acculturation autour de l’IA et de ses développements en SA (liens avec le public, les éleveurs, les syndicats agricoles, les services publiques...), ce qui pourrait constituer un enjeu partagé avec l’IAVFF et Agreenium.

Conclusion

L’usage des méthodes d’IA (apprentissage, systèmes experts, technologies analytiques…) converge aujourd’hui avec l’obtention de données massives, et permet à ces domaines de se développer rapidement. Il est cependant essentiel de ne pas percevoir données massives et IA comme une même tendance, car l’accumulation de données n’engendre pas toujours une amélioration des connaissances. Néanmoins, plus les données sont nombreuses et représentatives des concepts et hypothèses de travail, plus les applications issues de l’IA peuvent aboutir à des résultats importants. Les aspects éthiques, déontologiques et juridiques sous-jacents quant à la propriété des données, leur conservation, gestion, partage et interopérabilité, exigent aussi qu’une réflexion soit engagée nationalement et internationalement en SA pour mieux encadrer ces données d’origine multisectorielle et leurs différents usages. De plus, si l’effort d’acquisition de ces données est impressionnant, le développement des compétences en IA au sein de la communauté de SA reste limité au regard des besoins. Les possibilités de collaboration avec des équipes d’IA sont faibles car celles-ci sont déjà très sollicitées. Pour que les personnels de recherche en SA se saisissent au mieux des opportunités offertes par l’IA, mais aussi aient conscience des limites et contraintes de ces approches, un effort de formation doit être dispensé et généralisé. Enfin, l’essor actuel de l’IA permet aujourd’hui d’intégrer plus en amont les connaissances et les points de vue des nombreux acteurs de la santé et du bien-être animal. Cependant, cela requiert que l’IA et ses acteurs acceptent de traiter les spécificités et la complexité de la SA, laquelle ne constitue pas une simple bibliothèque de connaissances qu’il suffirait de numériser pour en rechercher des séquences ou des signaux informatifs.

Remerciements

Cette réflexion a bénéficié de nombreuses interactions avec des chercheurs et enseignant-chercheurs (encadré 2) intéressés par l’interface IA/SA, nous les en remercions ici. Nous remercions aussi Stéphane Abrioux, Xavier Bailly, Didier Concordet et Human Rezaie pour leur participation aux discussions scientifiques et techniques.

Références

Résumé

Mobiliser les approches issues de l’intelligence artificielle (IA) en santé animale (SA) permet d’aborder des problèmes de forte complexité logique ou algorithmique tels que rencontrés en épidémiologie quantitative et prédictive, en médecine de précision, ou dans l’étude des relations hôtes × pathogènes. L’IA peut dans certaines situations faciliter le diagnostic et la détection de cas, fiabiliser les prédictions et réduire les erreurs, permettre des représentations plus réalistes et lisibles par des non informaticiens de systèmes biologiques complexes, accélérer les décisions, améliorer la précision des analyses de risque et permettre de mieux cibler les interventions et d’en anticiper les effets. De plus, les fronts de science en SA engendrent de nouveaux challenges pour l’IA, du fait de la spécificité des systèmes, des données, des contraintes, et des objectifs d’analyse. Sur la base d’une revue de la littérature à l’interface entre IA et SA couvrant la période 2009-2019, et d’entretiens conduits avec des chercheurs français positionnés à cette interface, cette synthèse explicite les grands domaines de recherche en SA dans lesquels l’IA est actuellement mobilisée, comment elle contribue à revisiter les questions de recherche en SA et lever des verrous méthodologiques, et comment des questions de SA stimulent de nouveaux travaux en IA. Après avoir présenté les freins et leviers possibles, nous proposons des recommandations pour se saisir au mieux de l’enjeu que représente cette interface SA/IA.

Auteurs

Pauline EZANNO

pauline.ezanno@inrae.fr

Affiliation : INRAE, Oniris, BIOEPAR, 44300, Nantes, France

Pays : France

Sébastien PICAULT

Affiliation : INRAE, Oniris, BIOEPAR, 44300, Nantes, France

Pays : France

Nathalie WINTER

Affiliation : INRAE, ISP, Tours, France

Pays : France

Gaël BEAUNÉE

Affiliation : INRAE, Oniris, BIOEPAR, 44300, Nantes, France

Pays : France

Hervé MONOD

Affiliation : INRAE, MaIAGE, Jouy-en-Josas, France

Pays : France

Jean-François GUÉGAN

Affiliation : INRAE, CIRAD, UM, ASTRE, Montpellier, France

Pays : France

Pièces jointes

Pas de document complémentaire pour cet article

Statistiques de l'article

Vues: 8211

Téléchargements

XML: 301

PDF: 1099

Chapeau

Introduction

1. Collecter, organiser et rendre accessibles des données de qualité

2. Apports de l’IA pour la compréhension des pathosystèmes

2.1. Mieux comprendre l’évolution des pathosystèmes à large échelle

2.2. Garantir fiabilité, reproductibilité et flexibilité des modèles épidémiologiques

2.3. Extraire des connaissances des données massives de biologie fondamentale en santé animale

3. Revisiter les méthodes de détection de cas à différentes échelles

4. Cibler les interventions, intégrer l’humain au système et soutenir ses décisions

4.1. Choisir parmi toutes les alternatives

4.2. Tenir compte des attentes et des peurs des gestionnaires de la santé

5. Freins et leviers

6. Recommandations

6.1. Partager et protéger les données

6.2. Attirer les compétences nécessaires

6.3. Favoriser le montage de projets en intelligence artificielle et santé animale

6.4. Promouvoir l’innovation et les interactions recherche académique - recherche privée

Conclusion

Remerciements

Références

Résumé

Auteurs

Pauline EZANNO

Sébastien PICAULT

Nathalie WINTER

Gaël BEAUNÉE

Hervé MONOD

Jean-François GUÉGAN

Pièces jointes

Statistiques de l'article

Articles les plus lus par le même auteur ou la même autrice