(preload) (preload)

Contexte des activités

Origine des recherches

Une tendance notable de la recherche biomédicale est l'accroissement de l'échelle à laquelle sont réalisées les études. Celle-ci résulte de l'émergence de techniques expérimentales à haut débit et d'une augmentation du volume de données disponibles au sein de banques de données publiques ou mutualisées. Une difficulté complémentaire réside dans l'hétérogénéité tout à la fois des sources d'information (banques de données multiples et distantes aux formats et interfaces hétérogènes, fichiers aux formats variés, etc) et des données (multiples échelles : de la population à la molécule ; multiples natures : quantitative ou qualitative ; multiples modes : texte ou image ; multiples niveaux de structuration : champs de base de données, structuration par balises, texte libre).

Il apparaît ainsi un besoin croissant d'accompagnement informatisé des activités de recherche, de la conception de l'expérience à la représentation et gestion des données générées, à l'exploitation de l'information disponible. Cet accompagnement doit être envisagé à destination d'experts du domaine mais novices en informatique, ce qui suggère un niveau d'abstraction élevé. Mes travaux de recherche s'inscrivent dans ce contexte et explorent des approches pluri-disciplinaires permettant de faciliter l'acquisition et l'exploitation de l'information scientifique.

De manière schématique, la recherche scientifique dans des domaines tels que la biologie ou la médecine, où la démarche est très empirique, se base souvent sur une méthode hypothético-déductive incluant trois temps forts : l'identification d'une question à étudier, la formulation d'hypothèses dans le cadre de cette question et l'argumentation permettant d'accepter ou rejeter les hypothèses. Cette argumentation se base généralement sur des expériences conçues en fonction de l'hypothèse à tester. Les données expérimentales sont alors analysées afin de supporter une prise de décision concernant l'hypothèse testée.

Les progrès technologiques des vingt dernières années ont conduit à une mutation du processus expérimental classique. Ainsi l'étape expérimentale connaît une robotisation croissante, qui permet tout à la fois d'automatiser les manipulations et de réaliser des traitements en masse d'échantillons de plus en plus miniaturisés. On peut citer par exemple la technologie des Tissue MicroArrays, abordée dans le cadre de ma thèse, les Protein MicroArrays, un des champs applicatifs de mes travaux de post-doc, ou la technologie AlphaScreen couplée à un robot de préparation, autour de laquelle je collabore avec l'unité INSERM 889.

Cette robotisation et cette miniaturisation des échantillons impactent les étapes encadrant la conduite de l'expérience en tant que telle. La conception de l'expérience doit s'envisager comme une parallélisation ou un multiplexage des expériences telles qu'elles étaient réalisées préalablement, auxquels s'ajoutent des difficultés techniques complémentaires liées à la taille des échantillons. De plus, ces techniques impliquent une augmentation du coût en temps et en matériel des expériences. La réutilisation des données d'autres équipes ou d'expériences précédentes dans un nouveau cadre se généralisent. Le stockage informatisé de ces données et leur mise à disposition sur internet au sein de banques de données publiques démultiplie alors le volume de données disponible dans le cadre du test d'une hypothèse donnée. Ceci rend problématique l'analyse des données, qui nécessite la mise en place d'approches spécifiques, de plus en plus informatisées.

Travaux

Dans ce contexte, un ensemble de problèmes (gestion des expériences, intégration des données, sélection des données, interprétation des résultats) se posent à la communauté scientifique. Mon projet de recherche vise alors proposer des solutions à ces problèmes, tout en essayant de faciliter l'acceptation de celles-ci par les chercheurs du domaine biomédical. L'objectif est d'explorer des approches innovantes dédiées à l'accompagnement de l'ensemble du processus expérimental, à destination des scientifiques non informaticiens.

Les divers projets dans lesquels je suis ou me suis impliquée ciblent ces divers problèmes :

Ces diverses activités ont donné lieu à un ensemble de publications et communications, répertoriées ici.