Assistance for exploration and discovery of relationships in medical functional genomics data Aide à l'exploration et à la découverte de relations dans des données de la Génomique Médicale Fonctionnelle En Fr

Fiche du document

Auteur
Date

11 décembre 2009

Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licences

http://hal.archives-ouvertes.fr/licences/copyright/ , info:eu-repo/semantics/OpenAccess




Citer ce document

Arriel Benis, « Aide à l'exploration et à la découverte de relations dans des données de la Génomique Médicale Fonctionnelle », HAL-SHS : sciences de l'information, de la communication et des bibliothèques, ID : 10670/1.j2nk8f


Métriques


Partage / Export

Résumé En Fr

Data mining is an emerging area in the field of medical informatics research. Nowadays, clinical research protocols are no longer limited to collect only medical data, but they are also regarding other kinds of data, such as genomic data from cDNA microarrays. Currently, the approaches commonly used by biologists in this context explore a tiny part of the data based on a priori. Our work is based on automating the analysis process. Firstly, this Ph.D. dissertation focuses on the definition of a data workflow adapted to data that we deal with (bioclinical and genomics data). Secondly, outliers, due to the relative quality of data and sources of errors in analysis, are automatically identified thanks to a classification method. Finally, all these results will be presented easily to biologist experts. Experiments related to research in obesity medicine have been done and allowed to validate our Data Mining process and to discover biomarkers. Evaluations of use and usability have shown the benefits of our approach.

La Fouille de Données est un domaine de recherche émergent en Informatique Médicale. Aujourd’hui, les protocoles de recherche clinique ne se contentent plus de collecter des données uniquement médicales, mais ils s’intéressent aussi aux données génétiques et génomiques. Les approches utilisées par les biologistes dans ce contexte n’étudient qu’une infime partie des données en se fondant sur des a priori. Nos travaux reposent sur l’automatisation de ce processus d’analyse. Premièrement, cette thèse s’intéressera à la mise en place d’un flux de données adapté aux données que nous souhaitons traiter (données biocliniques et issues de puces à ADNc). Ensuite, les valeurs singulières, dues à la qualité relative des données et sources d’erreurs, seront identifiées automatiquement grâce à une méthode de classification. Enfin, l’ensemble de ces résultats sera présenté de manière accessible aux experts. Des expérimentations ont été menées dans le domaine de l’étude des Obésités et ont permis de valider notre processus et de découvrir des biomarqueurs. Une analyse globale d’usage et d’utilisabilité a montré l’intérêt de notre approche.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Exporter en