Assistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques

TitleAssistance à la curation de publications scientifiques par des méthodes de triage et d’annotation automatiques
Publication TypeThesis
Year of Publication2019
AuthorsMottin, L
Date Published05/02
Thesis Typephd
KeywordsAnnotation automatique, Base de données, Curation, Fouille de données textuelles, Littérature scientifique, MEDLINE, neXtA5, NeXtProt, Recherche d'information
Abstract

La littérature est une gigantesque base de connaissances, non structurées, dans laquelle sont stockées les contributions sans cesse plus nombreuses de la communauté scientifique. Par l’intermédiaire de curateurs, les publications scientifiques sont annotées, contrôlées et les entités identifiées sont mises en relation avec d’autres sources de connaissances. Les curateurs ont aussi pour objectif de rendre l’ensemble des informations (trouvées ou créées) accessible et réutilisable pour la communauté, d’où la conception de bases de données spécifiques (telles que neXtProt). Cette thèse étudie différentes stratégies en recherche d’information et en fouille de données textuelles (amélioration du triage de documents via MEDLINE, reconnaissance d’entités, extraction d’information, etc.) afin d’automatiser et de simplifier le processus global de curation. Le produit final de cette recherche, neXtA5, est un système optimisé pour chaque étape du processus et intégré dans la routine de ses utilisateurs afin de répondre à leurs attentes en terme d’utilisabilité (efficacité, efficience, satisfaction).

URLhttps://archive-ouverte.unige.ch/unige:118269