Mémoire : pdf et présentation : ppt
La compréhension profonde de texte vue comme un processus d’inférence visant à expliciter tout l’implicite d’un texte a buté sur le problème de la modélisation des connaissances nécessaires. Une approche alternative consiste à redéfinir ce processus et à le décomposer en sous-tâches potentiellement plus faciles à résoudre. Considérant que le but premier n’est pas de comprendre un texte dans l’absolu, mais de comprendre un texte afin d’atteindre un but précis dépendant de la tâche, la compréhension de texte peut être redéfinie selon différents points de vue sur le texte qui vont permettrent de répondre à ces besoins spécifiques (par exemple évaluer la pertinence d’un texte par rapport à un thème, rechercher une réponse précise à une interrogation). Suivant le besoin et le type de connaissance cherché dans un document, le lecteur n’extraira du texte que l’information qui l’intéresse et s’appuiera pour cela sur les indices qui lui permettent de réaliser sa tâche de lecture, et donc de compréhension, sans avoir à tout assimiler. On peut alors parler de « compréhension à niveaux variables » ou « d’analyse de texte », analyse qui englobe tous les types de processus appliqués au texte.
Si l’on veut construire un continuum entre ces méthodes et disposer des connaissances requises par chacune, il faut aussi créer un continuum entre ces connaissances. Une partie de celles-ci peut être automatiquement acquises des textes, textes qui ne constituent pas seulement des objets à analyser mais aussi une réserve de connaissances qu’il faut pouvoir extraire. Aussi, la voie de recherche que nous explorons consiste à utiliser des méthodes robustes pour effectuer une analyse des textes et en extraire un premier type de connaissances qui va servir de base à un apprentissage automatique. Les connaissances ainsi produites pourront ensuite être réutilisées dans des processus d’analyse plus fins, produisant par là-même des connaissances plus précises et de plus en plus structurées. On peut alors parler de compréhension pour l’apprentissage et d’apprentissage pour la compréhension.
Mon mémoire présente les travaux que nous avons effectués en analyse de texte et qui portent sur l’analyse thématique et la réponse à des questions et montre comment les résultats en analyse ont donné lieu à un apprentissage automatique de signatures thématiques et à leur structuration en vue d’apprendre des descriptions de situations. L’exposé de ces travaux est complété par la présentation de projets permettant de poursuivre dans cette voie.