Doctorante en Science du Langage
Option : Industrie de la LangueUniversité Stendhal, Grenoble III
Titre :
Restructuration dynamique de corpus littéraires et linguistiquesSous la direction de Thomas Lebarbé
laboratoire : LIDILEM à Grenoble
Résumé
La thèse porte sur la valorisation numérique des fonds de manuscrits, en particuliers du corpus constitué par les Journaux et papiers de Stendhal. Son objet d'étude privilégié sera la modélisation des manuscrits et le développement d'outils de traitement de langues pour l'étude littéraire et linguistique des recueils de manuscrits.Une première étape du travail consistera en la définition de la notion de corpus littéraire, sa hiérarchisation et sa restructuration dynamique à des fins diverses : analyse génétique, analyse linguistique synchronique ou diachronique, etc.
Par ailleurs, le manuscrit étant une forme « hésitante » d'écriture (biffes, ratures, ajouts, fautes,... formes écrites équivalentes de la disfluence à l'oral), sa pré-analyse par des outils de traitement automatique des langues n'est pas fiable. La partie principale du travail portera donc sur l'analyse de ces phénomènes, leur modélisation linguistique et leur traitement automatique (analyse syntactico-sémantique) afin d'aboutir à des outils fiables.