Le corpus des ESLO regroupe deux enquêtes recueillies à Orléans, à 40 années d’intervalle : ESLO1 dans les années 1970 et ESLO2 en cours de constitution. A terme, la compilation de ces deux enquêtes constituera l’un des plus grands corpus de français parlé disponible avec quelque 700 heures d’enregistrements. Ce séminaire, proposé par le laboratoire LIDILEM sera animé par Céline Dugua (Laboratoire Ligérien de Linguistique à Orléans) à la Maison des Langues, le 5 février à 17h30.

 

Résumé :
Dans cette présentation, nous évoquerons les étapes de constitution d’un tel corpus, en mettant l’accent sur notre volonté de maitriser et rendre explicite l’ensemble de ces étapes, depuis les opérations de numérisation du corpus ESLO1, de collecte d’ESLO2, de transcription, d’annotation, de constitution d’une base de données et de sa mise en ligne, en passant par les aspects juridiques, la question de l’archivage, jusqu’aux applications et développements possibles. Les choix techniques et méthodologiques réalisés à chacun de ces niveaux ont constamment été éclairés par nos choix théoriques, ceux de la linguistique variationniste.

 

Nous présenterons ensuite les premiers résultats d’une étude sur l’usage de la liaison dans le corpus ESLO. Pourquoi la liaison ? Elle est un phénomène phonologique variable classiquement utilisé dans les études variationnistes ; elle fait en outre l’objet de nombreuses études à partir de corpus. Son observation pose donc la question de l’interopérabilité des données entre des corpus aux objectifs différents. Afin de décrire son usage dans ESLO, la méthode choisie consiste en plusieurs micro-analyses qui prennent en compte trois types de variations, de manière isolée mais aussi croisée : les variations diastratiques (par l’échantillonnage de notre corpus), les variations diaphasiques (grâce à l’architecture du corpus : constitué d’entretiens et aussi de nombreuses autres situations de recueil), les variations diachroniques (comparaisons ESLO1/ESLO2). Les différents angles d’observation et les premiers résultats obtenus, nous permettent en retour un ajustement dynamique du corpus, avec l’objectif d’orienter ou réorienter les prochaines étapes de recueils et d’analyses des données.