Sous la direction de Sylvia Kasparian, le Laboratoire de recherche en analyse de données textuelles (LADT) se veut un espace interdisciplinaire, dynamique et ouvert où se côtoient des disciplines aussi diverses que la sociologie, l’histoire, les sciences politiques, la linguistique, la littérature, l'éducation, la musique, l'informatique et la statistique par exemple, et dont l'intérêt commun est d'analyser des textes de tout genre à la recherche de significations et de sens invisibles à l'œil nu. Bien qu'il soit surtout au service des recherches des étudiants, des professeurs et des équipes de recherche, le Laboratoire a aussi surtout été mis en place pour les nouveaux cours de méthodologie de la recherche en linguistique et en littérature.
Les corpus textes qui sont analysés peuvent être aussi variés que des textes littéraires, des discours politiques, des textes philosophiques ou publicitaires, des entretiens sociologiques, des sondages, des partitions de musiques, des idéogrammes chinois, la codification du mouvement des poissons etc. Selon le type d'étude, nous pouvons analyser le texte en soi tel qu’il est présenté avec sa logique interne (par exemple, l’analyse lexicale d’un ensemble de discours politiques), ou analyser des textes en leur associant des variables extérieures au texte en soi (ex: analyse de contenu en traitant des variables telles que les personnages d’un roman, le sexe ou l’âge des répondants dans une enquête sociolinguistique, etc.). Des bases de données peuvent également être constituées et organisées, SPHINX-EURÊKA sert entre autres, à concevoir, rédiger, mettre en page et publier sur Internet des questionnaires ou enquêtes. Les résultats ainsi compilés peuvent ensuite être traités par le même logiciel.
Historique
Le Laboratoire a été mis sur pied en septembre 1999, par deux professeurs du Département d'études françaises: James de Finney (littéraire) et Sylvia Kasparian (linguiste). Il est le résultat de plusieurs collaborations des professeurs du Département avec des statisticiens, informaticiens, linguistes et littéraires d'Europe appartenant au mouvement de la statistique textuelle amorcé par Charles Muller et transformé par l'apport de l'Analyse Factorielle de correspondance (analyse statistique avancée) développée par le fameux mathématicien statisticien J. P. Benzécri (L. Lebart, A. Salem, E. Brunet, M. Reinart). Ce Laboratoire fait partie du réseau européen de l'analyse de données textuelles qui organise tous les deux ans les Journées internationales d'analyse statistique de données textuelles (JADT). Celles-ci permettent de mettre en commun les nouveaux outils informatiques et statistiques ainsi que la recherche récente en analyse de données. Il s’agit d’un réseau interdisciplinaire dans lequel mathématiciens, statisticiens, linguistes, psychologues, sociologues, littéraires, économistes, artistes et autres, travaillent ensemble. Des logiciels adaptés à chaque domaine sont développés par le réseau et le Laboratoire d’analyse de données textuelles collabore avec les concepteurs de ces logiciels dans le cadre de différents projets.