L'École française d'analyse du discours a appliqué au traitement des corpus textuels deux principales méthodes empruntées à l'analyse de données multivariée : l'analyse des spécificités lexicales et l'analyse factorielle des correspondances (AFC). Dans une perspective complémentaire, nous présentons un procédé de classification spécificiquement adapté aux corpus ordonnés suivant une variable chronologique : la classification ascendante hiérarchique par contiguïtés (CAHC), introduite par Gries & Hilpert (variablility-based neighbour clustering, 2008 ; 2012) comme outil de périodisation dans le domaine de la linguistique de corpus diachronique. Cette méthode de classification est appliquée au traitement d'un corpus volumineux, celui des interventions en séance plénière au Parlement européen entre 1996 et 2011. A titre d'exemple, nous étudions la variation chronologique concernant l'usage du mot civilisation, tel qu'il se manifeste à travers ses inventaires collocationnels partitionnés par année.
- Autre