Analyse de texte

Définition:

Le Text mining - en français analyse de texte - désigne l'ensemble des techniques permettant l'extraction automatique d'information à valeur ajoutée issue de corpus de données textuelles.

Utilisations:

A un niveau élémentaire, ces outils permettent d'obtenir facilement un aperçu d'un texte ou d'en extraire les mots-clés. Pour se faire une idée des potentialités du Text mining, voir par exemple Shakespeare Searched.

Remarque pour les utilisateurs:
Bien que les outils de Text mining se soient multipliés ces dernières années, la plupart d'entre eux demandent un certain investissement pour être pris en main.
Néanmoins certains outils simples, directement utilisable en ligne, permettent d'acquérir facilement une première expérience avant d'aller plus loin. Voir aussi la rubrique Nuages de mots.

Google Ngram Viewer
Outil sémantique qui permet visualiser sous forme de graphique les occurrences de mots dans le corpus de Google Books.

Textalyser
Classe par occurrence les mots ou groupes de mots d'un texte. Possède une stoplist en anglais et français.

Hyperpo
Permet d'analyser plusieurs textes simultanément. Liste aussi les occurrences de mots dans leur contexte.

Tapor
Portail regroupant divers outils avancés d'analyse de texte. Voir aussi le portail Tada (Text Analysis Developper Alliance) qui fournit des didacticiels.

Voyant
Classe par occurrence les mots d'un texte. Possède une stoplist en plusieurs langues. Génère un nuage de mots à partir du texte.

Textable
Permet de construire visuellement des chaines de traitement de données textuelles.

NelSenso
L'outil offre une série d'outils d'analyse de texte, dont IRezer, qui permet l'extraction automatique de mots-clés, SummazerSummazer, qui génère un résumé de texte, et Clustezer, qui permet de classer des phrases ou des chaînes de texte.

Pour aller plus loin:
Une liste d'outils spécialisés pour l'analyse de texte.