Outil de lemmatisation : analyser et trouver des lemmes d'un texte


Ecrivez ou collez votre texte à analyser dans le champ ci dessus et appuyez sur le bouton 'OK' afin de lancer l'analyse.

Cet outil en ligne gratuit vous permet de :
  • Compter le nombre de mots
  • Compter le nombre de mots uniques
  • D'analyser les occurences d'un texte dont le contenu a été lemmatisé (avec historique des remplacements)


Qu'est ce que la lemmatisation?

La lémmatisation est une analyse lexicale qui permet de regrouper les mots d'une même famille ensemble : c'est un regroupement par lemme.
Chaque mot à une forme canonique (forme racine) et des formes fléchies (différentes occurences possibles).
Ces dernières sont toutes les déclinaisons qu'une entité peut prendre : verbes à l'infinitif / conjugué, mots au singulier / pluriel, déclinaisons masculin / féminin, etc....

Par éxemple, la lemmatisation du verbe 'positionner' (forme canonique) peut se faire par rapport à ce genre d'occurences :
  • positionnant
  • positionnait
  • positionnées
  • positions
  • position
  • positionna
  • positionnâtes
  • positionniez
  • etc...
Au delà de l'analyse de densité ou d'occurences dont peut se servir les moteurs de recherche tels que Google, la lemmatisation permet d'etudier le contenu éditorial d'une manière plus simple (le nombre de termes dinstincts est diminué) et d'améliorer la recherche d'informations (une base de données réduite permet des traitements complexes beaucoup plus rapidement).
Cet outil utilise une lemmatisation par dictionnaires et à ce sujet j'en profite pour remercier Sylvain Peyronnet pour son aide.


comments powered by Disqus

Jérôme Pasquelin

Referenceur - Webmaster
Email : contact@jerome-pasquelin.fr
Telephone : 06 52 66 03 87