Visicorps : Génération de manipulation de corpus pour l'analyse sémantique

Un corpus est un ensemble de documents constituant une référence lors d'opération de traitement automatique du langage.

Visiblis propose deux types de corpus :

  • Les corpus partagés : Ces corpus sont générés à partir des SERPs de Google résultant d'une requête de recherche. Ils sont générés automatique par l'algorithme de Visiblis lors de vos analyses Visitext et Visilinks. Leur durée de vie est de 7 jours heures afin de tenir compte de l'évolution des SERPs. Le nombre de documents composant le corpus est calculé automatiquement par l'algorithme Visiblis.
  • Les corpus privés : Si vous avez souscrit à l'outil VisiCorps, vous disposez de la possibilité de créer vos propres corpus et de les sauvegarder le temps que vous voulez. Ces corpus sont privés et vous seul pouvez les utiliser. Vous pouvez créer ces corpus à partir d'une requête de recherche. Il vous est également possible de manipuler ces corpus pour les fusionner ou bien en extraire la partie commune.

Les données fournies par vos corpus privés sont de deux natures :

  • Des données statistiques concernant les champs lexicaux et la constitution de la SERP.
  • Des données sémantiques détaillant les champs lexicaux. Deux options s'offrent à vous :
    • la possibilité d'extraire un guide de rédaction à partir du corpus
    • la possibilité de consulter et d'extraire l'ensemble des n-grams du corpus avec leur puissance respective.

Il est également possible de comparer des corpus 2 à deux afin de mesurer leur proximité sémantique et calculer le glissement sémantique.

Les corpus privés peuvent êtres utilisés avec les outils Visitext et Visilinks

Remarque : Visicorps correspond à l'utilistaire CoocAlyser de la version précédente de Visiblis.

Visicorps