Lancement des outils d'analyse sémantique Visiblis

Il y a maintenant 15 jours que les outils Visiblis sont en ligne, et au regard des nombreux retours et questions de la part des utilisateurs, il m'a semblé utile de dresser un premier bilan. Avant toute chose, je tiens tout particulièrement à remercier Laurent Bourrelly pour ses conseils avisés et son "buzz" pour le moins efficace lors du lancement de Visiblis (n'hésitez pas à utiliser les outils Visiblis pour espionner son cocon sémantique) ainsi que Sylvain et Guillaume Peyronnet dont la Master Class Moteur et SEO est en grande partie à l'origine de la création de ces outils d'analyse.

Comme je le disais, j'ai eu de nombreux retours utilisateurs et pas mal de questions et suggestions concernant ces outils. J'ai essayé d'en faire une synthèse et d'annoncer dans ce billet, les évolutions et nouveautés à venir.

A propos du corpus utilisé par Visiblis.

De nombreuses questions et remarques concernaient le corpus utilisé par les outils d'analyse sémantique. Tout d'abord, certains utilisateurs ont noté des ambiguïtés en ce qui concerne la prise en compte des accents et l'absence de nombreux mots composées; d'autres part, certaines remarques portaient sur la prise en compte des mots rares, voir très rares. Dans un premier temps, j'ai donc décidé de recalculer les données du corpus existant en faisant la différence entre les mots accentués et non accentués et en intégrant les mots composés en tant que tel (ainsi, par exemple, le nouveau corpus fera la différence entre "garde-corps" et  "garde corps"). Ensuite, afin de prendre en compte les pages très spécialisées utilisant des mots rares, je travaille sur un enrichissement automatique du corpus en fonction des requêtes effectuées lors des analyses.

Le nouveau corpus est en cours de calcul (c'est un traitement assez long vu le nombre de documents) et devrait être opérationnel d'ici une dizaine de jours. Les utilisateurs en seront informés automatiquement lors de leur connexion dès que ce nouveau corpus sera en ligne.

En ce qui concerne l'enrichissement automatique du corpus, je procède actuellement à des tests d'algorithme. Dès qu'une méthode fiable et robuste sera définie, je mettrais cette fonctionnalité en ligne et en informerais les utilisateurs de la même manière.

Évolution des outils d'analyse sémantique

Certaines questions portaient sur la part faite par les outils entre le contenu réel d'une page WEB et son environnement (menus, sidebar, footer ...). Les outils Visiblis considèrent l'intégralité du texte présent dans une page sans distinction entre le texte des menus, sidebar etc... Identifier avec précision et certitude (c'est à dire quelque soit la page WEB analysée) le contenu réel d'une page est une opération complexe et couteuse en ressources. Cependant, afin de permettre à ceux qui le souhaite d'effectuer leur mesure sur ce qu'ils considèrent comme le contenu réel de leur page WEB, je prépare un nouveau module d'analyse de l'empreinte sémantique dans lequel il suffira de saisir ou de copier/coller la requête, le titre du texte et le texte en lui même en format texte brut. Ce module sera accessible à partir du Pack WEBMASTER et comportera également une API pour les Packs AGENCE; Il devrait-être en ligne d'ici la fin de la semaine.

Un autre outil fera également son apparition; Il s'agit d'un module de mesure du glissement sémantique entre deux pages WEB. Cette notion de glissement sémantique étant au cœur du concept de "cocon sémantique" il m'est apparu nécessaire de mettre en place un outil de  mesure indépendant et différent de celui d'analyse cartographique. L'outil est terminé et je vais le passer en bêta-test auprès des utilisateurs VIP avant de le rendre accessible à tous des le Pack BASIC.

Des tutoriels pour utiliser les outils et interpréter les résultats

De tous les retours, c'est la demande la plus récurrente. Je vais donc préparer des tutoriels sous forme de vidéo ou de slides (je n'ai pas encore fait le choix sur la forme la plus pratique) sur la manière de bien utiliser les outils Visiblis et guider les utilisateurs dans l'interprétation des résultats. Le premier de la série concernera le module d'analyse de l'empreinte sémantique, il est en gestation et sera publié prochainement sur le blog Visiblis, donc accessible à tous.

Enfin, pour permettre des échanges avec les utilisateurs ou entre utilisateurs, je vais également mettre en ligne un petit forum de discussion, privé et accessible uniquement aux utilisateurs inscrits (à partir du Pack BASIC). Afin de préserver la confidentialité de certains échanges, l'accès aux sujets de discussion sera en plus hiérarchisé et le niveau d'accès requis sera défini par l'auteur du sujet. Le script est en cours de développement...

Conclusion

En conclusion, je dirais que si les serveurs Visiblis on bien tenu le choc (c'était une inconnue) ma boite mail à explosé la première semaine et le téléphone a beaucoup sonné.  Un grand merci à tous ceux qui on relayé l'information sur les réseaux sociaux.