697 billets et 975 commentaires jusqu'à maintenant

Comment dévoiler le web caché grâce à Liendex

Le web caché, ou web invisible, est défini par le grand dictionnaire terminologique comme la "partie du Web correspondant à l'ensemble des documents Web qui n’est pas indexé par les outils de recherche traditionnels".

Ce web dit caché est composé, entre autres, de pages qui correspondent au résultat d'une action; une page web affichant la définition d'un mot suite à une recherche par exemple.

La méthode traditionnelle

Un exemple traditionnel auquel il m'est couramment arrivé d'être confronté est de vouloir relier par un hyperlien un mot à sa définition dans le grand dictionnaire terminologique. Or, les pages du grand dictionnaire terminologique sont dynamiques, c'est-à-dire qu'il faut faire la recherche manuellement pour avoir accès à la définition, on ne peut donc mettre un hyperlien qui mène directement là où on veut le conduire.

Dans un cadre traditionnel, il faudrait que l'internaute cliquant sur l'hyperlien fasse lui-même la recherche, ce qui nécessite du temps supplémentaire en plus des possibilités d'erreurs dans la recopie du mot, d'un clavier qui n'a peut-être pas les accents nécessaires, etc.

Mais, ne vous en faites pas, il est possible, grâce à la technologie des bookmarklets de contourner ce problème. C'est ce qu'a fait ptaff.ca en créant l'outil linguistique Liendex.

Supposons que vous écriviez un texte qui parle des unités de mesure et que vous cherchiez à faire un hyperlien vers la définition du grand dictionnaire terminologique. Avec l'ancienne méthode, vous en seriez réduit à écrire:

[…] la cuillère à thé (cherchez "cuillère à thé" dans le grand dictionnaire terminologique) est une unité de mesure […]

ce qui n'est pas très élégant et qui est, à mon avis, contre la philosophie à la base du web.

La méthode utilisant Liendex

Pourquoi ne pas utiliser Liendex comme tremplin vers la définition? Il sera ensuite possible de créer un hyperlien qui mène à la définition plutôt que d'infliger une recherche supplémentaire au visiteur qui vous donne généreusement de son temps pour vous lire.

Premièrement, rendez-vous sur la page web de Liendex. Écrivez "cuillère à thé" dans le champ de recherche.

Saisie d'écran avec la chaîne de caractères

Cliquez ensuite sur "Générer des hyperliens" pour créer les hyperliens vers les outils linguistiques pour cette chaîne de caractères. Il ne vous reste plus par la suite qu'à copier cet hyperlien et le mettre dans votre code html.

Menu contextuel ouvert sur l'hyperlien du grand dictionnaire terminologique avec la fonction

Ceci donnera, en fin de compte (cliquez sur l'hyperlien pour faire un test!):

[…] la cuillère à thé est une unité de mesure […]

ce qui est beaucoup plus compact, sans souci et dans l'esprit du web.

Et le web caché dans tout ça?

En procédant de la sorte avec Liendex, nous avons créé un hyperlien qui mène vers la définition du grand dictionnaire terminologique. Lorsque les moteurs de recherche indexeront votre page, ils feront correspondre la chaîne de caractères ("cuillère à thé") à la page qui est pointée, c'est-à-dire la définition du grand dictionnaire terminologique… ce qui consiste en fait à faire apparaître la page du grand dictionnaire terminologique dans les moteurs de recherche! Le web caché peut donc être dévoilé grâce à Liendex.

Il est aussi possible d'utiliser n'importe lequel des outils de Liendex, pas juste le grand dictionnaire terminologue, et d'utiliser la même méthode pour la langue anglaise, Liendex offrant aussi cette option.

Un exemple concret peut-être visualisé en faisant une recherche dans google sur le mot "dendroclimatologie": Saisie d'écran sur le moteur de recherche google avec la chaîne de caractères

J'avais utilisé ce mot dans le billet intitulé "Contribution du CO2 au réchauffement global" et publié sur ce blogue au mois de novembre 2005.

Un commentaire à « Comment dévoiler le web caché grâce à Liendex »

  1. stefan
    27 avril 2006 | 14:04

    Le problème dont tu parles est le fait que certains sites ne sont pas RESTful (http://fr.wikipedia.org/wiki/REST) et non parce que les sites sont dynamiques.

    Quelques corrections s'appliquent donc à ton texte.

    Ce web dit caché est composé, entre autres, de pages qui correspondent au résultat d'une action; une page web affichant la définition d'un mot suite à une recherche par exemple.

    Si un site est RESTful, il permetra de rendre les pages produites par des actions d'être visible, par exemple google permet de rendre visible toutes les recherches qui y sont faites. Ce qui est important, c'est qu'il soit possible de créer un URL vers la page, et donc de rendre la page visible.

    Or, les pages du grand dictionnaire terminologique sont dynamiques, c'est-à-dire qu'il faut faire la recherche manuellement pour avoir accès à la définition, on ne peut donc mettre un hyperlien qui mène directement là où on veut le conduire.

    Ce n'est pas parce que les pages du dictionnaire terminologique sont dynamiques qu'elles restent invisible au net. C'est parce qu'il est impossible de créer un hyperlien qui mène directement vers une définition.

Réagissez