29 janvier 2020
http://creativecommons.org/licenses/by-nc-sa/ , info:eu-repo/semantics/OpenAccess
Nicolas Delestre, « Indexer pour le Web sémantique », HAL-SHS : sciences de l'information, de la communication et des bibliothèques, ID : 10670/1.l0su6m
Retour sur les principes de traitement intelligent appliqués par les moteurs de recherche pour non seulement trouver des pages susceptibles de répondre au besoin de l’utilisateur mais également extraire les réponses de ces pages et les synthétiser sur la page résultat. Le moteur Google procède de la sorte par l’intermédiaire de son « Rich Snippet » qui est alimenté par les métadonnées soumises par les producteurs d’informations via l' »Outil de test des données structurées » mis à disposition par le géant de Mountain View. Encore fallait-il s’entendre sur un vocabulaire partagé pour les métadonnées : « Titre » en français = « Title » en anglais ou encore « Akọle » en Yoruba (selon un traducteur en ligne). Google, Microsoft, Yahoo! et Yandex s’entendent donc pour créer en 2011 schema.org, véritable nomenclature des métadonnées pour pages Web et messages électroniques. Évocation ensuite des limites de ces techniques, la plus notable étant paradoxalement le manque de précision de ces métadonnées du fait d’un schéma trop universel.