[Traduction] Introduction à RDFa
Ce mois-ci, Mark Birbeck nous a offert un très bon article sur RDFa sur le très célèbre site A List Apart. En voici la traduction. (Traduit avec la permission de A List Apart Magazine et de l’auteur)
RDFa ( »Ressource Description Framework in attributes ») a ses cinq minutes de gloire : Google commence à traiter RDFa et les Microformats pendant l’indexation des sites web, utilisant les données parsées pour améliorer l’affichage des résultats de recherche avec des « extraits riches ». Yahoo!, en attendant, supporte RDFa depuis presque un an. Avec ces deux géants de la recherche sur la même trajectoire, la nouvelle « version » du web est plus proche de nous que jamais auparavant.
Le web est conçu pour être consommé par des humains, et la majorité des riches et utiles informations que contiennent nos sites web est inaccessible aux machines. Les gens peuvent faire face à toutes les sortes de variations dans la disposition, le vocabulaire, la capitalisation, les couleurs, la position, etc… et comprennent toujours le sens de la page. Les machines, à l’opposé, ont besoin d’aide.
Une nouvelle version du web — un web sémantique — pourrait être fait d’informations marquées de telle sorte que les logiciels puissent également les comprendre facilement. Avant de considérer la manière dont nous pourrions réaliser un tel web, regardons ce que nous pourrions être capable de faire avec lui.
Recherche améliorée
Ajouter des données lisible par les ordinateurs à une page web améliore notre capacité de recherche. Imaginez un article de journal qui dirait « aujoud’hui le premier ministre s’est envolé pour l’Australie », en référence au premier ministre anglais, Gordon Brown. L’article pourrait ne pas appeler le premier ministre par son nom, mais il resterait très facile de s’assurer que cet article apparait quand quelqu’un cherche « Gordon Brown ».
Si l’article en question datait de 1940, alors nous ne voudrions pas que ce document apparaisse quand les utilisateurs cherchent « Gordon Brown » —mais nous voudrions qu’il apparaisse lorsqu’ils cherchent « Winston Churchill ».
Pour accomplir ceci en utilisant la même technique que dans l’exemple de Gordon Brown — i.e, en mettant en relation un groupe de mots avec un autre — notre moteur de recherche doit savoir les dates de début et de fin de mandat de tous les premiers ministres anglais, et de les faire correspondre avec la date de publication de l’article de journal. Ceci ne serait pas complètement impossible, mais comment faire si l’article est une pièce de fiction, ou si il parle actuellement du premier ministre australien ? Dans ces cas, une simple liste de dates ne pourrait pas nous aider.
Les algorithmes d’indexation qui essaient de déduire le contexte nécessaire du texte sont certains de s’améliorer dans les prochaines années, mais un balisage supplémentaire qui rende l’information non ambigüe peut seul rendre les recherches plus précises.
Interfaces utilisateur améliorées
Yahoo! et Google ont tous les deux commencé à utiliser RDFa pour améliorer l’expérience utilisateur en améliorant l’apparance des résultats de recherche individuels. Voici l’approche de Google :

Un extrait riche sur Google — © A List Apart
Et celle de Yahoo! :

Un example de résultat amélioré sur Yahoo ! — © A List Apart
Il y a un avantage commercial à avoir une meilleure « compréhension » des pages indexées : des publicités plus appropriées et focalisées peuvent être placées à coté des résultats de recherche.
Maintenant que nous avons ce que nous pourrions vouloir mettre des données lisibles par les machines dans nos pages, nous pouvons nous demander comment y parvenir.
fin de la page 1



[...] Birbeck vient de nous offrir la suite de son article sur RDFa publié sur A List Apart. En voici la traduction. (Traduit avec la permission de A List Apart [...]