Afin d'uniformiser et d'accélérer l'usage des technologies du web sémantique, Yahoo, Google et Microsoft se sont accordés sur une terminologie commune pour les microformats.
Lorsqu'il est strictement réservé aux pages web (par opposition à l'ensemble du web non représenté en HTML) la notion de web sémantique se présente sous la forme des microformats. Il s'agit de formater le code existant pour générer des méta-données, lesquelles pourront ensuite être interprétées par le navigateur ou un autre logiciel. Si le navigateur est déjà capable lire les balises du code HTML, ces dernières ne font pas véritablement de sens. Ce problème sera donc pallié par l'ajout de méta-données décrivant la nature du contenu.
Il existe plusieurs types de microformats permettant de décrire un évènement, une personne, un endroit, un produit ou encore une organisation. L'utilisation des microformats spécifie l'utilisation de certaines classes pré-définies au sein du code HTML. Celles-ci pourront ensuite être référencées au sein de la feuille de style pour le choix de la mise en forme. Il est par exemple possible de se créer une hCard (carte de visite en HTML) à partir de ce site. Pour un webmaster, l'usage des microformats assure également un meilleur référencement par les moteurs de recherche, ces derniers étant même capables d'enrichir les résultats d'une requête en retournant directement depuis la page du moteur la vignette d'une photo ou d'un clip vidéo.
Code HTML simple présentant le film Avatar
Les microformats peuvent cependant engendrer un certain nombre de problèmes au niveau de la feuille de style. En effet, certaines de ces classes peuvent avoir été précédemment utilisées par le développeur avec une mise en forme différente. Ainsi la classe photo, notamment employée pour décrire un avatar au sein de votre nouvelle carte de visite peut avoir été préalablement choisie au sein d'une galerie de photos bénéficiant d'une mise en forme différente sur la même page.
Afin de pallier ce problème et en vue d'uniformiser l'usage de ces microsformats, Yahoo! Google et Microsoft ont alors proposé un lexique commun basé sur le standard du W3C et permettant de mieux identifier le contenu au sein d'une page HTML pour les moteurs de recherche. Chaque contenu de la page sera ainsi enveloppé à l'intérieur de divisions supérieures, facilitant également la mise en forme pour le développeur. itemscope, itemtype et itemprop permettront respectivement d'encapsuler et d'identifier le type de contenu de la page. Retrouvez davantage d'informations sur Schema.org.
Code HTML + microformats présentant le film Avatar