Le World Wide Web est un espace universel contenant tout l'Internet. Pour retrouver les différentes ressources (pages web et autres documents) on utilise des adresses standardisées par les Identificateurs Uniformes de Ressource (URIs).
"Dans la proposition initiale de Tim Berners-Lee (NDLR : directeur du W3C - en photo), ainsi que dans la première implémentation du Web, relativement peu de technologies étaient mises en œuvre. Il s'agissait des URIs, du protocole Hypertext Transfer (HTTP) et du langage de balises HyperText (HTML). Les URIs, sans doute plus essentiels qu'HTTP ou HTML, sont de simples chaînes de caractères qui référencent tout type de ressources Internet, tels que documents, personnes, etc. Les URIs peuvent être assimilés à la colle qui tient le Web dans son ensemble. Les IRIs étendent et renforcent cette colle, en permettant aux personnes d'identifier des ressources Web dans leur propre langue.", nous explique le W3C.
Ainsi, les nouveaux standards URI (RFC 3986 écrit par Tim Berners-Lee du W3C, Roy Fielding de Day Software et Larry Masinter de Systems) et IRI (RFC 3987 écrit par Martin Dürst du W3C et Michel Suignard de Microsoft) apportent entre autre :
- la possibilité d'utiliser un nom d'hôte (host) internationalisé
- une révision des caractères réservés
- une clarification des ambiguités techniques de la précédente version (publiée en 1998)
- une définition des caractères internationaux unique quelque soit le standard (RDF, XHTML, XML, ...)
- l'élargissement des caractères autorisés dans la plupart des standard du sous-ensemble US-ASCII (comprenant l'alphabet latin non accentué et les caractères de ponctuation, codés sur 7 bits) à l'ensemble de caractères universels (Unicode/ISO 10646, codés sur 16 bits avec possibilité d'extension à 20 bits)