Le fabricant norvégien Opera Software, qui s'est récemment entretenu avec Clubic, a publié les résultats d'une étude sur la véritable nature actuelle du web et la manière dont la Toile est structurée. Au travers d'un outil baptisé MAMA, (Metadata Analysis and Mining Application), 3,5 millions de pages ont donc été indexées puis analysées sous différents les angles.
Les balises HTML principalement analysées sont plutôt classiques : HEAD, TITLE, BODY, A, META, IMG et TABLE. Dans le corps de la page, c'est la balise A servant à former des liens qui est la plus populaire, suivi de IMG pour l'intégration d'une image à la page web. Au grand dam des puristes, Opera révèle qu'environ un quart des sites Internet utilisent la technologie Flash. Ce sont les sites chinois qui en font le plus usage (+67%). En France, ce pourcentage est de 41,58%.
L'usage du XMLHttpRequest, l'un des composants principaux de l'Ajax, n'est utilisé que dans 4,29% des pages indexées par MAMA. C'est la Norvège qui affiche le taux le plus élevé avec une part de 10,18%. Dans l'Hexagone, l'utilisation du JavaScript désynchronisé est inférieure à la moyenne : 3,68% des pages.
En analysant la balise STYLE présente dans la tête des pages, l'équipe de chercheurs d'Opera Software s'est aussi penchée sur l'usage des propriétés CSS. En fait, 80.39% des sites utiliseraient une feuille de style, il s'agit donc d'une technique largement répandue. Ce sont les propriétés de mise en forme du texte qui sont le plus utilisées à savoir color, font-size et font-family.
Enfin, de par son histoire et son engagement envers les standards du web régulés par le consortium W3C, Opera ne pouvait pas faire l'impasse sur la structure du code source des pages web analysées. Il en ressort que seuls 4,13% des pages sont véritablement respectueuses des standards et que la moitié des sites présentant un badge de validation W3C le sont réellement. Seulement 3,4% des pages créées au travers du logiciel d'édition Adobe Dreamweaver génère un code correct. Étrangement, la palme revient à (accrochez-vous) iWeb, un outil relativement basique, mais dont 81% des pages sont aux normes W3C!