Média social et agrégateur, Digg veut en finir avec les doublons afin de rassurer utilisateurs et annonceurs. Désormais, en plus de bloquer la réédition d'un même URL* sur 30 jours, Digg est en mesure d'identifier un contenu dupliqué, y compris si l'URL est différent, et ce grâce à un nouvel algorithme. Par ailleurs, des textes « similaires » émanant de sites web différents sont signalés comme de potentiels doublons (Dupe Detection)
« Pour mieux comprendre la nature du problème, nous avons analysé les types de récits dupliqués soumis. La plupart du temps il s'agit des mêmes histoires émanant du même site, mais avec des URL différents. Notre équipe de R&D est venue avec une solution permettant d'identifier ces types de copies en utilisant un algorithme spécifique », a expliqué Chris Howard, directeur produit Digg, sur son blog.
*URL : Uniform Resource Locator ou Localisateur Uniforme de Ressources