Utilisée en interne par Yahoo pour gérer ses dizaines de milliers de serveurs, cette distribution (source uniquement) est téléchargeable sur le site YDN du portail. « Nous avons passé des milliers d'heures machines à tester chaque version d'Hadoop que nous déployons en interne (...) Nous réalisons des tests de performance sur une plateforme de 500 machines en cluster », a déclaré Nigel Daley mercredi dans un dans un billet .
Daley, ingénieur qualité du département Yahoo Grid Technologies, conclut : « les tests incluent des essais d'interopérabilité du DistCp (distributed copy), des analyses du système de distribution de fichiers HDFS et du modèle de programmation MapReduce, ainsi que divers scénarios de défaillance. Tous ces tests de performance sont disponibles dans Apache Hadoop. Nous souhaitons également ouvrir à la communauté nos tests fonctionnels du système. »