Cloudera vient de publier la troisième version de sa distribution du framework Java libre Hadoop. Cette distribution, indépendante du projet principal de la Fondation Apache, apporte plusieurs programmes intégrés pour faciliter la configuration et l'utilisation de Hadoop, selon Cloudera.
La distribution Hadoop de Cloudera, projet indépendant de la branche officielle maintenue par la Fondation Apache, arrive dans sa version 3. Elle embarque plusieurs logiciels supplémentaires, censés apporter de la fluidité dans l'installation, la configuration et l'utilisation du framework Java. « Les gens veulent un système complet qui a déjà été préintégré et testé, » explique Charles Zedlewski, le vice-président produits de Cloudera, pour expliquer l'intérêt de son projet.
Parmi les programmes centraux de Hadoop, on trouve les logiciels d'analyse de données Hive et Pig (ce dernier, développé initialement par Yahoo, qui a récemment abandonné sa distribution de Hadoop, utilise le langage Pig Latin), l'algorithme de MapReduce, le système de fichiers distribués de Hadoop (HDFS), ainsi que la base de données HBase. Dans cette version 3, on retrouvera en plus Flume, un outil d'agrégation des données, Sqoop, pour la conversion des formats de données, Hue, une interface graphique, et Zookeeper, pour la gestion de la configuration des systèmes distribués.
« Ce dont nous nous sommes rendu compte, » explique Zedlewski, « c'est que la majorité des organisations déploient un peu plus que Hadoop. Il y a tout un écosystème de composants open-source qui créent l'écosystème Hadoop dans son ensemble, celui-là même qui est utilisé en production aujourd'hui. » Cela justifierait selon lui l'implémentation des composants tiers ajoutés. De plus, l'intégration des composants dans une solution prépackagée permet, selon lui, d'éliminer une part importante du travail de scripts nécessaire normalement pour faire communiquer Hadoop avec eux.
Toutes les informations et la dernière version de la distribution Hadoop de Cloudera sont disponibles sur le site web de l'éditeur.