EMC a ajouté à sa plateforme de gestion des données Greenplum la capacité de réaliser des rapports analytiques complets sur les larges volumes de données non-structurées. Hadoop Data Computing Appliance (DCA) doit désormais pouvoir mélanger données structurées et non-structurées.
Comme le rappellent plusieurs journaux américains ce matin, le monde des larges volumes de données est jusqu'à aujourd'hui coupé en deux : la Big Data peut être soit structurée autour d'une base de données relationnelle, qui permet de classer les choses simplement dans des cases, soit non-structurée. Cette deuxième est souvent issue de textes glanés en ligne, comme les commentaires, les historiques de requêtes à un serveur, etc. Le projet Hadoop, suffisamment flexible pour gérer les deux types de données, s'impose rapidement dans la Big Data non-structurée.
EMC dit donc qu'avec DCA, le problème de l'analytique est également résolu. A la version de DCA qui contient une appliance Hadoop, a été ajoutée la capacité à combiner les bases de données relationnelles avec Hadoop dans une seule appliance. L'analyse des données peut donc toucher tous les types de bases, du structuré au non-structuré, en passant par toutes les nuances.