zurück zum Artikel

EMC macht Hadoop fit für den Unternehmenseinsatz

Matthias Parbel

Für die Big-Data-Analyse in Unternehmen kombiniert EMC die Greenplum-Datenbank mit Apache Hadoop und den Netzwerkspeichersystemen von Isilon – mit integrierter Unterstützung für HDFS.

(Bild: EMC)

Die Kombination von EMC-Isilon Scale-out-NAS-Systemen mit integrierter Unterstützung für das Hadoop-Dateisystem (HDFS) und der Greenplum Analytics-Plattform soll Unternehmen den Einstieg in die gezielte Big-Data-Analyse erleichtern – und Vertriebspartnern neue Marktchancen eröffnen [1]. Denn die Nummer eins [2] unter den weltweiten Storage-Herstellern will sich nicht allein auf das Speichern von Daten beschränken [3], sondern Kunden die Möglichkeit eröffnen, insbesondere auch die in den verteilten, unstrukturierten Daten enthaltenen Informationen nutzbringend für die Geschäftsprozesse zu erschließen. Das "Big Data"-Framework Apache Hadoop, das seit kurzem in Version 1.0 vorliegt [4], wurde speziell zur Entwicklung skalierbarer, verteilter Anwendungen zur Analyse großer Datenmengen (Big Data) ausgelegt.

In typischen Installationen mit Direct-Attached-Storage (DAS) bringt die Open-Source-Lösung jedoch das Problem mit sich, dass der NameNode zum Single-Point-of-Failure wird, wenn die Hadoop-Instanzen nicht geclustert werden. EMC hat deswegen nun die Unterstützung für HDFS in die Isilon-NAS-Systeme integriert, so dass alle für die Hadoop-Umgebung benötigten Daten zentral auf einem skalierbaren Speicher zusammengeführt und abgesichert werden können. Zudem werden die Daten dadurch auch über Standard-Protokolle wie NFS, CIFS oder FTP zugänglich. Mit Greenplum HD stellt EMC nun eine eigene Apache Hadoop-Implementierung bereit, die nicht nur den kompletten Hadoop-Stack inklusive HDFS, MapReduce, Hive, Pig, Hbase und Zookeeper mitbringt, sondern neben der Anbindung an Isilon OneFS auch eine Datenbank für die Big-Data-Analyse beinhaltet – bei Bedarf sogar als vorkonfigurierte Data Computing Appliance (DCA).

EMC-Partnern stehen die neuen Lösungskomponenten ab sofort zur Verfügung. Die Greenplum- und Isilon-Produkte wurden ausgiebig auf ein reibungsloses Zusammenspiel getestet – der Vertrieb von expliziten Bundles mit eigener SKU (Stock Keeping Unit) ist jedoch nicht vorgesehen. Die Komponenten für eine Hadoop-Installation müssen einzeln über die autorisierten Distributionspartner geordert werden. (map [5])


URL dieses Artikels:
https://www.heise.de/-1425334

Links in diesem Artikel:
[1] https://www.heise.de/news/EMC-Offensive-Wachstum-mit-Partnern-1227257.html
[2] https://www.heise.de/news/Nachfrage-nach-Speicherkapazitaet-legt-weiter-zweistellig-zu-1390860.html
[3] https://www.heise.de/hintergrund/EMC-Vom-Daten-sammeln-und-speichern-zur-Informationsverarbeitung-1339505.html
[4] https://www.heise.de/news/Hadoop-1-0-ist-fertig-1402010.html
[5] mailto:map@ix.de