Apache Zeppelin - einfach und schnell zu explorativen Auswertungen

Was ist Apache Zeppelin?

Webbasiertes Notebook, das datengesteuerte, interaktive Datenanalysen und kollaborative Dokumente mit SQL, Scala und mehr ermöglicht.

Es gibt heutzutage eine Fülle an Tools und Werkzeugen für Data Science oder Data Analytics. Typischerweise nützen wir Apache NiFi und Apache Solr zur Verarbeitung von kontinuierlichen Daten oder Datenströmen und zum Durchsuchen von riesigen Datenmengen.

Sie haben jedoch eine Gemeinsamkeit, die zum Tragen kommt, nachdem Analysen durchgeführt wurden: Das Ergebnis wird in der Regel nicht optisch ansprechend dargestellt und Ergebnisse sind schwierig bzw. nicht mit anderen Personen, Kollegen, Vorgesetzten etc. teilbar.

Genau hier setzt Apache Zeppelin an. Es bietet einige sogenannte Interpreter, die es einfach machen, mit bestimmten Datenquellen zu interagieren bzw. mit bestimmten System zu kommunizieren.

Die Visualisierung der Daten geschieht in Banana.

Es bietet verschiedene Widgets für die Visualisierung wie man im nachfolgenden Screenshot sieht.

Apache Spark SQL

Welche Vorteile bietet mir Apache Zeppelin?

Apache Zeppelin

In Apache Zeppelin existieren bereits Interpreter für Spark, Flink, Solr,  Elasticsearch, Hive oder HBase, die es einfach machen, mit bestimmten Datenquellen zu interagieren bzw. mit bestimmten System zu kommunizieren. Diese Interpreter ermöglichen es dem Nutzer anspruchsvolle Cross Analytics zu realisieren und mit seinen Kollegen zu teilen. Natürlich kann man auch Zeitreihen analysieren, interpretieren und visualisieren, wie im folgenden Bild zu sehen:

Apache Zeppelin Histogram

Nutzen Sie das volle Potenzial von Apache Zeppelin

Unser Partnerunternehmen Hortonworks hat dieses Potenzial bereits erkannt und daher Zeppelin in die eigene Plattform HDP eingebaut. Zeppelin wird dort als „ Modern Data Science Studio “ bezeichnet und dies ist durchaus zutreffend. Die Unabhängigkeit von der Datenquelle durch die Fülle an Interpretern macht Zeppelin zu einem Allzweckwerkzeug, das seinen Weg in der Big Data Welt sicher noch weitergehen wird.

Wir helfen Ihnen, wenn Sie verstehen wollen, wie Zeppelin in Ihre Unternehmensstruktur eingebunden werden kann und welchen Mehrwert es Ihnen liefert. Bei der Einführung, Entwicklung und Umsetzung von Projekten mit Zeppelin stehen wir Ihnen zur Seite auch wenn sie auf Big Data basieren.

Sie interessieren sich für Apache Zeppelin?

Sind Sie an weiterführenden Informationen interessiert? Vorträge zu diesem Thema können Sie auf dem Java Forum Stuttgart und der Data2Day in Karlsruhe von Daniel Wrigley hören und sehen.