Apache Zeppelin

Apache Zeppelin - einfach und schnell zu explorativen Auswertungen

1

Was ist Apache Zeppelin?

Webbasiertes Notebook, das datengesteuerte, interaktive Datenanalysen und kollaborative Dokumente mit SQL, Scala und mehr ermöglicht.

Es gibt heutzutage eine Fülle an Tools und Werkzeugen für Data Science oder Data Analytics. Typischerweise nützen wir Apache NiFi und Apache Solr zur Verarbeitung von kontinuierlichen Daten oder Datenströmen und zum Durchsuchen von riesigen Datenmengen.

Sie haben jedoch eine Gemeinsamkeit, die zum Tragen kommt, nachdem Analysen durchgeführt wurden: Das Ergebnis wird in der Regel nicht optisch ansprechend dargestellt und Ergebnisse sind schwierig bzw. nicht mit anderen Personen, Kollegen, Vorgesetzten etc. teilbar.

Genau hier setzt Apache Zeppelin an. Es bietet einige sogenannte Interpreter, die es einfach machen, mit bestimmten Datenquellen zu interagieren bzw. mit bestimmten System zu kommunizieren und verhilft Ihnen so schnell zu explorativen Auswertungen.

Die Visualisierung der Daten geschieht in Banana.

Es bietet verschiedene Widgets für die Visualisierung wie man im nachfolgenden Screenshot sieht.

Darstellung verschiedener Widgets für die Visualisierung in Banana
2

Welche Vorteile bietet mir Apache Zeppelin?

Logo Apache Zeppelin

In Apache Zeppelin existieren bereits Interpreter für Spark, Flink, Solr,  Elasticsearch, Hive oder HBase, die es einfach machen, mit bestimmten Datenquellen zu interagieren bzw. mit bestimmten System zu kommunizieren. Diese Interpreter ermöglichen es dem Nutzer anspruchsvolle Cross Analytics zu realisieren und mit seinen Kollegen zu teilen. Natürlich kann man auch Zeitreihen analysieren, interpretieren und visualisieren, wie im folgenden Bild zu sehen:

Analyse, Interpretation und Visualisierung der durchschnittlichen Temperatur im Winter im Vergleich zum Sommer von 1949 bis 2014.
3

Nutzen Sie das volle Potenzial von Apache Zeppelin

Unser Partnerunternehmen Hortonworks hat dieses Potenzial bereits erkannt und daher Zeppelin in die eigene Plattform HDP eingebaut. Zeppelin wird dort als „ Modern Data Science Studio “ bezeichnet und dies ist durchaus zutreffend. Die Unabhängigkeit von der Datenquelle durch die Fülle an Interpretern macht Zeppelin zu einem Allzweckwerkzeug, das seinen Weg in der Big Data Welt sicher noch weitergehen wird.

Wir helfen Ihnen, wenn Sie verstehen wollen, wie Zeppelin in Ihre Unternehmensstruktur eingebunden werden kann, welchen Mehrwert es Ihnen liefert und wie Sie einfach und schnell zu explorativen Auswertungen kommen. Bei der Einführung, Entwicklung und Umsetzung von Projekten mit Zeppelin stehen wir Ihnen zur Seite auch wenn sie auf Big Data basieren.

Sie interessieren sich für Apache Zeppelin?

Sind Sie an weiterführenden Informationen interessiert? Vorträge zu diesem Thema können Sie auf dem Java Forum Stuttgart und der Data2Day in Karlsruhe von Daniel Wrigley hören und sehen.

Newsletter
Für den Newsletter anmelden und nichts mehr verpassen!
Anmelden