Inhalte des Trainings
Egal ob Batch- oder Stream-Processing – Apache Spark hat sich dank seiner Performance als verteilte In-Memory-Technologie innerhalb kurzer Zeit einen Stammplatz im Ökosystem der Big Data Tools erarbeitet.
Dieses Training führt in den Umgang mit Spark zur Analyse großer Datenmengen ein. Dabei werden sowohl Batch- als auch Streamingverfahren diskutiert. Ein Schwerpunkt des Trainings ist die Formulierung von analytischen Anfragen und die Nutzung maschineller Lernverfahren. Ausgehend von konkreten Business-Anforderungen lernen die Teilnehmer geeignete Architekturen, Techniken und Tools kennen, um Lösungen zu implementieren, welche die Business-Anforderungen befriedigen.
In dem Training steht die Praxis im Vordergrund: Grundlage des Trainings ist eine komplexe Datenbasis an welcher Methoden, Tools & Techniken von den Teilnehmern geübt werden.
Zielgruppe:
Analysten, Software-Entwickler, Architekten
Dauer: 2 Tage
Agenda:
- Spark Grundlagen und Architektur
- Spark APIs und die RDD Datenstruktur
- Abfragen formulieren mit Spark SQL
- Transformationen und Aktionen im Spark-Kontext
- Zeppelin als Spark-Frontend
- Machine Learning mittels der Spark MLlib
- Überblick über das Apache-Spark-Ökosystem
- Design von Spark-Architekturen zur Umsetzung konkreter Usecases
- Die Kursgebühr beinhaltet Schulungsunterlagen, Teilnahmebescheinigung, Mittagessen, Getränke und Snacks
- Die Teilnehmer müssen ein eigenes Notebook zum Training mitbringen.
Dr. Robin Senge ist Senior Big Data Scientist bei inovex. Er konzipiert und implementiert als Spezialist für Maschinelles Lernen ad-hoc Datenanalysen und datengetriebene Use-Cases u.a. auf Basis von Apache Spark.
Anmeldung unter http://bit.ly/2ommHjM