Realtime Data Stream Pipelines

Realtime Data Stream Pipelines

Das Buch ist in Vorbereitung.

Big Data Training: Teil 4

Realtime Data Stream Pipelines

Moderne Big Data Anwendungen analysieren Datenströme sobald sie im Rechenzentrum eintreffen. Die Technologien dazu werden aktuell ständig weiter entwickelt. Wir betrachten die grundlegenden Konzepte und Architekturen. Wir installieren Apache Kafka, Apache Spark und Apache Flink und Readis auf dem Trainingscluster aus Band 1 und sammeln Hands-On erste Erfahrungen mit diesen faszinierenden Möglichkeiten der realtime Datenanalyse.

Zum Big Data Training

Big-Data-Technologien wurden in der ersten Dekade dieses Jahrhunderts bei den Internet-Riesen geschaffen und fanden ihren Weg in die Open Source Welt. Noch gibt es keine Standards und kaum Good Practices. Und doch wächst das allgemeine Interesse an diesen Technologien. Wer sie kennen lernen möchte, braucht keine immensen Datenmengen und Rechenzentren. Es reicht aus, eine Trainingsumgebung zu bauen und die einzelnen Komponenten der Big-Data-Technologien in geeigneter Reihenfolge kennen zu lernen. Und genau das ist das Ziel der Serie “Big Data Training”. Es zeigt die theoretischen Grundlagen, die Installation in der Trainingsumgebung und praktische Hands-On-Übungen.