Beschreibung
In diesem Seminar erhalten Sie einen Einblick in die wichtigsten Komponenten des Hadoop-Ökosystems. Sie bekommen eine Einführung in die zentralen Hadoop-Komponenten HDFS, YARN und MapReduce. Darauf aufbauend lernen Sie weitere wichtige Dienste aus dem Hadoop-Umfeld kennen. Dazu zählen Hive, Spark, HBase, Kafka und ZooKeeper. Viele praktische Übungen vertiefen das Gelernte.
Inhalte
-----------
- Einführung in das Hadoop-Ökosystem
- Überblick über Cloudera und den Cloudera Manager
- HDFS, YARN und MapReduce
- Hive und der Hive Metastore
- Dateiformate (z.B. Parquet, Avro und ORC)
- Spark und Spark SQL
- ZooKeeper
- HBase
- Sqoop
- Kafka