Beschreibung
Hadoop basierte Big-Data-Systemumgebungen zeichnen sich durch eine Vielzahl unterschiedlichster Komponenten aus, welche in Kombination die Realisierung vielfältigster Anwendungsfälle im Big-Data-Umfeld ermöglichen. Bedingt durch die damit verbundene heterogene Systemlandschaft ergibt sich, insbesondere im Rahmen der Administration, ein herausforderndes Tätigkeitsumfeld. Dieses Seminar vermittelt das notwendige Know-how zur Planung, Installation und Administration eines Hadoop-Clusters auf Basis der Cloudera-Distribution.
Inhalte
-----------
- Hadoop Überblick
- Cluster Manager
- Cluster Deployment
- Konfiguration eines Hadoop Clusters
- HDFS
- YARN
- Wartung eines Hadoop Clusters
- Monitoring eines Hadoop Clusters
- Hadoop Security