Seminarinformationen

Seminar - Ziel

In dieser 3-tägigen Schulung "Aufbau eines Hadoop-Clusters" lernen Sie Apache Hadoop und seine hochperformante, horizontale Skalierung kennen. Die Einsatzszenarien für Big Data werden besprochen. Die Schulung vermittelt den Aufbau der technischen Infrastruktur für den Hadoop-Cluster und die Installation der Basiskomponenten, darunter HDFS. Es wird auch auf die Konfiguration von Pig, Hive, HBase, Sqoop und Oozie eingegangen. Die Teilnehmer lernen die performancerelevanten Faktoren kennen. Die Schulung endet mit einer Zusammenfassung und Diskussion von spezifischen Fragestellungen. Nach dem Kurs sind die Teilnehmer in der Lage, eine optimale Hadoop-Cluster-Infrastruktur auszuwählen und zu konfigurieren.

Teilnehmer - Zielgruppe

  • Systemadministratoren

Kurs - Voraussetzungen

Für eine optimale Teilnahme am Kurs empfehlen wir folgende Vorkenntnisse:

  • Fundierte Kenntnisse in der Administration von Unix-Systemen
  • JSON-Kenntnisse

Seminardauer

  • 3 Tage
  • 09:00 Uhr bis 17:00 Uhr

Schulungsunterlagen

  • nach Absprache

Seminar-Inhalt / Agenda

Theoretische Einführung in Hadoop und Hadoop Cluster

  • Vorstellung des Hadoop-Frameworks
  • Vorstellung der administrationsrelevanten Komponenten
  • Grundlagen der Infrastruktur eines Hadoop-Cluster
  • Auswahlkriterien der Hardware und Infrastruktur

Praktische Umsetzung eines Hadoop Clusters

  • Erstellung des Installationsplans
  • Vorbereitung der Infrastruktur für die Installation
  • Installation der Basiskomponenten
  • Installation zusätzlicher Komponenten
  • Clusterkonfiguration mit Zookeeper

Abschluss

  • Zusammenfassung
  • Ausblick
  • Fragen und Antworten

Weitere Schulungen zu Thema Hadoop

Einstieg in Big Data mit Hadoop

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

Überblick über die Funktionsweise vom OpenSource MapReduce Framework Apache Hadoop. Wie entwickelt man Softwarelösungen für Hadoop?, Was sind die Vor- und Nachteile von Hadoop? (vor allem auch im Vergleich mit relationalen Datenbanken), Welche (ganz neuen) ...

Microsoft Azure HDInsight: Einsatzszenarien und Kostenmodell

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

In dieser 1-tägigen Schulung "Microsoft Azure HDInsight: Einsatzszenarien und Kostenmodell" erhalten Sie einen theoretischen Überblick über das Hadoop-Framework und dessen Einsatzszenarien im Big Data-Umfeld. Sie lernen die Vorteile von HDInsight im Vergleich zu ...

Hybrider Einsatz von Hadoop mit MongoDB

- u.a. in Berlin, Bremen, Hamburg, Dresden, Koblenz

In dieser 2-tägigen Schulung "Hybrider Einsatz von Hadoop mit MongoDB" lernen Sie effektive Strategien für den kombinierten Einsatz der beiden Systeme kennen, um große Datenmengen effizient zu verarbeiten und Echtzeitabfragen für Benutzer zu ermöglichen. Sie ...

Einsatzszenarien für Hadoop im Unternehmensumfeld

- u.a. in Frankfurt am Main, Hamburg, Köln, Dresden, Nordhausen

Apache Hadoop zählt zu den populärsten Lösungen im Big-Data-Umfeld. Die Architektur des Hadoop-Frameworks ermöglicht eine hochperformante und kosteneffiziente horizontale Skalierung über mehrere Rechnersysteme, was die Verarbeitung von Massendaten im Vergleich zu ...