Aufbau des Hadoop-Clusters

Seminarinformationen

Seminar - Ziel

Innerhalb dieses dreitägigen Seminars lernen Sie den kompletten Aufbau eines Hadoop-Clusters.

Nach der Vorstellung des Hadoop-Frameworks lernen Sie zunächst den Aufbau der notwendigen technischen Infrastruktur. Anschließend lernen Sie, wie Sie aus mehreren Maschinen bestehender Cluster mit seinen Basiskomponenten inklusive des Dateisystems HDFS aufbauen, konfigurieren und in Betrieb nehmen können. Dies beinhaltet auch die die Installation und Konfiguration einzelner Komponenten wie

  • Pig
  • Hive
  • HBase
  • Sqoop

Hier gehen wir auch speziell auf performancerelevante Faktoren der Infrastruktur, Installation und Konfiguration ein. Abschließend werden die behandelten Themen noch einmal zusammengefasst und die TeilnehmerInnen haben die Möglichkeit, spezifische Fragestellungen anzusprechen.

Nach dem Seminar sind die Sin der Lage eine optimale Infrastruktur für den Aufbau eines Hadoop-Clusters auszuwählen und aufzubauen sowie dessen Installation und Konfiguration

Teilnehmer - Zielgruppe

Systemadministratoren

Kurs - Voraussetzungen

  • Gute Unix-Kenntisse
  • XML-Kenntnisse

Seminardauer

  • 3 Tage
  • 09:00 Uhr bis 17:00 Uhr

Schulungsunterlagen

  • nach Absprache

Seminar-Inhalt / Agenda

Theorie

  • Über das Hadoop Framework
  • Welche Komponenten sind für die Administration wichtig?
  • Grundlagen der Infrastruktur
  • Auswahl von Hardware und Infrastruktur


Praxis

  • Installationspläne erstellen
  • Vorbereitung der Infrastruktur für die Installation
  • Basiskomponenten installieren
  • Weitere Komponenten installieren
  • Mittels Zookeeper die Cluster konfigurieren


Abschluss

  • Zusammenfassung
  • Ausblick
  • Fragen und Antworten

Weitere Schulungen zu Thema Hadoop

(Schnell-)Einstieg in Big Data mit Hadoop

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

In diesem 3-tägigen Seminar geben wir Ihnen einen über Überblick über die Funktionsweise vom OpenSource MapReduce Framework Apache Hadoop. Dabei erfahren Sie, welche Vor- und Nachteile Hadoop besitzt, wie Sie Softwarelösungen für Hadoop entwickeln können, und welche ...

Microsoft Azure HDInsight: Einsatzszenarien und Kostenmodell

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

Apache Hadoop zählt zu den populärsten Lösungen im Big Data-Umfeld. Die Architektur des Hadoop-Frameworks ermöglicht eine leistungsfähige und kosteneffiziente horizontale Skalierung über mehrere Rechnersysteme, was die Verarbeitung von Massendaten im Vergleich zu ...

Wartung eines Hadoop-Clusters

- u.a. in Bremen, Mannheim, Erfurt, Freiburg, Kassel

Innerhalb dieser zweitätigen Schulung lernen Sie verschiedene Methoden und Praktiken zur Überwachung und Instandhaltung des Clusters kennen, sowie die Anbindung auf derzeit oft verwendete Monitoring-Lösungen wie Chukwa und Ambari. Anschließend lernen Sie, wie Sie einen ...

Hadoop mit MongoDB als Hybridmodell

- u.a. in Frankfurt am Main, München, Wien, Darmstadt, Kassel

Innerhalb dieses viertätigen Seminars lernen Sie, wie Sie Hadoop an die MongoDB anbinden können. Dazu lernen Sie die einzelnen Datenverarbeitungsschritte sinnvoll zwischen den beiden Systemen aufteilen können, um ein ein bestmögliches Ergebnis (sowohl bei der ...