Hive-Programmierung

Das Seminar "Hive-Programmierung" ist seitens des Herstellers nicht mehr verfügbar, bzw. abgekündigt. Wir können Ihnen diese Schulung in Form eines Workshops in Ihrem Unternehmen oder in unserem Schulungszentrum anbieten.

Seminarinformationen

Seminar - Ziel

Innerhalb dieses dreitätigen Seminars lernen Sie die Programmierung mit der Hadoop-Komponente Hive. Nach einer Einführung in das Hive-Framework werden Grundlagen über das Hive-Datawarehouse vermittelt. Danach lernen Sie die Hive-Abfrage und erweiterte Themen wie User Defined Functions, Anbindung von Hive an andere Hadoop-Komponenten sowie Performance-Optimierung auf verschiedenen Ebenen. Anschließend wird eine Problemstellung aufgezeigt, die Sie im Rahmen eines Beispielprojekt mit Hive umsetzen. Abschließend werden die vermittelten Themen zusammengefasst und Sie haben die Möglichkeit, spezifische Fragestellung anzusprechen.

Nach dem Seminar sind Sie in der Lage ein Data Warehouse mit Hive aufzubauen, bestehende Daten aus einem traditionellen Datenbanksystem in Hive zu migrieren oder (Entwickler-Kenntnisse vorausgesetzt) erste eigene Anwendungen zu entwickeln, die mit Hive als Datenbasis arbeitet.

Teilnehmer - Zielgruppe

  • Softwareentwickler
  • Datenbankentwickler

Kurs - Voraussetzungen

  • IT-Grundkenntnisse
  • Erste Erfahrungen mit SQL
  • Erste Kenntnisse Hadoop oder Besuch des Seminars Entwicklung mit Hadoop

Seminardauer

  • 3 Tage
  • 09:00 Uhr bis 17:00 Uhr

Schulungsunterlagen

  • nach Absprache

Seminar-Inhalt / Agenda

Theorie

  • Hive innerhalb der Hadoop-Frameworks
  • Wo Hive einsetzen und wo nicht?
  • Erste Schritte in HiveQL und Unterschiede zu SQL

Praxis

  • Daten in da Hive-Warehouse
  • Umgang Hive-Datentypen
  • Relationale Operationen wie Gruppierung, JOIN und UNION
  • UDFs einsetzen
  • Daten exportieren
  • Einsatz des ODBC-Treibers
  • Zusammenarbeit von Hive mit anderen Hadoop-Komponenten wie Oozie, Pig oder Sqoop
  • Performance-Tuning von Hive-Abfragen und Troubleshooting
  • Partitionen und Datenkompression
  • Fallbeispiel

Abschluss

  • Zusammenfassung
  • Ausblick
  • Fragen und Antworten

Weitere Schulungen zu Thema Hadoop

(Schnell-)Einstieg in Big Data mit Hadoop

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

In diesem 3-tägigen Seminar geben wir Ihnen einen über Überblick über die Funktionsweise vom OpenSource MapReduce Framework Apache Hadoop. Dabei erfahren Sie, welche Vor- und Nachteile Hadoop besitzt, wie Sie Softwarelösungen für Hadoop entwickeln können, und welche ...

Entwickeln von Lösungen mit Apache Hadoop

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

Innerhalb dieses viertätigen Seminars werden Sie lernen, wie Sie Lösungen mit Apache Hadoop Lösungen entwickeln können um große Datenmengen analysieren zu können.

Pig-Programmierung

- u.a. in Dortmund, Frankfurt am Main, Hamburg, Basel, Essen

Innerhalb dieses dreitägiges Seminars lernen Sie die Entwicklung mit Pig. Sie lernen verschiedene Einsatzszenarien kennen und den Umgang Datenquellen und Möglichkeiten der Datenverarbeitung. Des Weiteren lernen Sie die Perfomance-Optimierung und das Troubleshooting bevor Sie ...

Hadoop mit relationalen Datenbanken als Hybridmodell

- u.a. in Berlin, Dortmund, Köln, Düsseldorf, Essen

In diesem Seminar lernen Sie die Anbindung der Hadoop-Komponente Hive an relationale Datenbanken. Zunächst lernen Sie die verschiedenen Möglichkeiten Hive mit anderen Datenbanken und Systemen zu kombinieren sowie die möglichen Einsatzszenarien. Im praktischen Teil lernen Sie ...