Pig-Programmierung

Das Seminar "Pig-Programmierung" ist seitens des Herstellers nicht mehr verfügbar, bzw. abgekündigt. Wir können Ihnen diese Schulung in Form eines Workshops in Ihrem Unternehmen oder in unserem Schulungszentrum anbieten.

Seminarinformationen

Seminar - Ziel

Innerhalb dieses dreitägiges Seminars lernen Sie die Entwicklung mit Pig. Sie lernen verschiedene Einsatzszenarien kennen und den Umgang Datenquellen und Möglichkeiten der Datenverarbeitung.

Des Weiteren lernen Sie die Perfomance-Optimierung und das Troubleshooting bevor Sie anhand eines Fallbeispiels selbst entwickeln. Abschließend werden die vermittelten Themen zusammengefasst und Sie haben die Möglichkeit, spezifische Fragestellungen anzusprechen.

Nach dem Seminar sind Sie in der Lage, Scripts in Pig Latin zu erstellen und damit große Datenmengen zu verarbeiten. Zudem kennen Sie sich Datenimport und -Datenexport aus können die Teilnehmer Pig-Scripts in bestehende Hadoop-Lösungen integrieren oder externe Programme anbinden.

Teilnehmer - Zielgruppe

  • Softwareentwickler
  • Datenbankentwickler

Kurs - Voraussetzungen

  • IT-Grundkenntnisse
  • Grundkenntnisse in mindestens einer Programmiersprache (idealerweise Java)
  • Grundkenntnisse in Hadoop (siehe z.B. "Entwicklung mit Hadoop")

Seminardauer

  • 3 Tage
  • 09:00 Uhr bis 17:00 Uhr

Schulungsunterlagen

  • nach Absprache

Seminar-Inhalt / Agenda

Theoretischer Teil

  • Pig innerhalb der Hadoop-Frameworks
  • Wo man Pig einsetzen sollte und wo nicht
  • Erste Schritte mit Pig Latin

Praktischer Teil

  • Datenverabeitung aus verschiedenen Datenquellen
  • Numerischen Werte, Datumwerte und Texten verarbeiten
  • Verarbeiteten Daten ausgeben
  • Komplexe Relationale Operationen und Umstrukturierung der Daten
  • UDFs einsetzen
  • Shell-Befehlen in Pig
  • Zusammenarbeit von Pig mit anderen Hadoop-Komponenten wie Oozie, Hive oder HBase
  • Performance-Tuning und professionelles Debugging von Pig-Programmen
  • Umsetzung eines eigenes praxisnahen Projektes mit Pig

Abschluss

  • Zusammenfassung
  • Ausblick
  • Fragen und Antworten

Weitere Schulungen zu Thema Hadoop

(Schnell-)Einstieg in Big Data mit Hadoop

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

In diesem 3-tägigen Seminar geben wir Ihnen einen über Überblick über die Funktionsweise vom OpenSource MapReduce Framework Apache Hadoop. Dabei erfahren Sie, welche Vor- und Nachteile Hadoop besitzt, wie Sie Softwarelösungen für Hadoop entwickeln können, und welche ...

Entwickeln von Lösungen mit Apache Hadoop

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

Innerhalb dieses viertätigen Seminars werden Sie lernen, wie Sie Lösungen mit Apache Hadoop Lösungen entwickeln können um große Datenmengen analysieren zu können.

Aufbau des Hadoop-Clusters

- u.a. in Bremen, Köln, München, Darmstadt, Bochum

Innerhalb dieses dreitägigen Seminars lernen Sie den kompletten Aufbau eines Hadoop-Clusters. Nach der Vorstellung des Hadoop-Frameworks lernen Sie zunächst den Aufbau der notwendigen technischen Infrastruktur. Anschließend lernen Sie, wie Sie aus mehreren Maschinen ...

Hadoop mit relationalen Datenbanken als Hybridmodell

- u.a. in Bremen, Hamburg, Köln, Varaždin, Offenbach

In diesem Seminar lernen Sie die Anbindung der Hadoop-Komponente Hive an relationale Datenbanken. Zunächst lernen Sie die verschiedenen Möglichkeiten Hive mit anderen Datenbanken und Systemen zu kombinieren sowie die möglichen Einsatzszenarien. Im praktischen Teil lernen Sie ...