Pig-Programmierung

Das Seminar "Pig-Programmierung" ist seitens des Herstellers nicht mehr verfügbar, bzw. abgekündigt. Wir können Ihnen diese Schulung in Form eines Workshops in Ihrem Unternehmen oder in unserem Schulungszentrum anbieten.

Seminarinformationen

Seminar - Ziel

Innerhalb dieses dreitägiges Seminars lernen Sie die Entwicklung mit Pig. Sie lernen verschiedene Einsatzszenarien kennen und den Umgang Datenquellen und Möglichkeiten der Datenverarbeitung.

Des Weiteren lernen Sie die Perfomance-Optimierung und das Troubleshooting bevor Sie anhand eines Fallbeispiels selbst entwickeln. Abschließend werden die vermittelten Themen zusammengefasst und Sie haben die Möglichkeit, spezifische Fragestellungen anzusprechen.

Nach dem Seminar sind Sie in der Lage, Scripts in Pig Latin zu erstellen und damit große Datenmengen zu verarbeiten. Zudem kennen Sie sich Datenimport und -Datenexport aus können die Teilnehmer Pig-Scripts in bestehende Hadoop-Lösungen integrieren oder externe Programme anbinden.

Teilnehmer - Zielgruppe

  • Softwareentwickler
  • Datenbankentwickler

Kurs - Voraussetzungen

  • IT-Grundkenntnisse
  • Grundkenntnisse in mindestens einer Programmiersprache (idealerweise Java)
  • Grundkenntnisse in Hadoop (siehe z.B. "Entwicklung mit Hadoop")

Seminardauer

  • 3 Tage
  • 09:00 Uhr bis 17:00 Uhr

Schulungsunterlagen

  • nach Absprache

Seminar-Inhalt / Agenda

Theoretischer Teil

  • Pig innerhalb der Hadoop-Frameworks
  • Wo man Pig einsetzen sollte und wo nicht
  • Erste Schritte mit Pig Latin

Praktischer Teil

  • Datenverabeitung aus verschiedenen Datenquellen
  • Numerischen Werte, Datumwerte und Texten verarbeiten
  • Verarbeiteten Daten ausgeben
  • Komplexe Relationale Operationen und Umstrukturierung der Daten
  • UDFs einsetzen
  • Shell-Befehlen in Pig
  • Zusammenarbeit von Pig mit anderen Hadoop-Komponenten wie Oozie, Hive oder HBase
  • Performance-Tuning und professionelles Debugging von Pig-Programmen
  • Umsetzung eines eigenes praxisnahen Projektes mit Pig

Abschluss

  • Zusammenfassung
  • Ausblick
  • Fragen und Antworten

Weitere Schulungen zu Thema Hadoop

(Schnell-)Einstieg in Big Data mit Hadoop

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

In diesem 3-tägigen Seminar geben wir Ihnen einen über Überblick über die Funktionsweise vom OpenSource MapReduce Framework Apache Hadoop. Dabei erfahren Sie, welche Vor- und Nachteile Hadoop besitzt, wie Sie Softwarelösungen für Hadoop entwickeln können, und welche ...

Entwickeln von Lösungen mit Apache Hadoop

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

Innerhalb dieses viertätigen Seminars werden Sie lernen, wie Sie Lösungen mit Apache Hadoop Lösungen entwickeln können um große Datenmengen analysieren zu können.

Wartung eines Hadoop-Clusters

- u.a. in Frankfurt am Main, Hamburg, Wien, Bochum, Offenbach

Innerhalb dieser zweitätigen Schulung lernen Sie verschiedene Methoden und Praktiken zur Überwachung und Instandhaltung des Clusters kennen, sowie die Anbindung auf derzeit oft verwendete Monitoring-Lösungen wie Chukwa und Ambari. Anschließend lernen Sie, wie Sie einen ...

Hadoop Einsatzszenarien

- u.a. in Bremen, Hamburg, Nürnberg, Düsseldorf, Mannheim

Innerhalb dieses eintägigen Seminars erhalten Sie einen umfassenden Überblick über die Einsatzgebiete und lernen die Vorteile des Hadoop-Frameworks kennen. Dabei erfahren Sie auch, wie Sie mit Hadoop die Arbeit mit Massendaten hinsichtlich Kosten und Performance optimieren ...