Pig-Programmierung

Das Seminar "Pig-Programmierung" ist seitens des Herstellers nicht mehr verfügbar, bzw. abgekündigt. Wir können Ihnen diese Schulung in Form eines Workshops in Ihrem Unternehmen oder in unserem Schulungszentrum anbieten.

Seminarinformationen

Seminar - Ziel

Innerhalb dieses dreitägiges Seminars lernen Sie die Entwicklung mit Pig. Sie lernen verschiedene Einsatzszenarien kennen und den Umgang Datenquellen und Möglichkeiten der Datenverarbeitung.

Des Weiteren lernen Sie die Perfomance-Optimierung und das Troubleshooting bevor Sie anhand eines Fallbeispiels selbst entwickeln. Abschließend werden die vermittelten Themen zusammengefasst und Sie haben die Möglichkeit, spezifische Fragestellungen anzusprechen.

Nach dem Seminar sind Sie in der Lage, Scripts in Pig Latin zu erstellen und damit große Datenmengen zu verarbeiten. Zudem kennen Sie sich Datenimport und -Datenexport aus können die Teilnehmer Pig-Scripts in bestehende Hadoop-Lösungen integrieren oder externe Programme anbinden.

Teilnehmer - Zielgruppe

  • Softwareentwickler
  • Datenbankentwickler

Kurs - Voraussetzungen

  • IT-Grundkenntnisse
  • Grundkenntnisse in mindestens einer Programmiersprache (idealerweise Java)
  • Grundkenntnisse in Hadoop (siehe z.B. "Entwicklung mit Hadoop")

Seminardauer

  • 3 Tage
  • 09:00 Uhr bis 17:00 Uhr

Schulungsunterlagen

  • nach Absprache

Seminar-Inhalt / Agenda

Theoretischer Teil

  • Pig innerhalb der Hadoop-Frameworks
  • Wo man Pig einsetzen sollte und wo nicht
  • Erste Schritte mit Pig Latin

Praktischer Teil

  • Datenverabeitung aus verschiedenen Datenquellen
  • Numerischen Werte, Datumwerte und Texten verarbeiten
  • Verarbeiteten Daten ausgeben
  • Komplexe Relationale Operationen und Umstrukturierung der Daten
  • UDFs einsetzen
  • Shell-Befehlen in Pig
  • Zusammenarbeit von Pig mit anderen Hadoop-Komponenten wie Oozie, Hive oder HBase
  • Performance-Tuning und professionelles Debugging von Pig-Programmen
  • Umsetzung eines eigenes praxisnahen Projektes mit Pig

Abschluss

  • Zusammenfassung
  • Ausblick
  • Fragen und Antworten

Weitere Schulungen zu Thema Big Data

(Schnell-)Einstieg in Big Data mit Hadoop

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

In diesem 3-tägigen Seminar geben wir Ihnen einen über Überblick über die Funktionsweise vom OpenSource MapReduce Framework Apache Hadoop. Dabei erfahren Sie, welche Vor- und Nachteile Hadoop besitzt, wie Sie Softwarelösungen für Hadoop entwickeln können, und welche ...

Big Data: Technologien, Strategien & Trends

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

Das Seminar gibt einen Überblick zu verschiedenen Themen, welche aus aktuellen IT-Überlegungen kaum mehr auszublenden sind. In Abgrenzung zum Seminar „Big Data Einstieg“, in dem das quelloffene Software-Framework Hadoop im Mittelpunkt steht, wird in diesem Seminar der ...

Aufbau des Hadoop-Clusters

- u.a. in München, Dresden, Düsseldorf, Koblenz, Virtual Classroom

Innerhalb dieses dreitägigen Seminars lernen Sie den kompletten Aufbau eines Hadoop-Clusters. Nach der Vorstellung des Hadoop-Frameworks lernen Sie zunächst den Aufbau der notwendigen technischen Infrastruktur. Anschließend lernen Sie, wie Sie aus mehreren Maschinen ...

Wartung eines Hadoop-Clusters

- u.a. in Hamburg, Stuttgart, Leipzig, Offenbach, Freiburg

Innerhalb dieser zweitätigen Schulung lernen Sie verschiedene Methoden und Praktiken zur Überwachung und Instandhaltung des Clusters kennen, sowie die Anbindung auf derzeit oft verwendete Monitoring-Lösungen wie Chukwa und Ambari. Anschließend lernen Sie, wie Sie einen ...