Seminarinformationen

Seminar - Ziel

In diesem 1-tägigen Seminar „Building Batch Data Analytics Solutions on AWS“ lernen Sie, wie Sie Batch-Datenanalyselösungen mit Amazon EMR, einem verwalteten Service für Apache Spark und Apache Hadoop, erstellen. Sie werden mit Open-Source-Projekten wie Apache Hive, Hue und HBase sowie AWS-Services wie AWS Glue und AWS Lake Formation vertraut gemacht. Der Kurs behandelt die Sammlung, Aufnahme, Katalogisierung, Speicherung und Verarbeitung von Daten im Zusammenhang mit Spark und Hadoop. Außerdem lernen Sie den Einsatz von EMR Notebooks zur Unterstützung von Analysen und Machine Learning kennen. Ein besonderer Schwerpunkt liegt auf Best Practices für Sicherheit, Performance und Kostenkontrolle bei der Nutzung von Amazon EMR.

Im Seminar vergleichen Sie die Funktionen und Vorteile von Data Warehouses, Data Lakes und modernen Datenarchitekturen. Sie entwerfen und implementieren eine Batch-Datenanalyselösung und wenden geeignete Techniken zur Optimierung der Datenspeicherung an. Darüber hinaus lernen Sie, die passenden Optionen für die Aufnahme, Umwandlung und Speicherung von Daten auszuwählen sowie die richtigen Instanz- und Node-Typen, Cluster, automatische Skalierung und Netzwerktopologien zu bestimmen. Sie verstehen, wie die Speicherung und Verarbeitung von Daten Analyse- und Visualisierungsmöglichkeiten beeinflussen, um wertvolle Erkenntnisse zu gewinnen. Das Seminar umfasst zudem die Absicherung von Daten im Ruhezustand und während der Übertragung sowie das Monitoring analytischer Workloads zur Identifikation und Behebung von Problemen. Zusätzlich lernen Sie Best Practices für das Kostenmanagement anzuwenden.

Teilnehmer - Zielgruppe

  • Ingenieure für Datenplattformen
  • Entwickler und Operatoren, die Datenanalyse-Pipelines aufbauen und verwalten

Kurs - Voraussetzungen

Für eine optimale Teilnahme am Kurs empfehlen wir folgende Vorkenntnisse:

  • Teilnehmer mit mindestens einem Jahr Erfahrung in der Verwaltung von Open-Source Data Frameworks wie Apache Spark oder Apache Hadoop

Seminardauer

  • 1 Tag
  • 09:00 Uhr bis 17:00 Uhr

Schulungsunterlagen

  • nach Absprache

Seminar-Inhalt / Agenda

Überblick über Data Analytics und die Data Pipeline

  • Einsatzmöglichkeiten der Datenanalyse
  • Verwendung der Data Pipeline für die Datenanalyse

Einführung in Amazon EMR

  • Verwendung von Amazon EMR in Analyselösungen
  • Architektur von Amazon EMR-Clustern
  • Interaktive Demo 1: Starten eines Amazon EMR-Clusters
  • Strategien zur Kostenverwaltung

Datenanalyse-Pipeline mit Amazon EMR: Ingestion und Speicherung

  • Speicheroptimierung mit Amazon EMR
  • Methoden zur Datenübernahme

High-Performance-Batch-Datenanalyse mit Apache Spark auf Amazon EMR

  • Anwendungsbereiche von Apache Spark auf Amazon EMR
  • Warum Apache Spark auf Amazon EMR
  • Spark-Konzepte
  • Transformation, Verarbeitung und Analyse
  • Verwendung von Notebooks mit Amazon EMR
  • Datenanalyse mit niedriger Latenz mit Apache Spark auf Amazon EMR

Verarbeiten und Analysieren von Batch-Daten mit Amazon EMR und Apache Hive

  • Verwendung von Amazon EMR mit Hive zur Verarbeitung von Batch-Daten
  • Transformation, Verarbeitung und Analyse
  • Batch-Datenverarbeitung mit Amazon EMR und Hive
  • Einführung in Apache HBase auf Amazon EMR

Serverlose Datenverarbeitung

  • Serverlose Datenverarbeitung, -transformation und -analytik
  • Verwendung von AWS Glue mit Amazon EMR-Workloads
  • Orchestrierung der Datenverarbeitung in Spark mit AWS Step Functions

Security und Monitoring von Amazon EMR-Clustern

  • Sichern von EMR-Clustern
  • Client-seitige Verschlüsselung mit EMRFS
  • Überwachung und Fehlerbehebung von Amazon EMR-Clustern
  • Überprüfung des Verlaufs von Apache Spark-Clustern

Entwerfen von Batch-Datenanalyselösungen

  • Anwendungsfälle für die Batch-Datenanalytik
  • Entwerfen eines Arbeitsablaufs für die Batch-Datenanalyse

Entwickeln moderner Datenarchitekturen auf AWS

  • Moderne Datenarchitekturen
Tags: AWS

Weitere Schulungen zu Thema AWS

AWS Cloud Financial Management for Builders

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

In diesem 3-tägigen Seminar „AWS Cloud Financial Management for Builders“ lernen Sie, wie Sie die Kosten beim Betrieb von Workloads auf AWS verwalten, optimieren und vorhersagen können. Das Seminar richtet sich an Personen, die verstehen möchten, wie sie architektonische ...

Video Streaming Essentials for AWS Media Services

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

In diesem 2-tägigen Seminar „Video Streaming Essentials for AWS Media Services“ erhalten Sie einen umfassenden Einblick in bewährte Methoden zur Entwicklung und Nutzung von Cloud-basierten Video-Workflows. Das Seminar behandelt zentrale Konzepte rund um die ...

Advanced Architecting on AWS

- u.a. in Berlin, Bremen, Zürich, Koblenz, Marburg

In diesem 3-tägigen Seminar „Advanced Architecting on AWS“ lernen Sie, komplexe architektonische Herausforderungen anhand realistischer Szenarien zu lösen. Sie analysieren verschiedene AWS-Services und -Funktionen und bewerten deren Eignung als Lösung für spezifische ...

AWS Security Best Practices

- u.a. in Bremen, Köln, Stuttgart, Düsseldorf, Kassel

In diesem 1-tägigen Seminar „AWS Security Best Practices“ erhalten Sie einen umfassenden Einblick in bewährte Sicherheitsverfahren und Kontrollmechanismen für den Einsatz von AWS. Ziel ist es, Ihnen ein besseres Verständnis für sicherheitsrelevante Aufgaben zu ...