Big Data: Technologien, Strategien & Trends

Seminarinformationen

Seminar - Ziel

Das Seminar gibt einen Überblick zu verschiedenen Themen, welche aus aktuellen IT-Überlegungen kaum mehr auszublenden sind.

In Abgrenzung zum Seminar „Big Data Einstieg“, in dem das quelloffene Software-Framework Hadoop im Mittelpunkt steht, wird in diesem Seminar der Schwerpunkt auf zugrundeliegende Technologien und Trends gelegt.

Schwierigkeitsgrad: 100

Darreichung: PowerPoint-Präsentation, Live-Demo.

Materialien: Präsentation in elektronischer Form (Format .PDF)

Credits: Ja (Credits für die Zertifizierung)

Teilnehmer - Zielgruppe

  • Manager
  • Entscheider
  • Architekten
  • Interessierte

Kurs - Voraussetzungen

Grundkenntnisse in Datenbanken und Business Intelligence

Seminardauer

  • 2 Tage
  • 09:00 Uhr bis 17:00 Uhr

Schulungsunterlagen

  • nach Absprache

Seminar-Inhalt / Agenda

Einführung

In diesem Abschnitt erfährt der Teilnehmer etwas über die Herausforderungen, vor denen die Informationstechnologie heute steht: Immer größere Datenmengen in immer kürzerer Zeit noch intelligenter zu analysieren. Diese Anforderungen werden im Detail erläutert und mit Beispielen aus der Praxis belegt.

Auf der Suche nach der Nadel im Heuhaufen

In diesem Abschnitt erfährt der Teilnehmer etwas über die riesigen Datenmengen, die durch die Welt bewegt werden und darüber, dass nicht das Speichern, sondern das Suchen nach und Analysieren von Informationen das Problem darstellt und wie die Lösung für dieses Problem ausschaut: Die verteilte Verarbeitung der Daten.

Ergebnisse der Auswertung: sofort!

Während vor zwei Jahrzehnten ein Monatsabschluss auf dem zentralen Computer einige Tage in Anspruch nahm, sind heute Auswertungen und Analysen sowie darauf basierende Reaktionen immer häufiger sofort erforderlich. Dies ist mit den klassischen Konzepten und Architekturen nicht umsetzbar.

Die Teilnehmer lernen modernen Konzepte und Strategien zur unmittelbaren Datenverarbeitung kennen.

Wenn Änderungen die einzige Konstante sind

Das klassische relationale Data Warehouse war die zentrale Instanz, dem sich die Wirklichkeit anzupassen hatte. Erforderliche Änderungen konnten oftmals nur mit großer Verzögerung implementiert werden.

In der agilen Welt von heute hat dieser Ansatz an Bedeutung verloren. Neue Konzepte wie NoSQL-Datenbanken und Data Lakes tragen den aktuellen Anforderungen Rechnung.

Wie nutzt man Daten aus sozialen Netzwerken?

Daten aus den sozialen Netzwerken gewinnen für eine gesamtheitliche Bewertung immer mehr an Bedeutung. Leider lassen sich Zusammenhänge aus diesen Netzwerken mit den klassischen Möglichkeiten nicht besonders effizient abbilden.

Die Teilnehmer lernen Konzepte kennen, die sich für die Darstellung und Auswertung von Knoten und Kanten in Netzen besonders gut eignen.

Die Nutzung der Cloud – Pro und Contra

Hinter dem Begriff „Cloud“ verbirgt sich ein Dienstangebot, welches standardisiert wahlweise Hardware, Software oder eine Plattform für die individuelle Nutzung bereitstellt.

Dem Vorteil der bedarfsorientierten und anpassbaren Nutzung stehen oftmals Sicherheitsbedenken entgegen. Die Teilnehmer machen sich mit verschiedenen Ansätzen der Cloud-Nutzung vertraut und wägen Pro und Contra ab.

Wie intelligent ist maschinelle Intelligenz?

Algorithmen übernehmen die Kontrolle. Immer häufiger kommen Konzepte zum Ansatz, in der die Software nicht nur lenkt, sondern „denkt“. Welches Potenzial steckt in selbstoptimierender Software, welche Gefahren lauern?

Die Teilnehmer lernen die Grundkonzepte von maschineller Intelligenz kennen und machen sich anhand von Beispielen mit den Möglichkeiten, aber auch mit den Risiken vertraut.

Das Internet der Dinge

Egal, ob es im Jahr 2020 20 Milliarden oder 26 Milliarden vernetzter Objekte sein werden (hier gehen die Prognosen weit auseinander) – es wird eine gewaltige Anzahl sein. Jedes dieser Objekte wird Daten bereitstellen, manche einmalig wie der verbrauchte Joghurt, manche permanent wie die Überwachungskamera. Manche emittieren wenige Daten wie der Stromzähler, manche viele wie das immer autonomer agierende Fahrzeug.

Das Internet der Dinge stellt völlig neue Herausforderungen an die Informationstechnologie, die in diesem Abschnitt noch einmal herausgearbeitet werden.

Die richtige Strategie?

Schöne neue Welt: Um den künftigen Anforderungen gerecht zu werden, bedarf es in der Regel einiger Veränderungen. Diese lassen sich jedoch nicht im Hauruck-Verfahren implementieren, sondern müssen sorgfältig geplant und umgesetzt werden, wenn sie erfolgreich sein sollen.

In diesem abschließenden Modul setzen sich die Teilnehmer – ausgehend von unterschiedliche Ausgangspositionen – mit verschiedenen Szenarien auseinander, um die künftigen Herausforderungen bestehen zu können

Weitere Schulungen zu Thema Big Data

(Schnell-)Einstieg in Big Data mit Hadoop

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

In diesem 3-tägigen Seminar geben wir Ihnen einen über Überblick über die Funktionsweise vom OpenSource MapReduce Framework Apache Hadoop. Dabei erfahren Sie, welche Vor- und Nachteile Hadoop besitzt, wie Sie Softwarelösungen für Hadoop entwickeln können, und welche ...

Brückenschlag zwischen Big Data und traditionellen BI und DWH-Systemen

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

In diesem zweitägigen Seminar erhalten Sie einen Überblick über Big Data und behandeln verschiedene Integrationsaspekte. Die beiden Module "Überblick" und "Integration" können auch seperat gebucht werden. Hinweis: Die Kurssprache am 24.06. wird ausnahmsweise Englisch sein

Wartung eines Hadoop-Clusters

- u.a. in Leipzig, München, Paderborn, Dresden, Offenbach

Innerhalb dieser zweitätigen Schulung lernen Sie verschiedene Methoden und Praktiken zur Überwachung und Instandhaltung des Clusters kennen, sowie die Anbindung auf derzeit oft verwendete Monitoring-Lösungen wie Chukwa und Ambari. Anschließend lernen Sie, wie Sie einen ...

Hadoop mit MongoDB als Hybridmodell

- u.a. in Bremen, Essen, Koblenz, Mannheim, Offenbach

Innerhalb dieses viertätigen Seminars lernen Sie, wie Sie Hadoop an die MongoDB anbinden können. Dazu lernen Sie die einzelnen Datenverarbeitungsschritte sinnvoll zwischen den beiden Systemen aufteilen können, um ein ein bestmögliches Ergebnis (sowohl bei der ...