pds-it
['Produktdetailseite','nein']
Amazon Web Services / AWS Data Analytics
Die Illustrationen sind in Kooperation von Menschen und künstlicher Intelligenz entstanden. Sie zeigen eine Zukunft, in der Technologie allgegenwärtig ist, aber der Mensch im Mittelpunkt bleibt.
KI-generierte Illustration

Building Batch Data Analytics Solutions on AWS

Online
1 Tag
Deutsch
€ 730,–
zzgl. MwSt.
€ 868,70
inkl. MwSt.
Buchungsnummer
36413
Veranstaltungsort
Online
2 Termine
€ 730,–
zzgl. MwSt.
€ 868,70
inkl. MwSt.
Buchungsnummer
36413
Veranstaltungsort
Online
2 Termine
Werde zertifizierter
Machine Lerning Engineer
Dieser Kurs ist Bestandteil der zertifizierten Master Class "Machine Learning Engineer". Bei Buchung der gesamten Master Class sparst du über 15 Prozent im Vergleich zur Buchung dieses einzelnen Moduls.
Zur Master Class
Inhouse Training
Firmeninterne Weiterbildung nur für eure Mitarbeiter:innen - exklusiv und wirkungsvoll.
Anfragen
In Kooperation mit
In diesem Kurs lernst du den Aufbau von Batch-Datenanalyselösungen mit Amazon EMR, einem verwalteten Apache Spark- und Apache Hadoop-Service der Enterprise-Klasse.
Inhalte

Erfahre, wie Amazon EMR mit Open-Source-Projekten wie Apache Hive, Hue und HBase und mit AWS-Services wie AWS Glue und AWS Lake Formation integriert wird. Der Kurs behandelt die Komponenten Datenerfassung, -aufnahme, -katalogisierung, -speicherung und -verarbeitung im Kontext von Spark und Hadoop. Du lernst die Verwendung von EMR Notebooks zur Unterstützung von Analyse- und Machine-Learning-Arbeitslasten. Du lernst auch, die besten Praktiken für Sicherheit, Leistung und Kostenmanagement auf den Betrieb von Amazon EMR anzuwenden.

Modul A: Überblick über Datenanalyse und die Datenpipeline

  • Anwendungsfälle der Datenanalyse 
  • Verwendung der Datenpipeline für die Datenanalyse

 

Modul 1: Einführung in Amazon EMR

  • Verwendung von Amazon EMR in Analyselösungen
  • Architektur von Amazon-EMR-Clustern
  • Interaktive Demo 1: Starten eines Amazon-EMR-Clusters
  • Strategien zur Kostenverwaltung

 

Modul 2: Datenanalyse-Pipeline mit Amazon EMR: Ingestion und Speicherung

  • Speicheroptimierung mit Amazon EMR
  • Techniken zur Datenübernahme

 

Modul 3: Leistungsstarke Batch-Datenanalyse mit Apache Spark auf Amazon EMR

  • Anwendungsfälle für Apache Spark auf Amazon EMR
  • Warum Apache Spark auf Amazon EMR?
  • Spark-Konzepte
  • Interaktive Demo 2: Verbinde dich mit einem EMR-Cluster und führe Scala-Befehle mit der Spark-Shell
  • Transformation, Verarbeitung und Analyse
  • Verwendung von Notebooks mit Amazon EMR
  • Practice Lab 1: Datenanalyse mit niedriger Latenz mit Apache Spark auf Amazon EMR

 

Modul 4: Verarbeiten und Analysieren von Batch-Daten mit Amazon EMR und Apache Hive

  • Verwendung von Amazon EMR mit Hive zur Verarbeitung von Stapeldaten
  • Transformation, Verarbeitung und Analyse
  • Practice Lab 2: Batch-Datenverarbeitung mit Amazon EMR und Hive
  • Einführung in Apache HBase auf Amazon EMR

 

Modul 5: Serverlose Datenverarbeitung

  • Serverlose Datenverarbeitung, -transformation und -analytik
  • Verwendung von AWS Glue mit Amazon-EMR-Arbeitslasten
  • Practice Lab 3: Orchestrierung der Datenverarbeitung in Spark mit AWS Step Functions

 

Modul 6: Sicherheit und Überwachung von Amazon EMR-Clustern

  • Sichern von EMR-Clustern
  • Interaktive Demo 3: Client-seitige Verschlüsselung mit EMRFS
  • Überwachung und Fehlersuche bei Amazon-EMR-Clustern
  • Demo: Überprüfung des Verlaufs von Apache-Spark-Clustern

 

Modul 7: Entwerfen von Batch-Datenanalyselösungen

  • Anwendungsfälle für die Batch-Datenanalytik
  • Aktivität: Entwerfen eines Arbeitsablaufs für die Batch-Datenanalyse

 

Modul B: Entwickeln moderner Datenarchitekturen auf AWS

  • Moderne Datenarchitekturen
Dein Nutzen
  • Vergleich der Funktionen und Vorteile von Data Warehouses, Data Lakes und modernen Datenarchitekturen
  • Entwerfen und Implementieren einer Lösung für die Batch-Datenanalyse
  • Identifizieren und Anwenden geeigneter Techniken, einschließlich Komprimierung, zur Optimierung der Datenspeicherung
  • Auswählen und Bereitstellen geeigneter Optionen für die Aufnahme, Umwandlung und Speicherung von Daten 
  • Auswahl der geeigneten Instanz- und Knotentypen, Cluster, automatischen Skalierung und Netzwerktopologie für einen bestimmten geschäftlichen Anwendungsfall
  • Verstehen, wie sich Datenspeicherung und -verarbeitung auf die Analyse- und Visualisierungs-Mechanismen auswirken, die für die Gewinnung verwertbarer Geschäftserkenntnisse erforderlich sind
  • Sichern von Daten im Ruhezustand und bei der Übertragung
  • Überwachung von Analyse-Workloads, um Probleme zu erkennen und zu beheben
  • Anwendung von Best Practices für das Kostenmanagement
Trainer:in
Milo Fels
Methoden

Dieser Kurs beinhaltet Präsentationen, interaktive Demos, praktische Übungen, Diskussionen und Klassenübungen.

Teilnehmer:innenkreis

Dieser Kurs richtet sich an folgende Jobrollen:

  • Data Analytics

Wir empfehlen, dass die Teilnehmenden dieses Kurses die folgenden Voraussetzungen mitbringen:

  • Mindestens ein Jahr Erfahrung mit der Verwaltung von Open-Source-Daten-Frameworks wie Apache Spark oder Apache Hadoop
Starttermine und Details

Lernform

Learning form

16.1.2025
Online
Plätze frei
Durchführung gesichert
Online
Plätze frei
Durchführung gesichert
3.3.2025
Online
Plätze frei
Durchführung gesichert
Online
Plätze frei
Durchführung gesichert

Das Training wird in Zusammenarbeit mit einem autorisierten Trainingspartner durchgeführt.

Dieser erhebt und verarbeitet Daten in eigener Verantwortung. Bitte nehme die entsprechende Datenschutzerklärung zur Kenntnis

 

Du hast Fragen zum Training?
Ruf uns an unter +49 761 595 33900 oder schreib uns auf service@haufe-akademie.de oder nutze das Kontaktformular.