Erfahre, wie Amazon EMR mit Open-Source-Projekten wie Apache Hive, Hue und HBase und mit AWS-Services wie AWS Glue und AWS Lake Formation integriert wird. Der Kurs behandelt die Komponenten Datenerfassung, -aufnahme, -katalogisierung, -speicherung und -verarbeitung im Kontext von Spark und Hadoop. Du lernst die Verwendung von EMR Notebooks zur Unterstützung von Analyse- und Machine-Learning-Arbeitslasten. Du lernst auch, die besten Praktiken für Sicherheit, Leistung und Kostenmanagement auf den Betrieb von Amazon EMR anzuwenden.
Modul A: Überblick über Datenanalyse und die Datenpipeline
Modul 1: Einführung in Amazon EMR
Modul 2: Datenanalyse-Pipeline mit Amazon EMR: Ingestion und Speicherung
Modul 3: Leistungsstarke Batch-Datenanalyse mit Apache Spark auf Amazon EMR
Modul 4: Verarbeiten und Analysieren von Batch-Daten mit Amazon EMR und Apache Hive
Modul 5: Serverlose Datenverarbeitung
Modul 6: Sicherheit und Überwachung von Amazon EMR-Clustern
Modul 7: Entwerfen von Batch-Datenanalyselösungen
Modul B: Entwickeln moderner Datenarchitekturen auf AWS
Dieser Kurs beinhaltet Präsentationen, interaktive Demos, praktische Übungen, Diskussionen und Klassenübungen.
Dieser Kurs richtet sich an folgende Jobrollen:
Wir empfehlen, dass die Teilnehmenden dieses Kurses die folgenden Voraussetzungen mitbringen:
Lernform
Learning form
Keine Filterergebnisse
Das Training wird in Zusammenarbeit mit einem autorisierten Trainingspartner durchgeführt.
Dieser erhebt und verarbeitet Daten in eigener Verantwortung. Bitte nehme die entsprechende Datenschutzerklärung zur Kenntnis