Dieser Kurs führt dich ein in die Konzepte, Strategien und bewährten Methoden für die Konzeptionierung einer Cloud-basierten Data Warehousing-Lösung mit Amazon Redshift, dem Data Warehouse in AWS in Petabyte-Größe. Es wird demonstriert, wie Daten für das Data Warehouse mithilfe anderer AWS-Services wie Amazon DynamoDB, Amazon EMR, Amazon Kinesis Firehose und Amazon Simple Storage Service (Amazon S3) gesammelt, gespeichert und vorbereitet werden. Wir werden außerdem erläutern, wie du Business-Intelligence-(BI)-Tools zur Analyse deiner Daten einsetzen kannst.
Dieser Kurs ist zusätzlich mit Inhalten des Kurses Building Data Analytics Solutions using Amazon Redshift angereichert
Modul 1: Einführung in Data Warehousing
- Relationale Datenbanken
- Data-Warehousing-Konzepte
- Die Überschneidung von Data Warehousing und Big Data
- Überblick über die Datenverwaltung in AWS
- Praktisches Lab 1: Einführung in Amazon Redshift
Modul 2: Einführung in Amazon Redshift
- Konzeptueller Überblick
- Anwendungsfälle aus der Praxis
- Interaktive Demo 1: Rundgang durch die Amazon-Redshift-Konsole
- Praktisches Lab 2: Starten eines Amazon-Redshift-Clusters
- RA3 Nodes and AQUA-Architektur
- Amazon Redshift ML
Modul 3: Starten von Clustern
- Aufbau des Clusters
- Verbinden mit dem Cluster
- Kontrolle des Zugriffs
- Sicherheit der Datenbank
- Daten laden
- Praktisches Lab 3: Optimieren von Datenbank-Schemata
- Optionales Lab: Starten eines Amazon-Redshift-Cluster
Modul 4: Entwerfen des Datenbankschemas
- Schemas und Datentypen
- Spaltenweise Komprimierung
- Stile der Datenverteilung
- Methoden zur Datensortierung
- Praktisches Lab 3: Optimieren von Datenbank-Schemas
Modul 5: Identifizierung von Datenquellen
- Überblick über Datenquellen
- Amazon S3
- Amazon DynamoDB
- Amazon EMR
- Amazon Kinesis Daten-Firehose
- AWS-Lambda-Datenbanklader für Amazon Redshift
- Redshift Data API
- SUPER Data Type
- Interaktive Demo 2: Verbinden deines Amazon-Redshift-Clusters mit einem Jupyter-Notebook mit Data API
- Interaktive Demo 3: Analyse halbstrukturierter Daten mit dem Datentyp SUPER
- Praktisches Lab 4: Laden von Echtzeitdaten in eine Amazon-Redshift-Datenbank
Modul 6: Laden von Daten
- Vorbereiten von Daten
- Data Warehousing auf AWS
- Laden von Daten mit COPY
- Pflegen von Tabellen
- Gleichzeitige Schreibvorgänge
- Fehlersuche bei Ladeproblemen
- Praktische Übung 5: Laden von Daten mit dem COPY-Befehl
Modul 7: Schreiben von Abfragen und Leistungs-Tuning
- Amazon Redshift SQL
- Benutzerdefinierte Funktionen (UDFs)
- Faktoren, die die Abfrageleistung beeinflussen
- Der EXPLAIN-Befehl und Abfragepläne
- Arbeitslast-Verwaltung (WLM)
- Interaktive Demo 4: Applying mixed workload management on Amazon Redshift
- Praktisches Lab 6: Konfigurieren der Arbeitslastverwaltung
Modul 8: Amazon Redshift Spectrum
- Amazon Redshift Spectrum
- Konfigurieren von Daten für Amazon Redshift Spectrum
- Amazon-Redshift-Spectrum-Abfragen
- Daten-Transformation
- Daten-Sharing
- Übungs-Lab 2: Datenanalyse mit Amazon Redshift Spectrum
- Übungs-Lab 3: Datentransformation und -abfrage in Amazon Redshift
- Praktisches Lab 7: Verwendung von Amazon Redshift Spectrum
Modul 9: Wartung von Clustern
- Audit-Protokollierung
- Leistungsüberwachung
- Ereignisse und Benachrichtigungen
- Praktische Übungen 8: Auditing und Überwachung von Clustern
- Größenänderung von Clustern
- Sichern und Wiederherstellen von Clustern
- Ressourcenkennzeichnung und Grenzen und Beschränkungen
- Praktisches Lab 9: Sichern, Wiederherstellen und Größenänderung von Clustern
- Optional: Daten-Analyse und -Visualisierung
Modul 10: Analysieren und Visualisieren von Daten
- Leistung von Visualisierungen
- Erstellen von Dashboards
- Amazon-QuickSight-Editionen und -Funktionen