7 Gründe, warum es sich jetzt lohnt, Python zu lernen!
Das Online-Training ist von der Staatlichen Zentralstelle für Fernunterricht (ZFU) in Köln unter der Nummer 73597 geprüft und zugelassen.
Inhalte
1. Grundlagen Data Analytics mit Python
- Arbeiten mit dem Data Lab
- Grundlagen und Konzepte in Python
- Vorstellung der Tools pandas, matplotlib uns Seaborn
- Datenbankanfragen mir SQL Alchemy
2. Lineare Algebra
- Mathematische Hintergründe
- Grundbegriffe der linearen Algebra
- Berechnung mit Vektoren und Matrizen
- Einsatz der Python-Bibliothek numpy
3. Wahrscheinlichkeitsverteilung
- Statistik in Data-Science-Algorithmen
- Diskrete und kontinuierliche Verteilungen
- Versionierung von Code in Git
4. Überwachtes Lernen (Regression)
- Lineare Regression einsetzen
- Einsatz des Python-Pakets sklearn
- Regressionsmodelle verstehen
- Evaluation der Prognosen
- Bias-Variance-Trade-Off und Regularisierung
- Messung der Modellgüte
5. Überwachtes Lernen (Klassifikation)
- Konzepte des Supervised Learning
- Einführung in Klassifikationsalgorithmen
- Der k-Nearest-Neighbors-Algorithmus
- Einschätzung der Klassifikationsperformance
- Optimierung der Parameter
- Aufteilung der Daten in Trainings- und Evaluationssets
6. Unüberwachtes Lernen (Clustering)
- Konzepte des Unsupervised Learning
- Der k-Means-Algorithmus
- Evaluation der Performance-Metriken
- Alternativen zum k-Means-Clustering
7. Unüberwachtes Lernen (Dimensionsreduktion)
- Dimensionen in der Datenbetrachtung reduzieren
- Principal Component Analysis (PCA)
- Unkorrelierte Features aus Ursprungsdaten erzeugen
- Einführung in Feature Engineering
8. Ausreißer identifizieren und ausschließen
- Methoden zur Erkennung von Ausreißern
- Kriterien ungewöhnlicher Datenpunkte
- Robuste Maße und Reduktion der Einflüsse durch Ausreißer
9. Daten sammeln und zusammenführen
- Daten aus Webseiten und PDF-Dokumenten auslesen
- Einsatz von Regulären Ausdrücken
- Textdaten vor der Verarbeitung strukturieren
10. Logistische Regression
- Konzepte der logistischen Regression
- Performance-Metriken zur Evaluation
- Nicht-numerische Daten in Modellen einsetzen
11. Entscheidungsbäume und Random Forests
- Das Konzept der Decision Trees
- Mehrere Modelle zu Ensembles kombinieren
- Methoden zur Verbesserung der Vorhersage-Qualität
12. Support Vector Machines
- Einsatz von Support Vector Machines (SVM)
- Einführung in Natural Language Processing (NLP)
- Textklassifikation mit Bag-of-Words-Modellen
13. Neuronale Netze
- Grundlagen künstliche neuronaler Netze (KNN)
- Grundlagen des Deep Learnings
- Tieferes Verständnis der Schichten in KNN
14. Visualisierung und Model-Interpretation
- Funktionsweisen von Modellen ableiten und darstellen
- Methoden zur Interpretation und Visualisierung
- Modelagnostische Methoden anwenden
15. Verteilte Datenbanken einsetzen
- Das Python-Paket PySpark einsetzen
- Daten aus verteilten Datenbanken auslesen
- Grundlagen von Big-Data-Analysen
- Machine-Learning-Algorithmen in verteilten Systemen nutzen
16. Übungsprojekt
- Umfassenden Übungsprojekt selbstständig bearbeiten
- Prädiktionsproblem mithilfe eines größeren Datensets lösen
- Vorbereitung für das Abschlussprojekt
17. Abschlussprojekt
- Selbstständige Analyse des Datenprojekts
- Ergebnispräsentation und 1:1-Feedbackgespräch mit Mentoring-Team
- Erhalt des Zertifikats zum Data Scientist mit Python
Wie lernen Sie in dem Kurs?
Dieser Online-Kurs bietet Ihnen ein besonders praxisorientiertes Lernkonzept mit umfassenden Selbstlerneinheiten und einem Mentoren-Team, das Ihnen durchgängig zur Verfügung steht. Jede Woche wird ein neues Kapitel für Sie freigeschaltet. Mit einem Zeitbudget von circa 6 Stunden pro Woche kommen Sie in 17 Wochen sicher ans Ziel. So lernen Sie in dem Kurs:
Einstufungstest: In einem Onboarding-Gespräch zu Beginn des Kurses ermitteln Sie zusammen mit dem Mentoren-Team, welche Kenntnisse Sie bereits besitzen und welchen Teilen des Kurses Sie besondere Aufmerksamkeit schenken sollten. Sie werden damit für das Lernen in den Selbstlerneinheiten optimal vorbereitet.
Data Lab: In der Lernumgebung des Kurses erwarten Sie Videos, interaktive Grafiken, Text und vor allem viele Praxisübungen mit umfassenden Datasets und Coding-Aufgaben. Diese führen Sie direkt im Browser aus – ohne Installations- oder Konfigurationsaufwand und mit direkter Erfolgskontrolle.
Mentor:innen-Team: Für jegliche Fragen stehen Ihnen Ihre Lern-Coaches bereit. Dabei handelt es sich um erfahrene Data Analysts, die Ihnen gern weiterhelfen – per Chat, Audio- oder Videocall.
Webinare: Einmal wöchentlich haben Sie die Möglichkeit, an Webinaren teilzunehmen und darin in ausgewählte Spezialthemen der Datenanalyse einzutauchen.
Karriere-Coaching: Welche beruflichen Ziele verfolgen Sie mit Ihrer Weiterbildung und wie können Sie diese erreichen? Ein Mentoren-Team steht für Sie bereit, um Ihnen bei der Umsetzung Ihrer Karriereziele behilflich zu sein.
Abschlussprojekt: In einem eigenen Datenprojekt durchlaufen Sie selbstständig die gesamte Daten-Pipeline und beantworten typische Fragestellungen. Am Ende präsentieren Sie Ihr Projekt in einem 1-zu-1-Feedbackgespräch mit Ihrem Mentoring-Team.
Zertifikat: Nach dem Abschlussprojekt erhalten Sie Ihr offizielles Zertifikat zum Data Analyst mit Python.
Diese Online-Weiterbildung wird von unserem Partner StackFuel GmbH durchgeführt. StackFuel ist Spezialist im Bereich Weiterbildungen zu Data Literacy, Data Science und KI.
Ihr Nutzen
In diesem praxisorientierten Training lernen Sie, selbstständig Datenanalysen mit großen Datensets durchzuführen.
Sie lernen, kompetent mit Python umzugehen, die Programmiersprache zur Datenauswertung einzusetzen und effektive Visualisierungen zu erstellen.
Sie erfahren, wie Sie verschiedenste Datenquellen anbinden, Daten darin filtern und daraus zusammenzuführen.
Sie lernen umfassend Methoden, Algorithmen und Technologien des Machine Learnings kennen und erfahren, wie Sie diese mit Python-Paketen einsetzen.
Sie erfahren alles Wichtige über den Einsatz von Deep Learning und erzeugen ein künstliches neuronales Netz mit mehreren Schichten.
Nach dem Training sind Sie in der Lage, Unternehmensdaten zu untersuchen, aussagekräftig zu visualisieren und in dynamischen Dashboards interaktiv zugänglich zu machen.
Die technischen Einstiegshürden werden durch den Einsatz von Jupyter Notebooks minimiert, mit denen Sie die Programmierübungen direkt im Browser durchführen können.
Teilnehmer:innenkreis
Die Online-Weiterbildung zum Data Scientist mit Python eignet sich für alle, die eine umfassende Schulung über Machine Learning und Data-Pipelines suchen. Es werden Grundkenntnisse in Python vorausgesetzt. Die Weiterbildung eignet sich auch für Quereinsteiger:innen.
Abschlussprüfung
In einem eigenen Datenprojekt durchlaufen Sie selbstständig die gesamte Daten-Pipeline und beantworten typische Fragestellungen. Am Ende präsentieren Sie Ihr Projekt in einem 1-zu-1-Feedbackgespräch mit Ihrem Mentoring-Team.
Weitere Empfehlungen zu „Data Scientist mit Python“
Hier erhalten Sie Eindrücke vom Seminar sowie Informationen rund um das Seminarthema.
Data Scientist: Gehalt, Aufgaben und Skills
Große Datenmengen zu strukturieren und sie dadurch in nützliche Informationen zu verwandeln – das ist die Hauptaufgabe eines Data Scientist. Als Spezialist für Daten und Datenbezüge erstellt er aus bloßen Zahlen sinnvolle Prognosen für die Zukunft und gibt dem Unternehmen Handlungsempfehlungen. Data Scientist: Key Facts Ausbildung Masterstudium Data Science, Informatik oder Mathematik Berufserfahrung von Vorteil [...]
Sie können 3 Bilder zu der Veranstaltung ansehen.
Data Scientist: Gehalt, Aufgaben und Skills
Große Datenmengen zu strukturieren und sie dadurch in nützliche Informationen zu verwandeln – das ist die Hauptaufgabe eines Data Scientist. Als Spezialist für Daten und Datenbezüge erstellt er aus bloßen Zahlen sinnvolle Prognosen für die Zukunft und gibt dem Unternehmen Handlungsempfehlungen. Data Scientist: Key Facts Ausbildung Masterstudium Data Science, Informatik oder Mathematik Berufserfahrung von Vorteil [...]
Sie können 3 Bilder zu der Veranstaltung ansehen.