Entdecke die Welt der Datenwissenschaft: im Whitepaper erfährst du, was Data Science alles kann und welche Potenziale sie in Organisationen entfalten kann. Mach dir selbst ein Bild davon!
Woher kommt Data Science?
Der Datenanalyse Prozess
Rollen in Data-Science-Projekten, Projektmanagementmethode "CRISP-DM", Business & Data Understanding, Data Preparation, Modeling, Evaluation, Deployment.
KNIME Analytics Platform
Grundlagen, Import, Anbindung an Quellsysteme, Zusammenführung von Datenquellen, Explorative Datenanalyse und Visualisierung.
Konzepte und Prozesse der Datenbearbeitung
Datenqualität, Datenbereinigung, Reorganisation von Datensätzen, Metriken der deskriptiven Statistiken etc.
Umgang mit Daten: Was muss beachtet werden?
Bewertung der Modelle, Modellanwendung, Export der Ergebnisse, Datensicherung, Bereitstellung von Daten für andere Tools.
Einblick in wesentliche Verfahren anhand von Fallstudien
Machine-Learning-Verfahren, Zeitreihenanalysen, Praktische Übungen mit KNIME, Übungen zum Clustering von Kundensegmenten, Übungen zu Prognoseverfahren, Best Practise von Data Science Projekten.
Inhalte
Modul 1: Thematische Einführung und methodische Grundlagen zu Data Science und Einführung in KNIME
Woher kommt Data Science?
- Was ist Supervised und Unsupervised Learning?
- Statistische Grundlagen, die für maschinelles Lernen und Data Science unerlässlich sind.
- Einführung in die Konzepte der Regression, Klassifikation und Clustering.
- Grundsätzliches zum Training und Testing von Machine-Learning-Modellen (Stichproben).
- Beliebte Fehler beim Machine Learning.
Identifikation potenzieller Einsatzfelder (z.B. in Controlling, Marketing, Sales, Produktion).
Der Datenanalyse-Prozess
Wichtige Rollen in Data-Science-Projekten (Citizen Data Scientist, Product Owner etc.).
Wichtigste Projektmanagementmethode "CRISP-DM" als Standard in der Datenanalyse.
- Business Understanding: Ziele, Anforderungen, Fragen.
- Data Understanding: Datenstruktur und Datenqualität.
- Data Preparation: Daten bereinigen, filtern, formatieren.
- Modeling: Datenmodelle entwickeln und validieren.
- Evaluation: Modelle überprüfen und an Geschäftszielen ausrichten.
- Deployment: Modelle für die Datenanalyse in Betrieb nehmen.
- Re-Training von Machine-Learning-Modellen.
KNIME Analytics Platform
- Grundlagen.
- Arbeiten mit der Software.
- Import gängiger Fileformate und Anbindung an Quellsysteme.
- Zusammenführung mehrerer Datenquellen (… und Bereinigung).
- Explorative Datenanalyse und Visualisierung.
Modul 2: Daten verstehen, transformieren und nutzen
Konzepte und Prozesse der Datenbearbeitung
Praktische Übungen mit KNIME
- Datenbereinigung und Datenqualität.
- Reorganisation des Datensatzes.
- Metriken der deskriptiven Statistiken.
- Daten transformieren.
- Berechnungen einbinden.
Aufgabe: Selbstständiges Lösen einer Aufgabe mit KNIME in Vorbereitung auf Modul 3.
Modul 3: Maschinelles Lernen
Feedback zur selbstständigen Aufgabe aus Modul 2
Umgang mit Daten und was dabei beachtet werden muss
- Bewertung der Modelle (Overfitting, Underfitting, Data Leakage etc.).
- Modellanwendung, operationalisieren von ML-Learning.
- Export der Ergebnisse in verschiedene Formate.
- Datensicherung und weitere Verwendung.
- Bereitstellung von Daten für andere Tools.
Einblick in wesentliche Verfahren anhand von Fallstudien
- Erläuterung der gängigsten Machine-Learning-Verfahren.
- Zeitreihenanalysen.
- Praktische Übungen mit KNIME.
- Übung zum Clustering von Kundensegmenten.
- Übung zu Prognoseverfahren.
- Best Practice zur Gestaltung von Data Science Projekten.
Ausblick und organisatorische Maßnahmen.
Lernumgebung
In Ihrer Online-Lernumgebung finden Sie nach Ihrer Anmeldung nützliche Informationen, Downloads und Extra-Services zu dieser Qualifizierungsmaßnahme.
Ihr Nutzen
- Sie kennen die Grundlagen und -begriffe von Data Science.
- Sie lernen den Prozess vom Einlesen über die Bearbeitung von Daten kennen.
- Sie können mithilfe der Analytics Plattform KNIME Ihre Daten selbstständig analysieren und Ihre Datenverarbeitungsaufgaben automatisieren und diese in Ihrem Arbeitsalltag einsetzen.
Methoden
Vortrag zur Erklärung von Theorie, Erläuterung von Praxisbeispielen und Anwendung in der Software, Diskussion, selbstständige Bearbeitung von Übungsaufgaben und Hilfestellung durch die Trainer:innen.
Empfohlen für
Zukünftige Data Scientists und interessierte Fachkräfte, die noch keine oder wenig Erfahrung mit Data Science haben und große Datenmengen verstehen und -auswertungen zielorientiert einsetzen möchten.