Hochschule Darmstadt - Fb Informatik

Drucken| Layout| Design| Schriftgröße English|
Modulbeschreibung
Modul:Datenvorverarbeitung und Feature Engineering

Data preparation and feature engineering

Belegnummern:41.5084 [PVL 41.5085]
Sprache:deutsch
Zuordnung:Dualer Master 2021 - Katalog AS: Anwendungs- und systemorientierte Module
Master 2021 - Katalog AS: Anwendungs- und systemorientierte Module
Dualer Master 2013 - Katalog AS: Anwendungs- und systemorientierte Module
Master 2013 - Katalog AS: Anwendungs- und systemorientierte Module
MN Data Science 2016 - Katalog DS-I: Data Science - Informatik
Lehrform:V+P = Vorlesung+Praktikum
SWS:3+1
CP:6
Prüfung:Klausur
Anmeldung zur Prüfung:explizit und unabhängig von der Belegung
PVL (z.B. Praktikum):unbenotet
Häufigkeit des Angebots:jährlich (bisher nicht angeboten)
Erforderliche Vorkenntnisse:Statistik-Grundlagen, Data Mining Grundlagen, Programmieren, Datenbanken
Lernziele:Die Studierenden werden
  • Methoden der (statistischen) Datenvorbereitung für Mining Verfahren strategisch und semantisch bewerten und anwenden können,
  • wichtige Verfahren des Data Mining Feature Engineerings kennen lernen, bewerten und strategisch anwenden können,
  • die zugrunde liegenden Methoden des maschinellen Lernens so weit verstehen, dass die möglichen Feature Repräsentationen für die entsprechenden Algorithmen optimal angewandt werden können,
Lehrinhalte:
  • Methodiken zur Durchführung der vorbereitenden Prozesse des
    • Datenverständnis,
    • der Datenvorbereitung (u.a. Integration unterschiedlicher Datenquellen, Data Profiling, Datenbereinigung, Beseitigung von Inkonsistenzen, Umgang mit fehlenden Werten, verrauschten Daten etc.),
    • des Feature Engineerings (u.a. Data Cleansing, Feature Selection, Feature Reduction, Feature Construction & Extraction, Feature Transformation, Feature Sampling)
    • sowie der Modellierung und Parametrisierung zur Anwendung der ausgewählten Mining-Verfahren
  • Die zugrunde liegenden mathematischen Methoden der unterschiedlichen algorithmischen Lösungsansätze werden erarbeitet.
Literatur:
  • Garcia: Data Preprocessing in Data Mining, Springer, 2014
  • Ozdemir, Susarla: Feature Engineering Made Easy: Identify unique features from your dataset in order to build powerful machine learning systems, Packt Publishing, 2018
  • Zheng, Casari: Feature Engineering for Machine Learning Models: Principles and Techniques for Data Scientists, O'Reilly, 2018
  • Kuhn, Johnson: Feature Engineering and Selection: A Practical Approach for Predictive Models, Taylor & Francis, 2019
  • Forschungspapiere (werden im Rahmen der Vorlesung bereitgestellt)
Arbeitsformen / Hilfsmittel:
  • seminaristische Vorlesung
  • Praktikum in Gruppen à max. 2-4 Studierenden, Anwendung von Miningtools im Rahmen des Praktikums
  • Hilfsmittel: Folien, Forschungspapiere
Modulverantwortung:Markus Döhring
Freigabe ab:WS 2021/2022

[Fachbereich Informatik] [Hochschule Darmstadt]
© 2008 - 2022 FBI OBS Team. Alle Rechte vorbehalten.