piwik-script

Deutsch Intern
    Data Science Chair

    Data Mining

    Die Vorlesung gibt einen Überblick über die Wissensgewinnung aus (strukturierten) Daten. Dazu gehören unter anderem:

    • Vorverabeitungstechniken
    • OLAP-Analyse & Data-Warehousing
    • Clustering (k-means, k-medoids, DBSCAN, OPTICS)
    • Klassifikation (k-Nearest-Neighbor, Bayes, Entscheidungsbaum, Support Vector Machine; Bagging, Boosting, z. B. Random Forest, AdaBoost)
    • Regressionsanalyse (Linear Regression, Logistic Regression)
    • Assoziationsregellernen (Aprioiri, FP-Growth)
    • Einführung in Deep Learning

    Organisatorisches

    Bitte Beachten:

    Aufgrund der aktuellen Umstände wird die Vorlesung Data Mining auf Online-Lehre umgestellt. 
    Sie finden alle aktuellen Informationen der Veranstaltung auf WueCampus2.
    Bitte schreiben Sie sich über den obigen Link frühzeitig in WueCampus2 ein, um Zugriff auf den Kurs, aber auch E-Mails mit wichtigen Ankündigungen erhalten zu können. 

    • Vorlesung
      Die Vorlesung wird Mo, 10:15 - 11:45 über ZOOM gehalten. 
      Links zur Teilnahme an jedem Vorlesungstermin werden rechtzeitig in WueCampus2 bereitgestellt. Bitte stellen Sie sicher dass ZOOM auf Ihrem System funktioniert (siehe unten), damit Sie ohne Probleme an der Erstveranstaltung am 20.04. teilnehmen können.
      In der Erstveranstaltung werden wir einige Zeit damit verbringen die Technik des Systems zu testen, um einen korrekten Ablauf der kommenden Vorlesungen sicherzustellen, sowie alle wichtigen organisatorischen Informationen für den Ablauf des Semesters teilen.
    • Übungen
      Do, 14:15 - 15:45
      Do, 16:15 - 17:45
      Fr 14:15 - 15:45
      Der Übungsbetrieb wird auch über ZOOM stattfinden. Bitte stellen Sie für eine bessere Betreuung sicher, dass Sie eine Kamera zur Verfügung haben (ggf über Handy). Das genaue Übungsformat wird wie gehabt während der Erstveranstaltung bekanntgegeben.
    • Prüfung
      Es wird am Ende des Semesters eine Prüfung stattfinden. Form, Ablauf und genauer Zeitpunkt müssen allerdings noch erarbeitet werden, und werden baldmöglichst über WueCampus2 bekannt gegeben.
    • ZOOM
      ZOOM benötigt einen vorinstallierten Client. Ein Account wird zur Teilnahme allerdings nicht benötigt. ZOOM ist außerdem auch auf Android und IOS verfügbar. 
      (ZOOM funktioniert auch im Browser. Diese Variante können wir aber aufgrund der schlechteren Performance nicht empfehlen.)
    • Aktuelle Details werden im Ankündigungsforum des WueCampus2 Kurses geteilt.
      Bleiben Sie gesund!

    Literatur

    • Knowledge Discovery in Databases: Techniken und Anwendungen Ester, Martin; Sander, Jörg (2000). (1st ed.) Springer Berlin Heidelberg.
       
    • CRISP-DM 1.0 Step-by-step data mining guide Chapman, Pete; Clinton, Julian; Kerber, Randy; Khabaza, Thomas; Reinartz, Thomas; Shearer, Colin; Wirth, Rudiger (2000).
       
    • Advances in Knowledge Discovery and Data Mining. Fayyad, Usama M.; Piatetsky-Shapiro, Gregory; Smyth, Padhraic; Uthurusamy, Ramasamy (1996).
       

    Weitere Literatur zur Vorlesung

    • Sequential minimal optimization: A fast algorithm for training support vector machines. Platt, J. (1998).
       
    • OPTICS: Ordering Points To Identify the Clustering Structure. Ankerst, Mihael; Breunig, Markus M.; peter Kriegel, Hans; Sander, Jörg (1999). 49--60.
       
    • On End-to-End Program Generation from User Intention by Deep Neural Networks. Mou, Lili; Men, Rui; Li, Ge; Zhang, Lu; Jin, Zhi in CoRR (2015). abs/1510.07211
       
    • Mining Frequent Patterns without Candidate Generation. Han, Jiawei; Pei, Jian; Yin, Yiwen W. Chen, Naughton, J. F., Bernstein, P. A. (reds.) (2000). 1-12.
       
    • Maximum likelihood from incomplete data via the EM algorithm. Dempster, A. P.; Laird, N. M.; Rubin, D. B. in Journal of the Royal Statistical Society: Series B (1977). 39 1-38.
       
    • Experiments with a New Boosting Algorithm. Freund, Yoav; Schapire, Robert E. (1996). 148-156.
       
    • Experimental evidence of massive-scale emotional contagion through social networks. Kramer, Adam D. I.; Guillory, Jamie E.; Hancock, Jeffrey T. in Proceedings of the National Academy of Sciences (2014). 111(24) 8788-8790.
       
    • Data Science and Prediction. Dhar, Vasant in Commun. ACM (2013). 56(12) 64--73.
       
    • Data Science and its Relationship to Big Data and Data-Driven Decision Making. Provost, Foster; Fawcett, Tom in Big Data (2013). 1(1) 51--59.
       
    • Clustering by means of medoids. Kaufman, Leonard; Rousseeuw, Peter J. (I. : D. Y; editor,, reds.) (1987). 405–416.
       
    • Bagging, Boosting, and C4.5. Quinlan, J. Ross W. J. Clancey, Weld, D. S. (reds.) (1996). 725-730.
       
    • Automatic Subspace Clustering of High Dimensional Data for Data Mining Applications. Agrawal, Rakesh; Gehrke, Johannes; Gunopulos, Dimitrios; Raghavan, Prabhakar (1998). 94--105.
       
    • A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise. Ester, Martin; Kriegel, Hans-Peter; Sander, Jörg; Xu, Xiaowei (1996). 226-231.