Data Mining
Die Vorlesung gibt einen Überblick über die Wissensgewinnung aus (strukturierten) Daten. Dazu gehören unter anderem:
- Vorverabeitungstechniken
- OLAP-Analyse & Data-Warehousing
- Clustering (k-means, k-medoids, DBSCAN, OPTICS)
- Klassifikation (k-Nearest-Neighbor, Bayes, Entscheidungsbaum, Support Vector Machine; Bagging, Boosting, z. B. Random Forest, AdaBoost)
- Regressionsanalyse (Linear Regression, Logisitic Regression)
- Assoziationsregellernen (Aprioiri, FP-Growth)
- Einführung in Deep Learning
Organisatorisches
- Vorlesung:
Di, 12:15 - 13:45
Zuse
Erster Veranstaltungstag: 25.04.2017 - Übung:
Do, 14:15 - 15:45
Informatik - Übungsraum II
Do, 16:15 - 17:45
Informatik - Seminarraum 3
Erster Veranstaltungstag: 04.05.2017 - WueCampus-Kurs: Link zum Kurs
- Anmeldung: Eine Anmeldung vor der ersten Vorlesung ist nicht nötig! Die genauen Einschreibemodalitäten werden in der ersten Vorlesungssitzung bekannt gegeben.
- Prüfung SS 2017: 01.08.2017 um 12:30, Zuse (Studierende, die nicht Master Informatik studieren)
07.08.-11.08.2017 mündliche Prüfungen (Master Studierende Informatik). Genaue Termin(e) TBA
Anmeldung über sb@home
Hinweis: Ab diesem Semester werden unterschiedliche Prüfungen für Bachelor- und Masterstudierende der Informatik angeboten.
Literatur
Weitere Literatur zur Vorlesung
-
Sequential minimal optimization: A fast algorithm for training support vector machines. (1998).
-
OPTICS: Ordering Points To Identify the Clustering Structure. (1999). 49--60.[ BibTeX ]
-
On End-to-End Program Generation from User Intention by Deep Neural Networks. in CoRR (2015). abs/1510.07211
-
Mining Frequent Patterns without Candidate Generation. W. Chen, Naughton, J. F., Bernstein, P. A. (reds.) (2000). 1-12.
-
Maximum likelihood from incomplete data via the EM algorithm. in Journal of the Royal Statistical Society: Series B (1977). 39 1-38.
-
Experiments with a New Boosting Algorithm. (1996). 148-156.
-
Experimental evidence of massive-scale emotional contagion through social networks. in Proceedings of the National Academy of Sciences (2014). 111(24) 8788-8790.
-
Data Science and Prediction. in Commun. ACM (2013). 56(12) 64--73.
-
Data Science and its Relationship to Big Data and Data-Driven Decision Making. in Big Data (2013). 1(1) 51--59.[ BibTeX ]
-
Clustering by means of medoids. (I. : D. Y; editor,, reds.) (1987). 405–416.[ BibTeX ]
-
Bagging, Boosting, and C4.5. W. J. Clancey, Weld, D. S. (reds.) (1996). 725-730.
-
Automatic Subspace Clustering of High Dimensional Data for Data Mining Applications. (1998). 94--105.[ BibTeX ]
-
A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise. (1996). 226-231.[ BibTeX ]