piwik-script

Intern
    DMIR Research Group

    Information Retrieval

    In dieser Vorlesung geht es um Algorithmen und Methoden, wie sie etwa bei Suchmaschinen wie Google und Bing zur Anwendung kommen. Allgemein versteht man unter Information Retrieval das Aufbereiten und Finden von Informationen, wobei man dies häufig auf das Finden von Dokumenten mit relevanten Inhalten beschränkt. In der Vorlesung werden neben den inhaltlichen Konzepten, die hinter bekannten Suchmaschinen wie z.B. Google stehen, auch Ideen der effizienten Implementierung solcher Systeme eingeführt. Dabei wird auch mit Konzepten wie MapReduce und deren Implementierungen Apache Hadoop oder Apache Spark zur Analyse von Big Data auf verteilten Rechenclustern gearbeitet. Insgesamt werden unter anderem folgende Themen behandelt:

    • Boolesches und Vektorraum-Retrieval-Modelle
    • Elementares Tokenizing, Indexing, und die Implementierung von vektorraumbasiertem Retrieval
    • Performanz-Bewertung von Retrieval-Systemen
    • Anfrage-Operationen (Relevance Feedback, Anfrageerweiterung)
    • Anfragesprachen und –paradigmen
    • Strukturelle Anfragen
    • Texteigenschaften
    • Web-Suche: Einführung, Crawling, Interfaces, Link-Analyse
    • Implementierung von PageRank (Google Ranking) mit Apache Spark

    Organisatorisches

    • Angesprochener HörerInnenkreis: 
      Informatik / Wirtschaftsinformatik (Diplom / Master (ab 5. Semester))
       
    • Vorkenntnisse: 
      Informatik Grundstudium, Grundkenntnisse in linearer Algebra

    Literatur