English Intern
    Lehrstuhl für Informatik VI - Künstliche Intelligenz und Angewandte Informatik

    Praktika, Bachelor- und Masterarbeiten

    Diese Liste enthält bereits bearbeitete Themen für Praktika, Bachelor- und Masterarbeiten der Data Mining & Information Retrieval Arbeitsgruppe (DMIR).

    WideNoise Event Detection

     BA: vergeben, MP: evtl. vergeben, MA: evtl. vergeben 

    Die iOS- und Android-Applikation WideNoise hilft dabei ein Bewusstsein für Lärmpegel und deren Auswirkungen zu fördern. Dabei können Benutzer gezielt Audiosignale aufnehmen und mit Kontext versehen, wie etwa Gemütszustand oder beschreibende Schlagwörter. Da Menschen ihre Umgeungsgeräusche unterbewusst stark filtern, gehen bleiben manche relvante Situationen leicht unbemerkt.

    In dieser Arbeit soll es darum gehen, bestimmte lärmrelevante Ereignisse im Umfeld automatisch zu erkennen und den Benutzer der Applikation WideNoise entsprechend nach seiner Einschätzung der Situation zu fragen. Dabei sollen mehrere Algorithmen zur Ereignis- oder Anomalieerkennung auf Android implementiert und ihre Eigenschaten evaluiert werden. 

    In einem Masterpraktikum können dann weitere Algorithmen eingebunden und die Handhabbarkeit der Funktionalität verbessert werden.

    In einer anschliessenden Masterarbeit können die Algorithmen mit Lernalgorithmen gekoppelt werden, die sich indiviuell an das Interesse des Benutzers anpassen. 

    Betreuer: Martin Becker

     

    BlueSpot: SLAM

    MP: vergeben, MA: vergeben

    Das EveryAware-System dient unteranderem, zur Sammlung und Auswertung beliebiger ortsgebundener Sensordaten, wie etwa Lautstärken oder Luftqualität. Dabei ist eine möglichst genaue Lokalisation essentiell. Jedoch sind brauchbare Positionswerte vor allem in Gebäuden kaum zu gewährleisten.   

    1. Im Rahmen eines Masterpraktikums soll es zunächst darum gehen, günstige BlueTooth-Einheiten zu entwickeln, die Mobiltelephone erkennen können. Anhand der erkannten Einheiten soll das Mobiltelefon dann in der Lage sein, eine raumgenaue Position zu bestimmen. Desweiteren soll es eine Karte geben, auf der alle aktiven Telefone den entsprechenden Räumen zugeordnet werden. Die Implementierung wird auf dem EveryAware-System und Android basieren.

    2. In der anschliessenden Masterarbeit sollen verschieden SLAM-Algorithmen zur automatischen Kartographierung der Umgebung and Lokalisation des Endgerätes anhand des im Masterpraktikum entstandenen Systems implementiert und evaluiert werden.  

     Betreuer: Martin Becker

     

    Twitter: Event Detection

    BA: vergeben, MP: vergeben, MA: vergeben

    Das EveryAware-System dient unteranderem, zur Sammlung und Auswertung beliebiger ortsgebundener Sensordaten, wie etwa Lautstärken oder Luftqualität. Dabei ist jedoch auch der soziale Kontext von großem Interesse. Beispielsweise wird laute Musik auf Festivals als angenehm empfunden, wohingegen die selbe Lautstärke im Nachbarzimmer stört. Twitter als soziales Medium ist dabei eine Informationsquelle, die unter Umständen entsprechende Kontextdaten liefern kann.

    In dieser Arbeit soll es zunächst darum gehen, basierend auf Android bestimmte Ereignisse zu erkennen.

    Im Masterpraktikum soll ein allgmeines serverseitiges System zur Eventerkennung implementiert werden.

    In der Masterarbeit sollen dann verschiedene Eventerkennungsalgorithmen implementiert und evaluiert werden. 

    Betreuer: Martin Becker

     

    Kontinuierliche Cluster

     BA: vergeben

    Das EveryAware System dient unteranderem, zur Sammlung und Auswertung beliebiger ortsgebundener Sensordaten, wie etwa Lautstärken oder Luftqualität.
    Diese Daten werden auf einer Weltkarte visualisiert. Dazu werden die Daten räumlich geclustert. Die große Menge der Daten mach dieses Clustern jedoch sehr zeit- und rechenintensiv. Außerdem wächst der zu clusternde Datenbestand stetig.
    Die Cluster müssen also kontinuierlich aktualisiert werden. Dazu sollen verschiedene Strategien implementiert und ausgewertet werden.

    Desweiteren müssen Cluster auch für verschiedene Zeiträume zur Verfügung gestellt werden.
    Es können nicht für jeden einzelnen Zeitraum Cluster vorgehalten werden. Deswegen ist es sinnvoll nur für eine eingeschränkte Menge von Zeitabschnitten Cluster vorzuberechnen. Diese werden dann nach Bedarf zusammengeführt und mit aktuellen Daten angereichert. Verschieden Umsetzungen dieses Ansatzes sollen implementiert und ausgewertet werden. 

    Betreuer: Martin Becker

     

    Generische Formate für Sensordaten

     BA: vergeben

    Das EveryAware System dient unteranderem, zur Sammlung und Auswertung beliebiger ortsgebundener Sensordaten, wie etwa Lautstärken oder Luftqualität. Es sollen aber noch andere Datentypen behandelt werden. Damit nicht bei jeder Erweiterung explizite Verarbeitungsschritte implementiert werden müssen, soll hier ein einheitliches, konfigurierbares Format entworfen und die grundlegenden Verarbeitungsschritte implementiert werden.

    Betreuer: Martin Becker

     

    BibSonomy

    Item recommendation

    BA: vergeben

    Das Publikationsnetzwerk BibSonomy bietet seinen Nutzern die Möglichkeit, interessante Publikationen und Lesezeichen zu speichern. Eine sinnvolle Erweiterung des Systems ist eine automatische Empfehlungsfunktion, mit der wir dem Benutzer für ihn interessante, aber noch unbekannte Publikationen und Lesezeichen vorschlagen können. Für einen solchen Item Recommender eignet sich unter anderem Latent Dirichlet Allocation (LDA). 

    Auf Grundlage der Publikation "Query-Driven Context Aware Recommendation" von N. Hariri, B. Mobasher und R. Burke (RecSys 2013) und unter Verwendung eines geeigneten Frameworks sowie eines Datensatzes von BibSonomy soll gezeigt werden, dass ein modifiziertes LDA beim Vorschlagen neuer Publikationen Vorteile gegenüber der normalen Variante aufweist. 

    Betreuerin: Lena Schwemmlein

    Vergleich von LDA und Fuzzy Clustering

    BA: vergeben

    Die Anwendung von Latent Dirichlet Allocation (LDA) dient im Allgemeinen dazu, einen großen Korpus von Dokumenten auf verschiedene Themen aufzuteilen. Dabei wird jedem Dokument ein Wahrscheinlichkeitsvektor zugeordnet, welcher die Zugehörigkeit des Dokuments zu diesen Themen widergibt. Dieses Prinzip kann ebenso auf Publikationen in BibSonomy angewandt werden, wodurch eine Themenstruktur der Publikationen sichtbar wird. Fuzzy Clustering ist - wie auch LDA - ein unüberwachtes Verfahren, welches Publikationen Wahrscheinlichkeiten zuordnen kann, mit der sie zu einem Cluster gehören. Ziel der Arbeit ist es, das Ergebnis von LDA und Fuzzy Clustering auf BibSonomy-Daten zu vergleichen.

    Betreuerin: Lena Schwemmlein

    Visualisierung des Publikationsnetzwerkes von BibSonomy

    DA: vergeben

    Die benutzerfreundliche graphische Darstellung von großen sozialen Netzwerken bietet mehrere Vorteile: einen besseren Überblick über Zusammenhänge zwischen Daten sowie einen leichteren Zugang zu den jeweils interessanten Publikationen für einen Benutzer. Ziel dieser Arbeit ist es, eine geeignete Visualisierung der Publikationen aus BibSonomy zu finden. Dabei soll die Netzstruktur der Daten ausgenutzt werden, um sie als Graphen darzustellen. Die Darstellung kann von einfachen Strukturen bis hin zu einer ausgefeilten Grafik reichen. Da bereits vielfältige Publikationen zu diesem Thema existieren, liegt der Schwerpunkt dieser Arbeit auf der konkreten Umsetzung und Anwendung auf den BibSonomydaten, sowie der Auswahl geeigneter Methoden.

    Betreuerin: Lena Schwemmlein

    DM & IR

    Playlist recommendation

    BA: vergeben

    Für Musikplattformen wie Spotify oder last.fm hat das automatische Erstellen von Playlists immer mehr an Bedeutung gewonnen, da die Menge an verfügbaren Lieder immer größer und unübersichtlicher wird. Um einem User einen für ihn geeigneten Song bzw. eine passende Playlist vorschlagen zu können, existiert mittlerweile eine Vielzahl von Verfahren. Dazu zählen auch Topic Models wie Latent Dirichlet Allocation (LDA). 

    Auf Grundlage der Publikation "Query-Driven Context Aware Recommendation" von N. Hariri, B. Mobasher und R. Burke (RecSys 2013) und unter Verwendung eines geeigneten Frameworks sowie eines Datensatzes von last.fm soll gezeigt werden, dass ein modifiziertes LDA tatsächlich Vorteile gegenüber der normalen Variante aufweist. 

    Betreuerin: Lena Schwemmlein

    Kontakt

    Lehrstuhl für Informatik VI (Künstliche Intelligenz und angewandte Informatik)
    Am Hubland
    97074 Würzburg

    Tel.: +49 931 31-86731
    E-Mail

    Suche Ansprechpartner

    Hubland Süd, Geb. M2