Zum Hauptinhalt springen
FHEDEEN
Infomaterial anfordern

Bachelor Flyer Master Flyer

Kontakt

Sekretariat Angewandte Informatik
Tel.: 0361 6700-642
Fax: 0361 6700-643 sekretariat-ai@fh-erfurt.de

Besucheranschrift:

Fachhochschule Erfurt
Fakultät Gebäudetechnik und Informatik
Fachrichtung Angewandte Informatik
Altonaer Straße 25
99085 Erfurt

Konzeption und prototypische Implementierung einer Service-Komponente zur Generierung von Hashtags unter Verwendung von Natural Language Processing

Plakat: Bachelorarbeit vom Student Lahmidi Mustapha

Keyword-Extrahierung und Themenindizierung sind in NLP-Kreisen lange erforschte Aufgaben. Die Aufgabe besteht darin, eine Reihe von Begriffen oder Phrasen, die den Inhalt eines Textstücks zusammenfassen, zu extrahieren.

Professionelle Indexer oder die Autoren des Textes selbst sind normalerweise die Personen, die für eine solche manuelle Aufgabe verantwortlich sind.

Viele Studien in der Literatur haben jedoch begonnen, sich mit der Idee der Automatisierung vom Keyword Retrieval zu befassen, da der Prozess einer manuellen Bearbeitung zeitaufwändig und mühsam ist. Nicht zu vergessen, dass das Volumen des zu verarbeitenden Inhalts stets größer wird.

Ziel dieser Arbeit ist die Konzipierung und Entwicklung einer Restful-Web-Anwendung, mit der passende Hashtags zu einem Text oder Datei generiert werden. Die Software ist außerdem auch in der Lage zusammenhängende Hashtags aus Twitter und Instagram zu suchen, zu verarbeiten und als Vorschläge zurückzugeben.

Da ein Bild mehr als tausende Worte sagt ermöglicht diese Applikation auch eine Visualisierung vom Ergebnis als Schlagwortwolke.

In dieser Arbeit wird die Implementierung und Konzepierung dieser Web-Lösung ausführlich geschildert.

Keyword extraction and topic indexing are long-standing research tasks in the field of natural language. The task is to extract a set of terms or phrases that summarize the content of a text.

Professional indexers or the authors of the text itself are usually the people in charge of this manual task.

However, many studies in the literature have begun to look at the idea of automating keyword retrieval, as the manual editing process is time consuming and tedious. In addition to that, the volume of content to be processed is constantly increasing.

The objective of this work is to design and develop a Restful Web application that generates hashtags corresponding to a text or a file. The software is also able to search and process related hashtags from Twitter and Instagram and return them as suggestions.

Since a picture is worth a thousand words, this application also visualizes the result as a tag cloud.

In this thesis, the implementation and design of this web solution is described in detail.