Kurzfassung:
Die Bachelorarbeit zum Thema „Reinforcement Learning – Schaffung einer Beobachtungsumgebung anhand von Tic-Tac-Toe“ befasst sich mit der Entwicklung einer interaktiven Nutzerumgebung, um sich explorativ mit den Ansätzen und Wirkmechanismen zum Reinforcement Learning auseinandersetzen zu können. Es wird ein KI-Agent entwickelt, welcher mit der integrierten Tic-Tac-Toe-Spiel-Umgebung nteragiert. Als Reinforcement Learning Ansatz wurde das QLearning aus der Vielzahl der Ansätze ausgewählt, im Detail dargestellt und als Lernstrategie für die Bewertung von Spielzügen implementiert. Der eingesetzte KI-Agent greift auf die in der QTable hinterlegte Bewertung zurück, um seinen Zug je nach Spielstand zu wählen. Nach Abschluss jedes Spiels fließt das Ergebnis als Reward in die Aktualisierung der hinterlegten Bewertung ein, solange sich der KI-Agent noch in der Lernphase befindet. Die gewonnenen Erkenntnisse werden genutzt, um einen Ausblick auf verschiedene Einsatzszenarios des Reinforcement Learnings zu geben.