thesis/chapters/c00_frontmatter/abstract/de.tex

\chapter{Kurzfassung}

Optische Texterkennung ist in der heutigen Zeit von immer größerer Bedeutung und wird in vielen Industrien dafür genutzt, effizient textuelle Informationen aus Fotos und digitalen Bildern zu gewinnen. Diese Bachelorarbeit widmet sich einem der Anwendungsgebiete von optischer Texterkennung, der Erkennung von Textdaten in Oberflächenscreenshots, und versucht, die Menge und Qualität der gewonnenen Daten zu maximieren. Dazu werden verschiedene Vorgehensweisen zur Aufbereitung der Bilder, sowie der Nachbearbeitung der erkannten Textdaten exemplarisch miteinander verglichen und anhand festgelegter Qualitätskriterien analysiert.

Die zentrale Fragestellung der Arbeit zielt darauf ab, die beste Methodik für die Texterkennung zu identifizieren und die Resultate zu optimieren. Somit wird die Verwaltung der Produktdokumentation von COPA-DATA vereinfacht und gleichzeitig ein Beitrag zur Forschung im Bereich der Texterkennung in grafischen Oberflächen geleistet.

Um die Forschungsfrage zu beantworten, wird eine Auswahl von Algorithmen für die Bild- und Textbearbeitung getroffen. Diese Algorithmen werden in ihrer Grundfunktion erklärt und die Ergebnisse der Texterkennung anhand einer Stichprobe untersucht. Durch die Anwendung gängiger Metriken für die Sprach- und Texterkennung werden die jeweiligen Algorithmen objektiv miteinander verglichen und in einen automatisch generierten Bericht eingetragen. Dieser beinhaltet eine detaillierte Übersicht aller Ergebnisse der Texterkennung und bildet die Grundlage für die Auswertung.

Die Analyse aller Ergebnisdaten im Bericht erteilt Aufschluss darüber, welche Algorithmen in welchen Szenarien die besten Ergebnisse liefern. Die größte Auswirkung auf die Ergebnisdaten hat der Austausch des Thresholding- \bzw Binarisierungsverfahrens: Werden unpassende Parameter oder Verfahren genutzt, wird nur ein Bruchteil des verfügbaren Texts erkannt. Wird das passende Verfahren gewählt, wird ein Großteil der Daten korrekt vom Texterkennungssystem erkannt.

Für weitere Forschung oder Anpassung an spezifische Anforderungen kann die prototypische Implementierung \bzw die jeweiligen Komponenten wiederverwendet werden. Durch den modularen Aufbau des automatischen Vergleichssystems kann selbst nach Änderung der Anzeigesprache oder einer farblichen Neugestaltung der grafischen Oberfläche stets mit wenig Aufwand die ideale Vorgehensweise zur Texterkennung ermittelt werden.