Reworked abstract
This commit is contained in:
@@ -1,11 +1,9 @@
|
||||
\chapter{Kurzfassung}
|
||||
|
||||
Optische Texterkennung ist in der heutigen Zeit von immer größerer Bedeutung und wird in vielen Industrien dafür genutzt, effizient textuelle Informationen aus Fotos und digitalen Bildern zu gewinnen. Diese Bachelorarbeit widmet sich einem der Anwendungsgebiete von optischer Texterkennung, der Erkennung von Textdaten in Oberflächenscreenshots, und versucht, die Menge und Qualität der gewonnenen Daten zu maximieren. Dazu werden verschiedene Vorgehensweisen zur Aufbereitung der Bilder, sowie der Nachbearbeitung der erkannten Textdaten exemplarisch miteinander verglichen und anhand festgelegter Qualitätskriterien analysiert.
|
||||
Diese Bachelorarbeit konzentriert sich auf eines der vielen Anwendungsgebiete der optischen Texterkennung. Es wird versucht, die Menge und Qualität der gewonnenen Daten zu maximieren, um die Verwaltung von grafischen Ressourcen für die Produktdokumentation von COPA-DATA zu vereinfachen. Gleichzeitig wir ein Beitrag zur Forschung im Bereich der Texterkennung in grafischen Oberflächen geleistet.
|
||||
|
||||
Die zentrale Fragestellung der Arbeit zielt darauf ab, die beste Methodik für die Texterkennung zu identifizieren und die Resultate zu optimieren. Somit wird die Verwaltung der Produktdokumentation von COPA-DATA vereinfacht und gleichzeitig ein Beitrag zur Forschung im Bereich der Texterkennung in grafischen Oberflächen geleistet.
|
||||
Dazu wird eine Auswahl von Algorithmen für die Aufbereitung der Bilder \bzw Filterung der Ergebnisdaten der Texterkennung getroffen, welche in ihrer Grundfunktion erklärt werden. Der Einfluss der gewählten Algorithmen auf die Ergebnisse der Texterkennung wird anschließend anhand gängiger Metriken für die Sprach- und Texterkennung objektiv miteinander verglichen.
|
||||
|
||||
Um die Forschungsfrage zu beantworten, wird eine Auswahl von Algorithmen für die Bild- und Textbearbeitung getroffen. Diese Algorithmen werden in ihrer Grundfunktion erklärt und die Ergebnisse der Texterkennung anhand einer Stichprobe untersucht. Durch die Anwendung gängiger Metriken für die Sprach- und Texterkennung werden die jeweiligen Algorithmen objektiv miteinander verglichen und in einen automatisch generierten Bericht eingetragen. Dieser beinhaltet eine detaillierte Übersicht aller Ergebnisse der Texterkennung und bildet die Grundlage für die Auswertung.
|
||||
|
||||
Die Analyse aller Ergebnisdaten im Bericht erteilt Aufschluss darüber, welche Algorithmen in welchen Szenarien die besten Ergebnisse liefern. Die größte Auswirkung auf die Ergebnisdaten hat der Austausch des Thresholding- \bzw Binarisierungsverfahrens: Werden unpassende Parameter oder Verfahren genutzt, wird nur ein Bruchteil des verfügbaren Texts erkannt. Wird das passende Verfahren gewählt, wird ein Großteil der Daten korrekt vom Texterkennungssystem erkannt.
|
||||
Durch den Vergleich der Ergebnisdaten in dem automatisch generierten Bericht wird die Schwierigkeit deutlich, verschiedene Bilder mit nur einem Verfahren zu analysieren. Unter den gewählten Vorgehensweisen gibt es innerhalb der überprüften Stichprobe keinen klaren "Sieger". Besonders bei der Binarisierung, konkret bei Anwendung der unterschiedlichen Schwellenwertverfahren, müssen die Parameter individuell auf die unterschiedlichen Bildmerkmale angepasst werden, um keine wichtigen Details zu verlieren. Für die automatisierte Texterkennung ist es also sinnvoll, den verwendeten Algorithmus manuell auf Basis der Eingangsdaten zu bestimmen oder für die jeweilige Stichprobe mehrere Algorithmen zu kombinieren. So können möglichst viele Details eingefangen und das Endergebnis der Texterkennung innerhalb des Bildes optimiert werden.
|
||||
|
||||
Für weitere Forschung oder Anpassung an spezifische Anforderungen kann die prototypische Implementierung \bzw die jeweiligen Komponenten wiederverwendet werden. Durch den modularen Aufbau des automatischen Vergleichssystems kann selbst nach Änderung der Anzeigesprache oder einer farblichen Neugestaltung der grafischen Oberfläche stets mit wenig Aufwand die ideale Vorgehensweise zur Texterkennung ermittelt werden.
|
||||
|
||||
Reference in New Issue
Block a user