Abstract en rewrite
This commit is contained in:
Vendored
+3
@@ -0,0 +1,3 @@
|
||||
COPA-DATA
|
||||
thresholding
|
||||
binarization
|
||||
@@ -1,9 +1,9 @@
|
||||
\chapter{Kurzfassung}
|
||||
|
||||
Diese Bachelorarbeit konzentriert sich auf eines der vielen Anwendungsgebiete der optischen Texterkennung. Es wird versucht, die Menge und Qualität der gewonnenen Daten zu maximieren, um die Verwaltung von grafischen Ressourcen für die Produktdokumentation von COPA-DATA zu vereinfachen. Gleichzeitig wir ein Beitrag zur Forschung im Bereich der Texterkennung in grafischen Oberflächen geleistet.
|
||||
Diese Bachelorarbeit konzentriert sich auf eines der vielen Anwendungsgebiete der optischen Texterkennung: Extraktion von Textdaten aus digitalen Screenshots. Das Ziel ist es, die Menge und Qualität der gewonnenen Daten zu maximieren, um die Verwaltung von grafischen Ressourcen für die Produktdokumentation von COPA-DATA zu vereinfachen. Gleichzeitig wir ein Beitrag zur Forschung im Bereich der Texterkennung in grafischen Oberflächen geleistet.
|
||||
|
||||
Dazu wird eine Auswahl von Algorithmen für die Aufbereitung der Bilder \bzw Filterung der Ergebnisdaten der Texterkennung getroffen, welche in ihrer Grundfunktion erklärt werden. Der Einfluss der gewählten Algorithmen auf die Ergebnisse der Texterkennung wird anschließend anhand gängiger Metriken für die Sprach- und Texterkennung objektiv miteinander verglichen.
|
||||
|
||||
Durch den Vergleich der Ergebnisdaten in dem automatisch generierten Bericht wird die Schwierigkeit deutlich, verschiedene Bilder mit nur einem Verfahren zu analysieren. Unter den gewählten Vorgehensweisen gibt es innerhalb der überprüften Stichprobe keinen klaren "Sieger". Besonders bei der Binarisierung, konkret bei Anwendung der unterschiedlichen Schwellenwertverfahren, müssen die Parameter individuell auf die unterschiedlichen Bildmerkmale angepasst werden, um keine wichtigen Details zu verlieren. Für die automatisierte Texterkennung ist es also sinnvoll, den verwendeten Algorithmus manuell auf Basis der Eingangsdaten zu bestimmen oder für die jeweilige Stichprobe mehrere Algorithmen zu kombinieren. So können möglichst viele Details eingefangen und das Endergebnis der Texterkennung innerhalb des Bildes optimiert werden.
|
||||
Durch den Vergleich der Ergebnisdaten in dem automatisch generierten Bericht wird deutlich, dass die Analyse verschiedener Bilder mit nur einem Verfahren nicht zu optimalen Ergebnissen führt. Unter den gewählten Vorgehensweisen gibt es innerhalb der überprüften Stichprobe keinen klaren "Sieger". Besonders bei der Binarisierung, konkret bei Anwendung der unterschiedlichen Schwellenwertverfahren, müssen die Parameter individuell auf die unterschiedlichen Bildmerkmale angepasst werden, um keine wichtigen Details zu verlieren. Für die automatisierte Texterkennung ist es also sinnvoll, den verwendeten Algorithmus manuell auf Basis der Eingangsdaten zu bestimmen oder die Ergebnisdaten mehrerer Algorithmen automatisch zu kombinieren. So können möglichst viele Details eingefangen und das Endergebnis der Texterkennung innerhalb des Bildes optimiert werden.
|
||||
|
||||
Für weitere Forschung oder Anpassung an spezifische Anforderungen kann die prototypische Implementierung \bzw die jeweiligen Komponenten wiederverwendet werden. Durch den modularen Aufbau des automatischen Vergleichssystems kann selbst nach Änderung der Anzeigesprache oder einer farblichen Neugestaltung der grafischen Oberfläche stets mit wenig Aufwand die ideale Vorgehensweise zur Texterkennung ermittelt werden.
|
||||
Für weitere Forschung oder Anpassung an spezifische Anforderungen kann die prototypische Implementierung \bzw deren Komponenten wiederverwendet werden. Durch den modularen Aufbau des automatischen Vergleichssystems kann selbst nach Änderung der Anzeigesprache oder einer farblichen Neugestaltung der grafischen Oberfläche stets mit wenig Aufwand die ideale Vorgehensweise zur Texterkennung ermittelt werden.
|
||||
|
||||
@@ -1,4 +1,11 @@
|
||||
\chapter{Abstract}
|
||||
\begin{english}
|
||||
|
||||
This bachelor's thesis focuses on one of the many fields of optical character recognition: the extraction of textual data from digital screenshots. The goal is to maximize the amount and quality of the resulting data, hence simplifying the management of graphical resources for COPA-DATA's product documentation. Additionally, a contribution to research in the field of text recognition in graphical user interfaces is made.
|
||||
|
||||
For this purpose, a selection of algorithms for image processing and filtering of the resulting data is made. After explaining the selected algorithms in their basic function, they are objectively compared using common metrics for speech and text recognition.
|
||||
|
||||
By comparing the resulting data in the automatically generated report, it becomes apparent that analyzing different pictures using just one method does not lead to optimal results. Amongst the chosen approaches, there is no clear "winner" in the examined sample. In order to not lose any important details, specifically when working with binarization techniques such as thresholding, the chosen parameters must match the individual characteristics of the picture. Therefore, for automated text recognition, it is sensible to either manually determine the algorithm to use based on the input data or to automatically combine the results of multiple algorithms. This way, as many details as possible can be captured and the end results of text recognition within the image can be optimized.
|
||||
|
||||
For further research or adaptation to specific requirements, the prototypical implementation or its respective components are designed to be reused. Due to the modular structure of the automated comparison system, the ideal text recognition approach can always be determined with little effort, even after changing the display language or after a complete redesign of the graphical user interface.
|
||||
\end{english}
|
||||
Reference in New Issue
Block a user