Updated abstract

This commit is contained in:
Simon
2024-02-28 22:07:30 +01:00
parent 46e4fcaa04
commit ad88641b97
4 changed files with 5 additions and 4 deletions

View File

@@ -61,3 +61,4 @@ schlagwortbasierten
Screenshotdaten
zenon-Produktpalette
Processings
Filterungsschritte

View File

@@ -1,8 +1,8 @@
\chapter{Kurzfassung}
Diese Bachelorarbeit konzentriert sich auf eines der vielen Anwendungsgebiete der optischen Texterkennung: Extraktion von Textdaten aus digitalen Screenshots. Das Ziel ist es, die Menge und Qualität der gewonnenen Daten zu maximieren, um die Verwaltung von grafischen Ressourcen für die Produktdokumentation von COPA-DATA zu vereinfachen. Gleichzeitig wird ein Beitrag zur Forschung im Bereich der Texterkennung in grafischen Oberflächen geleistet.
Diese Bachelorarbeit konzentriert sich auf eines der vielen Anwendungsgebiete der optischen Texterkennung: Extraktion von Textdaten aus digitalen Screenshots. Das Ziel ist es, die Menge und Qualität der gewonnenen Daten zu maximieren, um die Verwaltung von grafischen Ressourcen für die Produktdokumentation von COPA-DATA zu vereinfachen.
Dazu wird eine Auswahl von Algorithmen für die Aufbereitung der Bilder \bzw Filterung der Ergebnisdaten der Texterkennung getroffen, welche in ihrer Grundfunktion erklärt werden. Der Einfluss der gewählten Algorithmen auf die Ergebnisse der Texterkennung wird anschließend anhand gängiger Metriken für die Sprach- und Texterkennung objektiv miteinander verglichen.
Dazu wird eine Auswahl von Bildverarbeitungsmethoden wie Resampling oder verschiedene Schwellenwertverfahren für die Aufbereitung der Bilder getroffen. Ebenso werden die Filterungsschritte für die Ergebnisdaten der Texterkennung mittels Techniken aus dem Bereich des Natural Language Processings, beispielsweise Normalisierung oder einfache Sprachfilter, ausgewählt. Die Algorithmen werden in ihrer Grundfunktion erklärt und ihr Einfluss auf die Ergebnisse der Texterkennung anhand gängiger Metriken für die Sprach- und Texterkennung objektiv miteinander verglichen.
Durch den Vergleich der Ergebnisdaten in dem automatisch generierten Bericht wird deutlich, dass die Analyse verschiedener Bilder mit nur einem Verfahren nicht zu optimalen Ergebnissen führt. Besonders bei der Binarisierung, konkret bei Anwendung der unterschiedlichen Schwellenwertverfahren, müssen die Parameter individuell auf die unterschiedlichen Bildmerkmale angepasst werden, um keine wichtigen Details zu verlieren. Für die automatisierte Texterkennung ist es also sinnvoll, den verwendeten Algorithmus manuell auf Basis der Eingangsdaten zu bestimmen oder die Ergebnisdaten mehrerer Algorithmen automatisch zu kombinieren. So können möglichst viele Details eingefangen und das Endergebnis der Texterkennung innerhalb des Bildes optimiert werden.

View File

@@ -1,9 +1,9 @@
\chapter{Abstract}
\begin{english}
This bachelor's thesis focuses on one of the many fields of optical character recognition: the extraction of textual data from digital screenshots. The goal is to maximize the amount and quality of the resulting data, hence simplifying the management of graphical resources for COPA-DATA's product documentation. Additionally, a contribution to research in the field of text recognition in graphical user interfaces is made.
This bachelor's thesis focuses on one of the many fields of optical character recognition: the extraction of textual data from digital screenshots. The goal is to maximize the amount and quality of the resulting data, hence simplifying the management of graphical resources for COPA-DATA's product documentation.
For this purpose, a selection of algorithms for image processing and filtering of the resulting data is made. After explaining the selected algorithms in their basic function, they are objectively compared using common metrics for speech and text recognition.
For this purpose, a selection of algorithms including resampling or various thresholding techniques for image processing is chosen. For filtering the resulting data, natural language processing techniques, for instance normalization or basic language-specific filtering methods are being selected. After explaining the algorithms in their basic function, they are objectively compared using common metrics for speech and text recognition.
By comparing the resulting data in an automatically generated report, it becomes apparent that analyzing different pictures using just one method does not lead to satisfying results. In order to not lose any important details, specifically when working with binarization techniques such as thresholding, the chosen parameters must match the individual characteristics of the picture. Therefore, for automated text recognition, it is sensible to either manually determine the algorithm to be used based on the input data or to automatically combine the results of multiple algorithms. This way, as many details as possible can be captured and the end results of text recognition within the image can be optimized.

BIN
main.pdf

Binary file not shown.