finalized abstract
This commit is contained in:
@@ -2,10 +2,8 @@
|
||||
|
||||
Diese Bachelorarbeit konzentriert sich auf eines der vielen Anwendungsgebiete der optischen Texterkennung: Extraktion von Textdaten aus digitalen Screenshots. Das Ziel ist es, die Menge und Qualität der gewonnenen Daten zu maximieren, um die Verwaltung von grafischen Ressourcen für die Produktdokumentation von COPA-DATA zu vereinfachen.
|
||||
|
||||
Dazu wird eine Auswahl von Bildverarbeitungsmethoden wie Resampling oder verschiedene Schwellenwertverfahren für die Aufbereitung der Bilder getroffen. Ebenso werden die Filterungsschritte für die Ergebnisdaten der Texterkennung mittels Techniken aus dem Bereich des Natural Language Processings, beispielsweise Normalisierung oder einfache Sprachfilter, ausgewählt. Die Algorithmen werden in ihrer Grundfunktion erklärt und ihr Einfluss auf die Ergebnisse der Texterkennung anhand gängiger Metriken für die Sprach- und Texterkennung objektiv miteinander verglichen.
|
||||
Dazu wird eine Auswahl von Bildverarbeitungsmethoden wie Resampling oder Binarisierung für die Aufbereitung der Bilder getroffen. Ebenso werden die Filterungsschritte für die Ergebnisdaten der Texterkennung mittels Techniken aus dem Bereich des Natural Language Processings, beispielsweise Normalisierung oder einfache sprachspezifische Filter, ausgewählt. Die Algorithmen werden in ihrer Grundfunktion erklärt und ihr Einfluss auf die Ergebnisse der Texterkennung anhand gängiger Metriken für die Sprach- und Texterkennung objektiv miteinander verglichen.
|
||||
|
||||
Durch den Vergleich der Ergebnisdaten in dem automatisch generierten Bericht wird deutlich, dass die Analyse verschiedener Bilder mit nur einem Verfahren nicht zu optimalen Ergebnissen führt. Besonders bei der Binarisierung, konkret bei Anwendung der unterschiedlichen Schwellenwertverfahren, müssen die Parameter individuell auf die unterschiedlichen Bildmerkmale angepasst werden, um keine wichtigen Details zu verlieren. Für die automatisierte Texterkennung ist es also sinnvoll, den verwendeten Algorithmus manuell auf Basis der Eingangsdaten zu bestimmen oder die Ergebnisdaten mehrerer Algorithmen automatisch zu kombinieren. So können möglichst viele Details eingefangen und das Endergebnis der Texterkennung innerhalb des Bildes optimiert werden.
|
||||
Die Analyse verschiedener Bilder mit nur einem Verfahren führt nicht immer zu optimalen Ergebnissen. Besonders bei Anwendung der unterschiedlichen Schwellenwertverfahren müssen die Parameter individuell auf die unterschiedlichen Bildmerkmale angepasst werden, um keine wichtigen Details zu verlieren. Basierend auf den in dieser Bachelorarbeit angestellten Vergleichen kann das Texterkennungssystem für die COPA-DATA Produktdokumentation so parametriert werden, dass bei Verarbeitung unterschiedlicher Eingangsbilder möglichst viele Details eingefangen werden und das Endergebnis der Texterkennung innerhalb des Bildes optimiert werden kann.
|
||||
|
||||
Für weitere Forschung oder Anpassung an spezifische Anforderungen kann die prototypische Implementierung \bzw deren Komponenten wiederverwendet werden. Durch den modularen Aufbau ist es möglich, neue Funktionalität hinzuzufügen oder bestehende zu verändern. Somit kann selbst nach Änderung der Anzeigesprache oder einer farblichen Neugestaltung der grafischen Oberfläche stets mit wenig Aufwand die ideale Vorgehensweise zur Texterkennung ermittelt werden.
|
||||
|
||||
% todo konkretes Ergebnis und Ausblick bzgl zu verwendender Alg einfügen
|
||||
Für weitere Forschung oder Anpassung an spezifische Anforderungen kann die prototypische Implementierung \bzw deren Komponenten wiederverwendet werden. Durch den modularen Aufbau ist es möglich, neue Funktionalität hinzuzufügen oder bestehende zu verändern. Somit kann selbst nach Änderung der Anzeigesprache oder einer farblichen Neugestaltung der grafischen Oberfläche stets mit wenig Aufwand die ideale Vorgehensweise zur Texterkennung ermittelt werden. Auch weitere Schritte zur Verbesserung der Texterkennung, beispielsweise Kantendetektion in der Bildverarbeitung oder "Fuzzy Matching" zur Erfassung der Ergebnisdaten sind aufgrund der flexiblen Struktur realisierbar.
|
||||
@@ -3,9 +3,9 @@
|
||||
|
||||
This bachelor's thesis focuses on one of the many fields of optical character recognition: the extraction of textual data from digital screenshots. The goal is to maximize the amount and quality of the resulting data, hence simplifying the management of graphical resources for COPA-DATA's product documentation.
|
||||
|
||||
For this purpose, a selection of algorithms including resampling or various thresholding techniques for image processing is chosen. For filtering the resulting data, natural language processing techniques, for instance normalization or basic language-specific filtering methods are being selected. After explaining the algorithms in their basic function, they are objectively compared using common metrics for speech and text recognition.
|
||||
For this purpose, a selection of algorithms including resampling or binarization for image processing is chosen. For filtering the resulting data, natural language processing techniques, for instance normalization or basic language-specific filtering methods are being selected. After explaining the algorithms in their basic function, they are objectively compared using common metrics for speech and text recognition.
|
||||
|
||||
By comparing the resulting data in an automatically generated report, it becomes apparent that analyzing different pictures using just one method does not lead to satisfying results. In order to not lose any important details, specifically when working with binarization techniques such as thresholding, the chosen parameters must match the individual characteristics of the picture. Therefore, for automated text recognition, it is sensible to either manually determine the algorithm to be used based on the input data or to automatically combine the results of multiple algorithms. This way, as many details as possible can be captured and the end results of text recognition within the image can be optimized.
|
||||
Analyzing different pictures using just one method does not always lead to satisfying results. To avoid losing important details, specifically when working with binarization techniques such as thresholding, the chosen parameters must match the individual characteristics of the picture. Based on the comparisons conducted in this bachelor thesis, the text recognition system for the COPA-DATA product documentation can be parameterized in such a way that it captures as many details as possible when processing different input images, optimizing the end result of text recognition within the image.
|
||||
|
||||
The prototypical implementation and its respective components are designed to be reusable for further research or adaptation to specific requirements. Due to the modular structure of the automated comparison system, it is possible to add new functionality and to edit existing features. As a result, a satisfying text recognition approach can always be determined with little effort, even after changing the display language or after a complete redesign of the graphical user interface.
|
||||
The prototypical implementation and its respective components are designed to be reusable for further research or adaptation to specific requirements. Due to the modular structure of the automated comparison system, it is possible to add new functionality and to edit existing features. As a result, a satisfying text recognition approach can always be determined with little effort, even after changing the display language or after a complete redesign of the graphical user interface. Further steps to improve text recognition, such as edge detection in image processing or "fuzzy matching" to capture result data, are feasible due to the flexible structure.
|
||||
\end{english}
|
||||
Reference in New Issue
Block a user