diff --git a/chapters/c80_zusammenfassung/index.tex b/chapters/c80_zusammenfassung/index.tex index 080742f..11d66cc 100644 --- a/chapters/c80_zusammenfassung/index.tex +++ b/chapters/c80_zusammenfassung/index.tex @@ -3,6 +3,6 @@ Im Rahmen dieser Bachelorarbeit wurde sich intensiv mit der Anwendung von optischer Texterkennung für die Verschlagwortung von Oberflächenscreenshots auseinandergesetzt. Das Ziel, eine Vorgehensweise für die automatisierte Verschlagwortung von Bilddateien zu entwickeln und die Anwendbarkeit verschiedener Algorithmen zur Bildbearbeitung und Texterkennung zu evaluieren, wurde erreicht. Insgesamt wurden die Grundlagen moderner Bildverarbeitung \bzw der Funktionsweise von Texterkennungssystemen aufgearbeitet. Das Ergebnis ist ein universelles System zur Analyse der Vergleichswerte, das auch die Integration weiterer Algorithmen ermöglicht. Dies erlaubt eine kontinuierliche Verbesserung und Anpassung des Texterkennungssystems an neue Anforderungen. -Aufgrund der Auswahl und Parametrisierung der ersten Tests beträgt die resultierende Fehlerrate in etwa 40\%. Nach Abschluss der Bachelorarbeit wird es jedoch weitere Optimierungsversuche geben. Das nächste Ziel ist es, eine Wortfehlerrate von 20\% nicht zu überschreiten, um eine zuverlässige Erkennung der Texte zu gewährleisten. Dazu werden weitere Bildbearbeitungsmethoden, beispielsweise Kantendetektoren, in Verbindung mit sogenanntem "Fuzzy Matching" für die Erkennung der Schlagworte verwendet. Ebenso gibt es unter Verwendung der bereits implementierten Algorithmen noch Verbesserungspotential. Beispielsweise könnten mehrfach gefundene Wörter, die in der aktuellen Version des Prototyps einfach verworfen werden, zur Ermittlung der Wichtigkeit eines Schlagwortes genutzt werden. +Aufgrund der Auswahl und Parametrisierung der ersten Tests beträgt die resultierende Fehlerrate in etwa 40\%. Nach Abschluss der Bachelorarbeit wird es jedoch weitere Optimierungsversuche geben. Das nächste Ziel ist es, eine Wortfehlerrate von 20\% nicht zu überschreiten, um eine zuverlässige Erkennung der Texte zu gewährleisten. Dazu werden weitere Bildbearbeitungsmethoden, beispielsweise Kantendetektoren \mcite{liu2006multiscale}, in Verbindung mit sogenanntem "Fuzzy Matching" \mcite{cayrol1982fuzzy} für die Erkennung der Schlagworte verwendet. Ebenso gibt es unter Verwendung der bereits implementierten Algorithmen noch Verbesserungspotential. Beispielsweise könnten mehrfach gefundene Wörter, die in der aktuellen Version des Prototyps einfach verworfen werden, zur Ermittlung der Wichtigkeit eines Schlagwortes genutzt werden. Nach Abschluss der Optimierungsversuche wird das gewonnene Wissen weiter in den Schreenshot-Manager einfließen und die Texterkennungsfunktionalität in das Programm integriert. Die gefundenen mehrsprachigen Schlagworte werden in Zukunft für jedes Bild ermittelt und in einer Datenbank abgelegt, um ein einfaches und effizientes Suchen innerhalb der Anwendung zu ermöglichen. \ No newline at end of file diff --git a/main.pdf b/main.pdf index efa9fcc..95491a5 100644 Binary files a/main.pdf and b/main.pdf differ diff --git a/references.bib b/references.bib index df89f69..f0c8a22 100644 --- a/references.bib +++ b/references.bib @@ -334,3 +334,21 @@ pages={70--73}, year={2014} } +@inproceedings{liu2006multiscale, + title={Multiscale edge-based text extraction from complex images}, + author={Liu, Xiaoqing and Samarabandu, Jagath}, + booktitle={2006 IEEE International Conference on Multimedia and Expo}, + pages={1721--1724}, + year={2006}, + organization={IEEE} +} +@article{cayrol1982fuzzy, + title={Fuzzy pattern matching}, + author={Cayrol, M and Farreny, H and Prade, H}, + journal={Kybernetes}, + volume={11}, + number={2}, + pages={103--116}, + year={1982}, + publisher={MCB UP Ltd} +}