edge detection in summary
This commit is contained in:
@@ -3,6 +3,6 @@
|
||||
|
||||
Im Rahmen dieser Bachelorarbeit wurde sich intensiv mit der Anwendung von optischer Texterkennung für die Verschlagwortung von Oberflächenscreenshots auseinandergesetzt. Das Ziel, eine Vorgehensweise für die automatisierte Verschlagwortung von Bilddateien zu entwickeln und die Anwendbarkeit verschiedener Algorithmen zur Bildbearbeitung und Texterkennung zu evaluieren, wurde erreicht. Insgesamt wurden die Grundlagen moderner Bildverarbeitung \bzw der Funktionsweise von Texterkennungssystemen aufgearbeitet. Das Ergebnis ist ein universelles System zur Analyse der Vergleichswerte, das auch die Integration weiterer Algorithmen ermöglicht. Dies erlaubt eine kontinuierliche Verbesserung und Anpassung des Texterkennungssystems an neue Anforderungen.
|
||||
|
||||
Aufgrund der Auswahl und Parametrisierung der ersten Tests beträgt die resultierende Fehlerrate in etwa 40\%. Nach Abschluss der Bachelorarbeit wird es jedoch weitere Optimierungsversuche geben. Das nächste Ziel ist es, eine Wortfehlerrate von 20\% nicht zu überschreiten, um eine zuverlässige Erkennung der Texte zu gewährleisten. Dazu werden weitere Bildbearbeitungsmethoden, beispielsweise Kantendetektoren, in Verbindung mit sogenanntem "Fuzzy Matching" für die Erkennung der Schlagworte verwendet. Ebenso gibt es unter Verwendung der bereits implementierten Algorithmen noch Verbesserungspotential. Beispielsweise könnten mehrfach gefundene Wörter, die in der aktuellen Version des Prototyps einfach verworfen werden, zur Ermittlung der Wichtigkeit eines Schlagwortes genutzt werden.
|
||||
Aufgrund der Auswahl und Parametrisierung der ersten Tests beträgt die resultierende Fehlerrate in etwa 40\%. Nach Abschluss der Bachelorarbeit wird es jedoch weitere Optimierungsversuche geben. Das nächste Ziel ist es, eine Wortfehlerrate von 20\% nicht zu überschreiten, um eine zuverlässige Erkennung der Texte zu gewährleisten. Dazu werden weitere Bildbearbeitungsmethoden, beispielsweise Kantendetektoren \mcite{liu2006multiscale}, in Verbindung mit sogenanntem "Fuzzy Matching" \mcite{cayrol1982fuzzy} für die Erkennung der Schlagworte verwendet. Ebenso gibt es unter Verwendung der bereits implementierten Algorithmen noch Verbesserungspotential. Beispielsweise könnten mehrfach gefundene Wörter, die in der aktuellen Version des Prototyps einfach verworfen werden, zur Ermittlung der Wichtigkeit eines Schlagwortes genutzt werden.
|
||||
|
||||
Nach Abschluss der Optimierungsversuche wird das gewonnene Wissen weiter in den Schreenshot-Manager einfließen und die Texterkennungsfunktionalität in das Programm integriert. Die gefundenen mehrsprachigen Schlagworte werden in Zukunft für jedes Bild ermittelt und in einer Datenbank abgelegt, um ein einfaches und effizientes Suchen innerhalb der Anwendung zu ermöglichen.
|
||||
@@ -334,3 +334,21 @@
|
||||
pages={70--73},
|
||||
year={2014}
|
||||
}
|
||||
@inproceedings{liu2006multiscale,
|
||||
title={Multiscale edge-based text extraction from complex images},
|
||||
author={Liu, Xiaoqing and Samarabandu, Jagath},
|
||||
booktitle={2006 IEEE International Conference on Multimedia and Expo},
|
||||
pages={1721--1724},
|
||||
year={2006},
|
||||
organization={IEEE}
|
||||
}
|
||||
@article{cayrol1982fuzzy,
|
||||
title={Fuzzy pattern matching},
|
||||
author={Cayrol, M and Farreny, H and Prade, H},
|
||||
journal={Kybernetes},
|
||||
volume={11},
|
||||
number={2},
|
||||
pages={103--116},
|
||||
year={1982},
|
||||
publisher={MCB UP Ltd}
|
||||
}
|
||||
|
||||
Reference in New Issue
Block a user