diff --git a/.vscode/ltex.dictionary.de-AT.txt b/.vscode/ltex.dictionary.de-AT.txt index 83a6645..1d2f34d 100644 --- a/.vscode/ltex.dictionary.de-AT.txt +++ b/.vscode/ltex.dictionary.de-AT.txt @@ -50,3 +50,4 @@ ReportGenerator-Frameworks ReportGenerators Lookup EntityFramework-Bibliothek +Prototypbibliothek diff --git a/chapters/c10_einleitung/herausforderungen.tex b/chapters/c10_einleitung/herausforderungen.tex index aa5228a..ae6e471 100644 --- a/chapters/c10_einleitung/herausforderungen.tex +++ b/chapters/c10_einleitung/herausforderungen.tex @@ -1,8 +1,6 @@ -\section{Herausforderungen} -\label{herausforderungen} +\section{Ziele} +\label{ziele} -Die konkrete Herausforderung bei der Texterkennung mittels OCR besteht aus dem Finden eines passenden Texterkennungs-Frameworks, der Einbindung der im Rahmen dieser Bachelorarbeit entwickelten Prototypbibliothek in das bestehende "ScreenshotManager" Basisprogramms und nicht zuletzt dem korrekten und zuverlässigen Erkennen der erwarteten bzw. bis dahin unbekannten Schlagworte in den bestehenden Bilddateien und denen, die in Zukunft hochgeladen werden. Um bestmögliche Ergebnisse zu erzielen, ist das automatische Verändern der Bilddaten (Thresholds, Anpassen der Kontrastwerte, Farbe, Helligkeit, etc.) dabei unumgänglich. +Das Ziel dieser Bachelorarbeit ist das Ermitteln einer Vorgehensweise für Texterkennung in Screenshots von grafischen Oberflächen. Verschiedene Algorithmen zur Bildbearbeitung vor der Texterkennung oder Nachbearbeitung \bzw Filterung der Ergebnisdaten werden evaluiert und anhand von festgelegten Qualitätskriterien miteinander verglichen. -Weiters bildet die Verknüpfung erkannter Texte mit den entsprechenden Screenshots unter Rücksichtnahme auf die Sprache der hochgeladenen Grafik die Basis des Schlagwortsystems. Es ist ein geeignetes Speichersystem notwendig, um bei der Vielzahl an gespeicherten Screenshots performant nach Schlagwörtern suchen zu können. Die OCR-Funktionalität und auch die Ablagestruktur der Schlagwortinformation muss modular aufgebaut sein, um zukünftig hinzukommende Dokumentationssprachen beziehungsweise neue Schlagwörter, beispielsweise bei Anpassung des Corporate Brandings, ohne großen Konfigurations- oder gar Entwicklungsaufwand unterstützen zu können. - -Auch die Integration mit dem intern eingesetzten Content-Management-Systems (kurz "CMS") "Author-It" muss gegeben sein, wobei die Verwaltung und Verknüpfung der Bilddateien mit dem Author-It System aufwendiger ist, als die für die Bachelorarbeit relevante Ablage der Schlagwortinformation. \ No newline at end of file +Die prototypische Implementierung dient als Basis für jegliche Tests und Analysen, anhand derer die Algorithmen automatisch verglichen werden. Die entwickelten Komponenten werden als Bibliotheken zur Verfügung gestellt, um die Texterkennung inklusive automatischer Bildverarbeitung und Filterung der erkannten Inhalte \bzw Schlagworte später in anderen Anwendungen weiterverwenden zu können. \ No newline at end of file diff --git a/chapters/c40_durchführung/implementierung.tex b/chapters/c40_durchführung/implementierung.tex index e34d28e..12c406e 100644 --- a/chapters/c40_durchführung/implementierung.tex +++ b/chapters/c40_durchführung/implementierung.tex @@ -68,7 +68,7 @@ Beim Entwurf des Verarbeitungssystems für die unterschiedlichen Bild- und Textv } \end{CsCode} \label{program:processor_interface} -\captionof{program}{Auszug aus Datei "IProcessor.cs": Schnittstelle eines Prozessors} +\captionof{program}{Auszug aus Datei "IProcessor.cs": Schnittstelle eines Prozessors.} \begin{CsCode}[numbers=none] public class ToLowerProcessor diff --git a/main.pdf b/main.pdf index 2e57f32..d016f86 100644 Binary files a/main.pdf and b/main.pdf differ