Image comparisons
This commit is contained in:
@@ -19,14 +19,12 @@ Da Tesseract auf klare und scharfe Kontraste angewiesen ist, um Text korrekt zu
|
||||
|
||||
Die Bikubische Interpolation stellt eine Erweiterung der Kubischen Spline Interpolation dar. Für die Berechnung des Ergebniswertes eines Pixels werden bei diesem Verfahren sowohl Pixel aus der ersten, als auch aus der zweiten Nachbarschaft berücksichtigt, wodurch -- zu lasten der Laufzeitperformanz -- eine hohe Detailtreue erhalten werden kann. Mithilfe von Streuparametern kann beeinflusst werden, wie stark die Übergänge zwischen einzelnen Pixeln geglättet werden \bzw wie scharf die Kanten im berechneten Ergebnisbild sind. Abhängig von der Qualität der Ausgangsdaten können Skalierungsartefakte dadurch weitestgehend vermieden werden.
|
||||
|
||||
% TODO Beschreibung Funktionsweise
|
||||
|
||||
\begin{figure}[ht]
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/command-processing_screentypes_controlgroup_005.png}}
|
||||
\end{minipage}
|
||||
\hspace{0.1\textwidth}
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdProcessor(40\%).00.command-processing_screentypes_controlgroup_005.png}}}
|
||||
\end{minipage}
|
||||
\caption{Anwendung der Bikubischen Interpolation auf einen Beispielscreenshot. Die Übergänge zwischen den Pixeln werden geglättet und die Texte wirken leicht verschwommen.}
|
||||
@@ -42,11 +40,11 @@ Bei Verwendung der Bikubischen Interpolation als Resampling-Algorithmus fällt a
|
||||
Das Lanczos-Verfahren erlaubt es, Bilder beim Resampling präzise zu rekonstruieren. Es verwendet eine Fensterfunktion, basierend auf dem nichtnormierten Sinus Cardinalis, auch bekannt als Samplingfunktion \(sinc(x)\) und erzeugt im Gegensatz zur \hyperref[algorithmen_bicubic_interpolation]{Bikubischen Interpolation} weniger stark geglättete Ergebnisse, dafür sind diese jedoch meist schärfer. Durch die Verwendung der aufwändigen Samplingfunktion ist Resampling nach der Lanczos-Methode vergleichsweise rechenintensiv.
|
||||
|
||||
\begin{figure}[ht]
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/command-processing_screentypes_controlgroup_005.png}}
|
||||
\end{minipage}
|
||||
\hspace{0.1\textwidth}
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdProcessor(40\%).00.command-processing_screentypes_controlgroup_005.png}}}
|
||||
\end{minipage}
|
||||
\caption{Anwendung des Lanczos Filters auf einen Beispielscreenshot. Details und Konturen bleiben verhältnismäßig gut erhalten.}
|
||||
@@ -78,33 +76,31 @@ ImageMagick bietet eine Vielzahl an Thresholding-Algorithmen, deren Eignung in \
|
||||
\subsubsubsection{Feste Schwellenwertmethode}
|
||||
\label{thresholding_fixed}
|
||||
|
||||
Ein häufig für die Bildsegmentierung genutztes Verfahren ist die feste Schwellenwertmethode, auf Englisch auch "Fixed Thresholding" genannt. Bei diesem Bildverarbeitungsverfahren wird eine vordefinierter Grenzwert auf einzelne Pixelwerte angewandt. Liegt der Pixelwert über dem festgelegten Schwellenwert, gilt er als Teil des Vordergrunds, andernfalls als Hintergrund. Somit können Objekte, also die einzelnen Buchstaben in den Grafikdateien, von ihrem Hintergrund getrennt werden.
|
||||
Ein häufig für die Bildsegmentierung genutztes Verfahren ist die feste Schwellenwertmethode, auf Englisch auch "Fixed Thresholding" genannt. Bei diesem Bildverarbeitungsverfahren wird ein manuell vordefinierter Grenzwert auf einzelne Pixelwerte angewandt. Liegt der Pixelwert über dem festgelegten Schwellenwert, gilt er als Teil des Vordergrunds, andernfalls als Hintergrund. Somit können Objekte, also die einzelnen Buchstaben in den Grafikdateien, von ihrem Hintergrund getrennt werden.
|
||||
|
||||
Obwohl das fixe Thresholding durch seine Simplizität einen relativ geringen Berechnungsaufwand benötigt und daher eine hohe Performance aufweist, sind die Ergebnisdaten abhängig von dem Schwellenwert und dem Ausgangsbild meist unzufriedenstellend. So ergibt es sich oft, dass die eigentlich bunten grafischen Elemente der Benutzeroberfläche aufgrund ihrer Helligkeit über dem Schwellenwert liegen. Dadurch werden sie, genau wie der Text, als Vordergrund wahrgenommen und die gesamte Fläche wird einfärbig. Dadurch kann jeglicher Text innerhalb dieser Fläche nicht vom Texterkennungssystem erkannt werden.
|
||||
Das fixe Thresholding benötigt durch seine Simplizität einen relativ geringen Berechnungsaufwand und weist daher eine hohe Performance auf. Allerdings ergibt es sich oft, dass die eigentlich bunten grafischen Elemente der Benutzeroberfläche aufgrund ihrer Helligkeit über dem Schwellenwert liegen. Dadurch werden sie, genau wie der Text, als Vordergrund wahrgenommen und die gesamte Fläche wird einfärbig. Somit kann jeglicher Text innerhalb dieser Fläche nicht vom Texterkennungssystem erkannt werden und die Qualität und Menge der erkannten Textdaten wird stark reduziert.
|
||||
|
||||
\begin{figure}[ht]
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/command-processing_screentypes_controlgroup_005.png}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/zrs_ZAMS_windrose_002.png}}
|
||||
\end{minipage}
|
||||
\hspace{0.1\textwidth}
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdProcessor(40\%).00.command-processing_screentypes_controlgroup_005.png}}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdProcessor(60\%).00.zrs_ZAMS_windrose_002.png}}}
|
||||
\end{minipage}
|
||||
\caption{Anwendung des festen Schwellenwertverfahrens auf einen Beispielscreenshot. Bei einem passenden Schwellenwert und nur geringfügig verschiedenen Farbflächen ist der Textinhalt gut vom Hintergrund abgrenzbar.}
|
||||
% TODO Vergleichsbilder.
|
||||
\caption{Anwendung des festen Schwellenwertverfahrens auf einen Beispielscreenshot. Bei einem passenden Schwellenwert und nur geringfügig verschiedenen Farbflächen ist der Textinhalt gut vom Hintergrund abgrenzbar. Der Schwellenwert beträgt 60\%.}
|
||||
\label{thresholding_fixed_vergleich_gut}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[ht]
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/command-processing_screentypes_controlgroup_005.png}}
|
||||
\end{minipage}
|
||||
\hspace{0.1\textwidth}
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdProcessor(40\%).00.command-processing_screentypes_controlgroup_005.png}}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdProcessor(80\%).00.editor_startpage_project-exist_001}}}
|
||||
\end{minipage}
|
||||
\caption{Anwendung des festen Schwellenwertverfahrens auf einen Beispielscreenshot. Bei einem falsch gewählten Schwellenwert oder komplexen UI-Elementstrukturen ist der Text nicht erkennbar.}
|
||||
% TODO Vergleichsbilder.
|
||||
\caption{Anwendung des festen Schwellenwertverfahrens auf einen Beispielscreenshot. Bei einem falsch gewählten Schwellenwert oder komplexen UI-Elementstrukturen ist der Text nicht erkennbar. Der Schwellenwert beträgt 80\%.}
|
||||
\label{thresholding_fixed_vergleich_schlecht}
|
||||
\end{figure}
|
||||
|
||||
@@ -114,28 +110,26 @@ Obwohl das fixe Thresholding durch seine Simplizität einen relativ geringen Ber
|
||||
Die adaptive Schwellenwertmethode gehört zu den halbautomatischen Schwellenwertalgorithmen. Bei diesem Verfahren wird der Schwellenwert auf Basis der lokalen Eigenschaften eines Bildbereichs angepasst, der durch die sogenannte "Blockgröße" definiert wird. Innerhalb eines Blocks wird schließlich dynamisch ein fixer Schwellenwert ermittelt. Dadurch können im Gegensatz zur \hyperref[thresholding_fixed]{festen Schwellenwertmethode} verschiedenfarbige Texte auf Hintergründen unterschiedlicher Helligkeit besser abgegrenzt werden und die Menge an erkanntem Text wird erhöht.
|
||||
|
||||
\begin{figure}[ht]
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/command-processing_screentypes_controlgroup_005.png}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/zrs_REPORTS_EfficencyClass_009.png}}
|
||||
\end{minipage}
|
||||
\hspace{0.1\textwidth}
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdProcessor(40\%).00.command-processing_screentypes_controlgroup_005.png}}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdAdaptiveProcessor(20_20).00.zrs_REPORTS_EfficencyClass_009.png}}}
|
||||
\end{minipage}
|
||||
\caption{Anwendung der adaptiven Schwellenwertmethode auf einen Beispielscreenshot. Die Blockgröße ist gut an den Bildinhalt angepasst und alle Details bleiben erhalten.}
|
||||
% TODO Vergleichsbilder.
|
||||
\caption{Anwendung der adaptiven Schwellenwertmethode auf einen Beispielscreenshot. Die Blockgröße ist gut an den Bildinhalt angepasst und alle Details bleiben erhalten. Dieses Verfahren punktet hier besonders bei den Farbigen "Energy Labels", deren Textinhalte sonst mittels keinem anderen Verfahren komplett erkannt wurden.}
|
||||
\label{thresholding_adaptive_vergleich_gut}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[ht]
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/command-processing_screentypes_controlgroup_005.png}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/zrs_ZAMS_OLEDB-server_001.png}}
|
||||
\end{minipage}
|
||||
\hspace{0.1\textwidth}
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdProcessor(40\%).00.command-processing_screentypes_controlgroup_005.png}}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdAdaptiveProcessor(04_04).00.zrs_ZAMS_OLEDB-server_001.png}}}
|
||||
\end{minipage}
|
||||
\caption{Anwendung der adaptiven Schwellenwertmethode auf einen Beispielscreenshot. Details verschwinden, wenn die Blockgröße nicht richtig an den Bildinhalt angepasst ist.}
|
||||
% TODO Vergleichsbilder.
|
||||
\caption{Anwendung der adaptiven Schwellenwertmethode auf einen Beispielscreenshot. Die bei unangepasster Blockgröße entstehenden Artefakte schränken die Funktionsweise des Texterkennungssystems deutlich ein.}
|
||||
\label{thresholding_adaptive_vergleich_schlecht}
|
||||
\end{figure}
|
||||
|
||||
@@ -145,28 +139,26 @@ Die adaptive Schwellenwertmethode gehört zu den halbautomatischen Schwellenwert
|
||||
Das Dreiecks-Schwellenwertverfahren verwendet das Histogramm eines Bildes, um einen globalen Schwellenwert zu ermitteln. Innerhalb des Histogramms wird eine Linie vom Höchstwert (\engl{Peak}) zum Minimum gezeichnet und ermittelt die Normale mit der maximalen Länge. Dieses Verfahren erzielt die besten Ergebnisse, wenn die zu extrahierenden Elemente Intensitätswerte aufweisen, die an der Basis des ermittelten Peaks liegen. Für Screenshots von UI-Elementen mit komplexer Struktur und farblich stark variierenden Komponenten ist es eher nicht geeignet.
|
||||
|
||||
\begin{figure}[ht]
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/command-processing_screentypes_controlgroup_005.png}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/historian_assistent_001.png}}
|
||||
\end{minipage}
|
||||
\hspace{0.1\textwidth}
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdProcessor(40\%).00.command-processing_screentypes_controlgroup_005.png}}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/AutoThresholdProcessor(Triangle).00.historian_assistent_001.png}}}
|
||||
\end{minipage}
|
||||
\caption{Anwendung der Dreiecks-Schwellenwertmethode auf einen Beispielscreenshot. Gleichen sich die Inhalte farblich, werden die Details einigermaßen gut extrahiert.}
|
||||
% TODO Vergleichsbilder.
|
||||
\caption{Anwendung der Dreiecks-Schwellenwertmethode auf einen Beispielscreenshot. Gleichen sich die Inhalte farblich, werden einige Details extrahiert. Durch kleinste Farbvariationen im Bild weicht der Schwellenwert jedoch vom Optimum ab und die Texte sind nur schwer zu erkennen.}
|
||||
\label{thresholding_triangle_vergleich_gut}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[ht]
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/command-processing_screentypes_controlgroup_005.png}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/driver_brpvi_offlineimport_004.png}}
|
||||
\end{minipage}
|
||||
\hspace{0.1\textwidth}
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdProcessor(40\%).00.command-processing_screentypes_controlgroup_005.png}}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/AutoThresholdProcessor(Triangle).00.driver_brpvi_offlineimport_004.png}}}
|
||||
\end{minipage}
|
||||
\caption{Anwendung der Dreiecks-Schwellenwertmethode auf einen Beispielscreenshot. Bereits bei mäßiger Variation der Helligkeit verschwinden die ersten Details.}
|
||||
% TODO Vergleichsbilder.
|
||||
\label{thresholding_triangle_vergleich_schlecht}
|
||||
\end{figure}
|
||||
|
||||
@@ -177,28 +169,26 @@ Bei dem Schwellenwertverfahren nach Otsu wird der globale Schwellenwert für ein
|
||||
Enthält ein Bild jedoch starkes Hintergrundrauschen, funktioniert die Schwellenwertermittlung nur unzuverlässig. Weist es lokale Helligkeitsunterschiede auf, wie es bei grafischen Oberflächen mit ihren unterschiedlich eingefärbten Oberflächensektionen oft der Fall ist, entstehen Dank der Bestimmung eines einzelnen globalen Wertes für das gesamte Bild ähnliche Probleme wie bei der \hyperref[thresholding_fixed]{fixen Schwellenwertmethode}.
|
||||
|
||||
\begin{figure}[ht]
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/command-processing_screentypes_controlgroup_005.png}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/runtime_function_create_002.png}}
|
||||
\end{minipage}
|
||||
\hspace{0.1\textwidth}
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdProcessor(40\%).00.command-processing_screentypes_controlgroup_005.png}}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/AutoThresholdProcessor(OTSU).00.runtime_function_create_002.png}}}
|
||||
\end{minipage}
|
||||
\caption{Anwendung der Schwellenwertmethode nach Otsu auf einen Beispielscreenshot. Wird ein passender Schwellenwert ermittelt, lässt sich der Text gut vom Hintergrund trennen.}
|
||||
% TODO Vergleichsbilder.
|
||||
\label{thresholding_otsu_vergleich_gut}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[ht]
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/command-processing_screentypes_controlgroup_005.png}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/editor_windows_position_006.png}}
|
||||
\end{minipage}
|
||||
\hspace{0.1\textwidth}
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdProcessor(40\%).00.command-processing_screentypes_controlgroup_005.png}}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/AutoThresholdProcessor(OTSU).00.editor_windows_position_006.png}}}
|
||||
\end{minipage}
|
||||
\caption{Anwendung der Schwellenwertmethode nach Otsu auf einen Beispielscreenshot. Bei komplexen Strukturen im User-Interface gehen aufgrund des globalen Schwellenwerts Details verloren.}
|
||||
% TODO Vergleichsbilder.
|
||||
\label{thresholding_otsu_vergleich_schlecht}
|
||||
\end{figure}
|
||||
|
||||
@@ -212,27 +202,25 @@ Die Schwellenwertmethode nach Kapur, Sahoo und Wong zielt darauf ab, einen Schwe
|
||||
Dieses Schwellenwertverfahren liefert gute Ergebnisse bei Bildern mit starker Varianz der Vorder- und Hintergrundkontraste \bzw einer breiten Helligkeitsverteilung.
|
||||
|
||||
\begin{figure}[ht]
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/command-processing_screentypes_controlgroup_005.png}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/editor_startpage_project-exist_001.png}}
|
||||
\end{minipage}
|
||||
\hspace{0.1\textwidth}
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdProcessor(40\%).00.command-processing_screentypes_controlgroup_005.png}}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/AutoThresholdProcessor(Kapur).00.editor_startpage_project-exist_001.png}}}
|
||||
\end{minipage}
|
||||
\caption{Anwendung der Schwellenwertmethode nach Kapur auf einen Beispielscreenshot.}
|
||||
% TODO Vergleichsbilder.
|
||||
\caption{Anwendung der Schwellenwertmethode nach Kapur auf einen Beispielscreenshot. Trotz der vielen verwendeten Farben wird der Inhalt gut dargestellt.}
|
||||
\label{thresholding_kapur_vergleich_gut}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[ht]
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/command-processing_screentypes_controlgroup_005.png}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/worldview_zoom_steps_001.png}}
|
||||
\end{minipage}
|
||||
\hspace{0.1\textwidth}
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdProcessor(40\%).00.command-processing_screentypes_controlgroup_005.png}}}
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/AutoThresholdProcessor(Kapur).00.worldview_zoom_steps_001.png}}}
|
||||
\end{minipage}
|
||||
\caption{Anwendung der Schwellenwertmethode nach Kapur auf einen Beispielscreenshot.}
|
||||
% TODO Vergleichsbilder.
|
||||
\caption{Anwendung der Schwellenwertmethode nach Kapur auf einen Beispielscreenshot. Trotz der eigentlich einfach erscheinenden Oberfläche erzeugt das Verfahren Artefakte, die die Texterkennung deutlich erschweren.}
|
||||
\label{thresholding_kapur_vergleich_schlecht}
|
||||
\end{figure}
|
||||
@@ -74,11 +74,7 @@ Bei der Texterkennung kommt es manchmal vor, dass grafische Elemente als Unicode
|
||||
|
||||
Eine weitere Anforderung an das Textverarbeitungssystem ist außerdem das Einlesen und Interpretieren mehrsprachiger Bilddateien. So sollen beispielsweise Bilder mit englischen, deutschen oder italienischen Inhalten zugeführt und die Ergebnisdaten richtig verarbeitet werden können. Um eine Filterung für verschiedene Zeichensätze zu ermöglichen und eine Unterstützung für Sprachen mit nicht-lateinischen Schriften zu gewährleisten, werden dynamische Sprachfilter verwendet, die individuell an die jeweilige Sprache angepasst werden können. Um die Ergebnisdaten nicht unnötig zu verkomplizieren, werden für die initialen Tests und die Beschreibung der generellen Vorgehensweise im Rahmen dieser Bachelorarbeit jedoch nur deutsche oder englische Inhalte verarbeitet.
|
||||
|
||||
% TODO Postprocessing, NLP Folien
|
||||
|
||||
\subsubsection*{Schlagworte}
|
||||
\label{annahmen_schlagworte}
|
||||
|
||||
Für die spätere Suche von Screenshots sollen relevante Schlagworte aus den erkannten Textdaten extrahiert werden. Ein Wort eignet sich dann als Schlagwort, wenn es in relevantem Bezug zum jeweiligen Bild steht und dabei idealerweise eine wichtige Aktion oder Information widerspiegelt. Inhalte, die direkt in der grafischen Benutzeroberfläche ersichtlich sind, eignen sich demnach besonders gut als Suchworte. Damit die Menge an Schlagwörtern allerdings nicht zu unspezifisch wird, sollte es vermieden werden, allgemeine sogenannte Stoppwörter (\engl{Stop words}) ohne besondere Semantik, wie "und", "oder", in das Ergebnis mit aufzunehmen. Sie beinhalten keine spezifische Information und fördern aufgrund ihrer Häufigkeit das Auftreten von Verwechslungen.
|
||||
|
||||
% TODO this can be backed by NLP research
|
||||
@@ -11,6 +11,7 @@
|
||||
|
||||
%%%-----------------------------------------------------------------------------
|
||||
|
||||
\usepackage{xcolor}
|
||||
\usepackage{outlines}
|
||||
\usepackage{booktabs}
|
||||
\usepackage{tabularx}
|
||||
@@ -20,7 +21,6 @@
|
||||
|
||||
\usepackage{nameref}
|
||||
\usepackage{hyperref}
|
||||
% \hypersetup{hidelinks,colorlinks=true,linkcolor=blue} % todo
|
||||
|
||||
%%%-----------------------------------------------------------------------------
|
||||
|
||||
|
||||
Reference in New Issue
Block a user