minor adjustments + placeholders
This commit is contained in:
@@ -65,6 +65,6 @@ wobei die einzelnen Komponenten folgende Größen darstellen:
|
||||
|
||||
\subsubsection{Vorteile und Nachteile}
|
||||
|
||||
Die CER fasst in einem Wert zusammen, wie viele Änderungen auf Zeichenebene notwendig sind, um aus dem erkannten Wort das Referenzwort zu bilden. Es ist dabei wie bei der WER nicht relevant, in welcher Reihenfolge diese Zeichen auftreten. Ebenso gibt es keine gesonderte Gewichtung für Ersetzungen, Löschungen oder Einfügungen, wodurch besonders bei kurzen Wörtern auch kleinere Abweichungen bereits zu einer relativ hohen CER führen können.
|
||||
Die CER fasst in einem Wert zusammen, wie viele Änderungen auf Zeichenebene notwendig sind, um aus dem erkannten Wort das Referenzwort zu bilden. Es ist dabei wie bei der WER nicht relevant, in welcher Reihenfolge diese Zeichen auftreten. Ebenso gibt es keine gesonderte Gewichtung für Ersetzungen, Löschungen oder Einfügungen, wodurch besonders bei kurzen Wörtern auch kleinere Abweichungen bereits zu einer hohen CER führen können.
|
||||
|
||||
Durch den detaillierten Vergleich der einzelnen Wörter auf Zeichenebene stellt die CER jedenfalls ein ausreichend gutes komplement zur WER dar, um in den folgenden Vergleichen genutzt werden zu können.
|
||||
Durch den detaillierten Vergleich der einzelnen Wörter auf Zeichenebene stellt die CER jedenfalls ein ausreichend gutes Komplement zur WER dar, um in den folgenden Vergleichen genutzt werden zu können.
|
||||
|
||||
@@ -12,6 +12,7 @@ TODO: NLP Folien durchlesen.
|
||||
|
||||
\subsection{Gegenüberstellung}
|
||||
|
||||
|
||||
TODO:
|
||||
[Auflistung einiger Methodiken, mit vor und nachteilen und bildern]
|
||||
|
||||
|
||||
@@ -32,9 +32,14 @@ Um die für Tesseract optimale \cite{tessdoc} Mindestauflösung von 300 dpi zu g
|
||||
|
||||
Für die Skalierung gibt es in der Bildverarbeitung eine Vielzahl an Algorithmen: [TODO:] (Am Ende wird es der Lanczos2)
|
||||
|
||||
TODO zeige Algorithmus variante 1 + erklärung algorithmus + zugehörige WER und CER
|
||||
TODO zeige Algorithmus variante 2 + erklärung algorithmus + zugehörige WER und CER
|
||||
TODO zeige Algorithmus variante 3 + erklärung algorithmus + zugehörige WER und CER
|
||||
|
||||
\subsubsection{Dilation und Erosion}
|
||||
|
||||
TODO remove??
|
||||
|
||||
Dilation und Erosion werden in der Bildverarbeitung zum Vergrößern und Verkleinern von Objekten verwendet. Bei der Dilation werden Objekte in einem Bild nach einem gewissen Schema erweitert. Bei der Erosion hingegen werden Objekte verkleinert, um unerwünschte Details zu entfernen.
|
||||
|
||||
TODO: Quelle
|
||||
@@ -52,12 +57,22 @@ Befindet sich Text zu nah am Rand des Bildes, kommt es vor, dass dieser nicht ri
|
||||
\label{fig:bsp_rahmen_großs}
|
||||
\end{figure}
|
||||
|
||||
TODO zeige Rahmen variante 1 + zugehörige WER und CER
|
||||
TODO zeige Rahmen variante 2 + zugehörige WER und CER
|
||||
TODO zeige Rahmen variante 3 + zugehörige WER und CER
|
||||
|
||||
TODO Wie oben zu sehen verändern unterschiedliche Rahmengrößen das Verhältnis an richtig erkannten Texten nur wenig. ...
|
||||
|
||||
\subsubsection{Thresholding und Binarisierung}
|
||||
|
||||
Die Binarisierung beschreibt den Prozess, ein Graustufenbild in ein Schwarz-Weiß-Bild umzuwandeln. Der dazu notwendige Schwellenwert kann entweder fix definiert oder anhand von verschiedensten Algorithmen ermittelt werden.
|
||||
|
||||
Binarisierung hilft bei der Segmentierung und Extraktion von Objekten in einem Bild und sorgt in den Screenshots für einen ausreichenden Kontrast, unabhängig von der Vorder- und Hintergrundfarbe von Textelementen
|
||||
|
||||
TODO zeige Vorgehen variante 1 + erklärung algorithmus + zugehörige WER und CER
|
||||
TODO zeige Vorgehen variante 2 + erklärung algorithmus + zugehörige WER und CER
|
||||
TODO zeige Vorgehen variante 3 + erklärung algorithmus + zugehörige WER und CER
|
||||
|
||||
(
|
||||
TODO:
|
||||
|
||||
|
||||
Reference in New Issue
Block a user