minor adjustments + placeholders

This commit is contained in:
Simon
2023-12-05 21:59:51 +01:00
parent baf5b3876f
commit d01bf6179a
4 changed files with 18 additions and 2 deletions
+2 -2
View File
@@ -65,6 +65,6 @@ wobei die einzelnen Komponenten folgende Größen darstellen:
\subsubsection{Vorteile und Nachteile}
Die CER fasst in einem Wert zusammen, wie viele Änderungen auf Zeichenebene notwendig sind, um aus dem erkannten Wort das Referenzwort zu bilden. Es ist dabei wie bei der WER nicht relevant, in welcher Reihenfolge diese Zeichen auftreten. Ebenso gibt es keine gesonderte Gewichtung für Ersetzungen, Löschungen oder Einfügungen, wodurch besonders bei kurzen Wörtern auch kleinere Abweichungen bereits zu einer relativ hohen CER führen können.
Die CER fasst in einem Wert zusammen, wie viele Änderungen auf Zeichenebene notwendig sind, um aus dem erkannten Wort das Referenzwort zu bilden. Es ist dabei wie bei der WER nicht relevant, in welcher Reihenfolge diese Zeichen auftreten. Ebenso gibt es keine gesonderte Gewichtung für Ersetzungen, Löschungen oder Einfügungen, wodurch besonders bei kurzen Wörtern auch kleinere Abweichungen bereits zu einer hohen CER führen können.
Durch den detaillierten Vergleich der einzelnen Wörter auf Zeichenebene stellt die CER jedenfalls ein ausreichend gutes komplement zur WER dar, um in den folgenden Vergleichen genutzt werden zu können.
Durch den detaillierten Vergleich der einzelnen Wörter auf Zeichenebene stellt die CER jedenfalls ein ausreichend gutes Komplement zur WER dar, um in den folgenden Vergleichen genutzt werden zu können.
+1
View File
@@ -12,6 +12,7 @@ TODO: NLP Folien durchlesen.
\subsection{Gegenüberstellung}
TODO:
[Auflistung einiger Methodiken, mit vor und nachteilen und bildern]
+15
View File
@@ -32,9 +32,14 @@ Um die für Tesseract optimale \cite{tessdoc} Mindestauflösung von 300 dpi zu g
Für die Skalierung gibt es in der Bildverarbeitung eine Vielzahl an Algorithmen: [TODO:] (Am Ende wird es der Lanczos2)
TODO zeige Algorithmus variante 1 + erklärung algorithmus + zugehörige WER und CER
TODO zeige Algorithmus variante 2 + erklärung algorithmus + zugehörige WER und CER
TODO zeige Algorithmus variante 3 + erklärung algorithmus + zugehörige WER und CER
\subsubsection{Dilation und Erosion}
TODO remove??
Dilation und Erosion werden in der Bildverarbeitung zum Vergrößern und Verkleinern von Objekten verwendet. Bei der Dilation werden Objekte in einem Bild nach einem gewissen Schema erweitert. Bei der Erosion hingegen werden Objekte verkleinert, um unerwünschte Details zu entfernen.
TODO: Quelle
@@ -52,12 +57,22 @@ Befindet sich Text zu nah am Rand des Bildes, kommt es vor, dass dieser nicht ri
\label{fig:bsp_rahmen_großs}
\end{figure}
TODO zeige Rahmen variante 1 + zugehörige WER und CER
TODO zeige Rahmen variante 2 + zugehörige WER und CER
TODO zeige Rahmen variante 3 + zugehörige WER und CER
TODO Wie oben zu sehen verändern unterschiedliche Rahmengrößen das Verhältnis an richtig erkannten Texten nur wenig. ...
\subsubsection{Thresholding und Binarisierung}
Die Binarisierung beschreibt den Prozess, ein Graustufenbild in ein Schwarz-Weiß-Bild umzuwandeln. Der dazu notwendige Schwellenwert kann entweder fix definiert oder anhand von verschiedensten Algorithmen ermittelt werden.
Binarisierung hilft bei der Segmentierung und Extraktion von Objekten in einem Bild und sorgt in den Screenshots für einen ausreichenden Kontrast, unabhängig von der Vorder- und Hintergrundfarbe von Textelementen
TODO zeige Vorgehen variante 1 + erklärung algorithmus + zugehörige WER und CER
TODO zeige Vorgehen variante 2 + erklärung algorithmus + zugehörige WER und CER
TODO zeige Vorgehen variante 3 + erklärung algorithmus + zugehörige WER und CER
(
TODO:
BIN
View File
Binary file not shown.