more fixes

This commit is contained in:
Simon
2024-02-17 09:08:48 +01:00
parent aa8f6eb8f7
commit 0551aa4ace
3 changed files with 2 additions and 2 deletions
@@ -35,7 +35,7 @@ Da Tesseract auf klare und scharfe Kontraste angewiesen ist, um Text korrekt zu
\label{fig:algorithmen_resampling_vergleich}
\end{figure}
Nach einigen Tests fällt auf, dass Bilder, die mittels des Spline-Verfahrens oder der Hermite-Interpolation skaliert wurden, weiche Konturen ohne harte Farbübergänge aufweisen. Tesseract profitiert jedoch stark von klaren Texten und hohen Kontrasten, weswegen diese Art des Resamplings keine ideale Basis für das Preprocessing bietet. Deswegen wird für die weiteren Schritte die Interpolation nach Lanczos für das Resampling verwendet.
Nach einigen Tests fällt auf, dass Bilder, die mittels des Spline-Verfahrens \mcite{spline} oder der Hermite-Interpolation \mcite{hermite} skaliert wurden, weiche Konturen ohne harte Farbübergänge aufweisen. Tesseract profitiert jedoch stark von klaren Texten und hohen Kontrasten, weswegen diese Art des Resamplings keine ideale Basis für das Preprocessing bietet. Deswegen wird für die weiteren Schritte die Interpolation nach Lanczos \mcite{lanczos} für das Resampling verwendet.
\subsubsection{Rahmen}
\label{algorithmen_rahmen}
@@ -239,7 +239,7 @@ IDisposable
\label{prg:lookup_interface}
\end{program}
\subsubsection{OCR}
\subsubsection{Optische Texterkennung}
Die OCR-Bibliothek beinhaltet elementare Funktionen für die Texterkennung. Sie enthält Funktionen zur Bearbeitung von Bildern mittels Magick.NET inklusive anschließender Verarbeitung mittels Tesseract. Kernkomponenten wie das Texterkennungssystem werden automatisch auf Basis der Eingabeparameter konfiguriert und die Verwendung der Ergebnisdaten in externen Programmteilen wird durch die Zurverfügungstellung von Datenmodellen für die Ergebnisdaten vereinfacht. Außerdem enthält die Bibliothek eine Reihe von vordefinierten Verarbeitungsketten \bzw Prozessoren für die Bild- und Textverarbeitung.
BIN
View File
Binary file not shown.