diff --git a/chapters/c20_grundlagen/stand_der_technik.tex b/chapters/c20_grundlagen/stand_der_technik.tex index 14bcb7a..2e29d34 100644 --- a/chapters/c20_grundlagen/stand_der_technik.tex +++ b/chapters/c20_grundlagen/stand_der_technik.tex @@ -3,16 +3,12 @@ \subsection{Texterkennungssysteme} -Optische Texterkennung wird in der Informationstechnik eingesetzt, um Textinhalte aus gedruckten oder digital rasterisierten Medien zu extrahieren. Dieses Verfahren kann für diverse Anwendungsgebiete genutzt werden, wie beispielsweise für Handschrifterkennung oder für das Ablesen von Nummernschildern eines Autos \mcite{asif2014overview}. Auf dem Markt gibt es dafür bereits viele kommerzielle Komplettlösungen wie "IronOCR" \mcite{ironocr_home}, "Google Cloud Vision" \mcite{gcv_home}, "Amazon Textract" \mcite{textract_home} oder "Microsoft Azure Computer Vision" \mcite{azurevision_home}, die oftmals gute Ergebnisse mit geringen Fehlerraten erzielen und sich in bestehende Prozesse oder Anwendungen integrieren lassen \mcite{the_old_bailey_and_ocr, cc_platforms_comparison}. - -[TODO tesseract erweiterung für handschrifterkennung gibt es, wird aber nicht benötigt] - -[TODO gibt es ein aktuelles paper, das den stand der technik ausarbeitet??] +Optische Texterkennung wird in der Informationstechnik eingesetzt, um Textinhalte aus gedruckten oder digital rasterisierten Medien zu extrahieren. Dieses Verfahren kann für diverse Anwendungsgebiete genutzt werden, wie beispielsweise für Handschrifterkennung \mcite{rakshit2010recognition} oder für das Ablesen von Nummernschildern eines Autos \mcite{asif2014overview, anyline_home}. Auf dem Markt gibt es dafür bereits viele kommerzielle Komplettlösungen wie "Anyline" \mcite{anyline_home}, "IronOCR" \mcite{ironocr_home}, "Google Cloud Vision" \mcite{gcv_home}, "Amazon Textract" \mcite{textract_home} oder "Microsoft Azure Computer Vision" \mcite{azurevision_home}, die oftmals gute Ergebnisse mit geringen Fehlerraten erzielen und sich in bestehende Prozesse oder Anwendungen integrieren lassen \mcite{the_old_bailey_and_ocr, cc_platforms_comparison}. Heutige Texterkennungssysteme arbeiten oft mit einer Kombination aus neuralen Netzwerken und fortgeschrittenen Bildverarbeitungsalgorithmen, um Texte zu erkennen. Zahlreiche wissenschaftliche Werke wie beispielseweise \mcite{eikvil1993optical} oder \mcite{islam2017survey} erklären die grundlegende Funktionsweise von optischen Texterkennungswerkzeugen. Die genauen Schritte zur richtigen Vorbereitung der Bilddaten -- besonders in Bezug auf Screenshots -- werden jedoch oftmals nur oberflächlich behandelt. \subsection{Filterung der Ergebnisdaten} -Das Themengebiet des Natural Language Processing beschäftigt sich mit der Interaktion zwischen menschlicher Sprache und Computern. Techniken aus der Informatik, Linguistik und dem maschinellen Lernen werden kombiniert, um mit menschlicher Sprache umzugehen und beispielsweise Textanalyse, Übersetzungen, Spracherkennung oder Dialogsysteme möglich zu machen \mcite{chowdhary2020natural}. Durch die große Aufmerksamkeit und die vielseitige Nutzung der Technologien -- von automatischer Rechtschreibkontrolle bis hin zu digitalen Sprachassistenten -- sowie dem Aufkommen von neuronalen Netzwerken wurden in diesem Forschungsgebiet in den letzten Jahren immer wieder Fortschritte erzielt \mcite{kalyanathaya2019advances, church1995} [TODO neu schreiben weil das ist einfach alles alte technik]. +Das Themengebiet des Natural Language Processing beschäftigt sich mit der Interaktion zwischen menschlicher Sprache und Computern. Techniken aus der Informatik, Linguistik und dem maschinellen Lernen werden kombiniert, um mit menschlicher Sprache umzugehen und beispielsweise Textanalyse, Übersetzungen, Spracherkennung oder Dialogsysteme möglich zu machen \mcite{chowdhary2020natural}. Durch die große Aufmerksamkeit und die vielseitige Nutzung der Technologien -- von automatischer Rechtschreibkontrolle bis hin zu digitalen Sprachassistenten -- sowie dem Aufkommen von neuronalen Netzwerken wurden in diesem Forschungsgebiet immer wieder Fortschritte erzielt \mcite{kalyanathaya2019advances, church1995} Dadurch gibt es zahlreiche wissenschaftliche Ressourcen, die als Grundlage für die Vorgehensweise zur Interpretation und Extraktion relevanter Schlagworte aus den erkannten Freitextdaten dienen. \ No newline at end of file diff --git a/main.pdf b/main.pdf index 95491a5..62afa45 100644 Binary files a/main.pdf and b/main.pdf differ diff --git a/references.bib b/references.bib index f0c8a22..97677c5 100644 --- a/references.bib +++ b/references.bib @@ -117,6 +117,14 @@ date = {2023-05-23}, language = {eng} } +@online{anyline_home, + title = {Anyline - Homepage}, + author = {Anyline GmbH}, + url = {https://anyline.com}, + urldate = {2024-02-12}, + date = {2023-05-23}, + language = {eng} +} @article{islam2017survey, title = {A survey on optical character recognition systems}, author = {Islam, Noman and Islam, Zeeshan and Noor, Nazia}, @@ -352,3 +360,9 @@ year={1982}, publisher={MCB UP Ltd} } +@article{rakshit2010recognition, + title={Recognition of handwritten textual annotations using tesseract open source ocr engine for information just in time (ijit)}, + author={Rakshit, Sandip and Basu, Subhadip and Ikeda, Hisashi}, + journal={arXiv preprint arXiv:1003.5893}, + year={2010} +}