23 lines
540 B
Plaintext
23 lines
540 B
Plaintext
flowchart LR
|
|
OCR["Texterkennung\n(Tesseract)"]
|
|
Pre -->|Bilddaten| OCR
|
|
OCR -->|Schlagworte| Post
|
|
|
|
%% Einlesen --> Pre
|
|
%% Post --> Ausgabe
|
|
|
|
subgraph Pre[Vorverarbeitung]
|
|
direction TB
|
|
Pre1[Skalierung] --> Pre2
|
|
Pre2[Thresholding] --> Pre3
|
|
Pre3[Binarisierung]
|
|
end
|
|
|
|
subgraph Post[Nachbearbeitung]
|
|
direction TB
|
|
Post1[Normalisierung] --> Post2
|
|
Post2[Längenfilterung] --> Post3
|
|
Post3[Duplikatfilterung] --> Post4
|
|
Post4[RegEx-Filterung]
|
|
end
|