added postprocessing filter comparison
3
.gitignore
vendored
@@ -1,3 +1,6 @@
|
||||
# Tesseract training data files:
|
||||
*.traineddata
|
||||
|
||||
## Core latex/pdflatex auxiliary files:
|
||||
*.aux
|
||||
*.lof
|
||||
|
||||
@@ -3,30 +3,6 @@
|
||||
|
||||
Da die verarbeiteten Bilddaten \bzw deren extrahierte Textdaten später durch eine Schlagwort-basierte Suchfunktion durch den Nutzer auffindbar sein müssen, müssen die Ergebnisdaten im Rahmen des Postprocessings weiterverarbeitet werden. Ziel ist es, die Redundanz innerhalb des Datensets zu reduzieren. Ebenso sollen falsch erkannte Ergebnisdaten identifiziert und aus der Schlagwortmenge entfernt werden.
|
||||
|
||||
\subsubsection{Normalisierung}
|
||||
\label{algorithmen_normalisierung}
|
||||
|
||||
Um die aus der Texterkennung gewonnenen Daten zunächst für die weitere Filterung vorzubereiten, ist es sinnvoll, die Redundanz der Daten möglichst zu reduzieren und die einzelnen Wörter zu normalisieren \bzw zu standardisieren. Beispielsweise kann durch das Umwandeln aller Textdaten in Kleinbuchstaben die Variation der Daten eingeschränkt werden, ohne jedoch für die Suche relevante Information zu verlieren.
|
||||
|
||||
\begin{figure}[ht]
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{include/screenshots/command-processing_screentypes_controlgroup_005.png}}
|
||||
\end{minipage}
|
||||
\hspace{0.1\textwidth}
|
||||
\begin{minipage}{0.4\textwidth}
|
||||
\fbox{\includegraphics[width=\textwidth]{\detokenize{include/results/ThresholdProcessor(40\%).00.command-processing_screentypes_controlgroup_005.png}}}
|
||||
\end{minipage}
|
||||
\caption{Anwendung des Filters auf einen Beispielscreenshot.}
|
||||
% TODO Beispielhafter Vergleich der Daten vor bzw. nach Anwendung des Filters
|
||||
\label{algorithmen_normalisierung_vergleich}
|
||||
\end{figure}
|
||||
|
||||
\subsubsection{Vermeidung von Duplikaten}
|
||||
\label{algorithmen_duplikate}
|
||||
|
||||
Nach der Normalisierung werden Duplikate innerhalb der erkannten Textdaten entfernt. Dies verringert ebenfalls die Redundanz der Textdaten und steigert die Effizienz der nachfolgenden Filterverfahren.
|
||||
|
||||
% TODO Beispielhafter Vergleich der Daten vor bzw. nach Anwendung des Filters
|
||||
|
||||
\subsubsection{Filterung anhand der Genauigkeit}
|
||||
\label{algorithmen_confidence}
|
||||
@@ -35,7 +11,54 @@ Tesseract stellt im Rahmen der Texterkennung auch immer Metadaten zu den erkannt
|
||||
|
||||
Der Confidence-Filter prüft die jeweiligen Wörter auf ihre Metadaten und verwirft Wörter, deren Confidence unter einem fixen Schwellenwert liegt. Je nach Einstellung \bzw "Härte" des Filters wird die Anzahl der falsch erkannten Inhalte innerhalb der Schlagwortmenge drastisch reduziert. Ist der Filter zu streng eingestellt, werden jedoch insgesamt weniger Worte in die Ergebnisse mit aufgenommen und es kann vorkommen, dass auch ursprünglich korrekt erkannte Wörter aufgrund eines niedrigen Confidence-Wertes verworfen werden.
|
||||
|
||||
% TODO Beispielhafter Vergleich der Daten vor bzw. nach Anwendung des Filters
|
||||
\begin{figure}[ht]
|
||||
\centering
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\lstinputlisting[firstnumber=2,linerange={2-14}]{include/postprocessing/source.detailed.json}
|
||||
\end{minipage}
|
||||
\hfill
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\lstinputlisting[firstnumber=2,linerange={2-14}]{include/postprocessing/confidence.detailed.json}
|
||||
\end{minipage}
|
||||
\caption{Auszug aus den Ergebnisdaten der Texterkennung aus \ref{fig:screenshot_postprocessing} nach der Confidence-Filterung. Alle Wörter unter dem Schwellenwert werer entfernt.}
|
||||
\label{fig:screenshot_postprocessing_confidence}
|
||||
\end{figure}
|
||||
|
||||
\subsubsection{Normalisierung}
|
||||
\label{algorithmen_normalisierung}
|
||||
|
||||
Um die aus der Texterkennung gewonnenen Daten zunächst für die weitere Filterung vorzubereiten, ist es sinnvoll, die Redundanz der Daten möglichst zu reduzieren und die einzelnen Wörter zu normalisieren \bzw zu standardisieren. Beispielsweise kann durch das Umwandeln aller Textdaten in Kleinbuchstaben die Variation der Daten eingeschränkt werden, ohne jedoch für die Suche relevante Information zu verlieren.
|
||||
|
||||
\begin{figure}[ht]
|
||||
\centering
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\lstinputlisting[firstnumber=2,linerange={2-14}]{include/postprocessing/confidence.json}
|
||||
\end{minipage}
|
||||
\hfill
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\lstinputlisting[firstnumber=2,linerange={2-14}]{include/postprocessing/normalize.json}
|
||||
\end{minipage}
|
||||
\caption{Auszug aus den Ergebnisdaten der Texterkennung aus \ref{fig:screenshot_postprocessing} nach der Normalisierung. Alle Wörter beinhalten nun ausschließlich Kleinbuchstaben.}
|
||||
\label{fig:screenshot_postprocessing_normalisierung}
|
||||
\end{figure}
|
||||
|
||||
\subsubsection{Vermeidung von Duplikaten}
|
||||
\label{algorithmen_duplikate}
|
||||
|
||||
Nach der Normalisierung werden Duplikate innerhalb der erkannten Textdaten entfernt. Dies verringert ebenfalls die Redundanz der Textdaten und steigert die Effizienz der nachfolgenden Filterverfahren.
|
||||
|
||||
\begin{figure}[ht]
|
||||
\centering
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\lstinputlisting[firstnumber=2,linerange={2-14}]{include/postprocessing/normalize.json}
|
||||
\end{minipage}
|
||||
\hfill
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\lstinputlisting[firstnumber=2,linerange={2-14}]{include/postprocessing/duplicates.json}
|
||||
\end{minipage}
|
||||
\caption{Auszug aus den Ergebnisdaten der Texterkennung aus \ref{fig:screenshot_postprocessing} nach der Duplikatentfernung.}
|
||||
\label{fig:screenshot_postprocessing_duplikate}
|
||||
\end{figure}
|
||||
|
||||
\subsubsection{Filterung anhand der Wortlänge}
|
||||
\label{algorithmen_wortlänge}
|
||||
@@ -44,11 +67,33 @@ Verarbeitet das Texterkennungssystem Texte mit unregelmäßigen Abständen oder
|
||||
|
||||
Zusätzlich kann dieser Filter an die Anforderung des Zielsystems angepasst werden. So sind beispielsweise Wörter, die weniger als zwei Zeichen beinhalten, für die Schlagwortsuche grundsätzlich nicht relevant.
|
||||
|
||||
% TODO Beispielhafter Vergleich der Daten vor bzw. nach Anwendung des Filters
|
||||
\begin{figure}[ht]
|
||||
\centering
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\lstinputlisting[firstnumber=2,linerange={2-14}]{include/postprocessing/normalize.json}
|
||||
\end{minipage}
|
||||
\hfill
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\lstinputlisting[firstnumber=2,linerange={2-14}]{include/postprocessing/duplicates.json}
|
||||
\end{minipage}
|
||||
\caption{Auszug aus den Ergebnisdaten der Texterkennung aus \ref{fig:screenshot_postprocessing} nach der Wortlängenfilterung. Alle Wörter, die kürzer sind als der Schwellenwert, werden aus den Ergebnisdaten entfernt.}
|
||||
\label{fig:screenshot_postprocessing_wortlänge}
|
||||
\end{figure}
|
||||
|
||||
\subsubsection{Sprachabhängige Filterung mittels Regular Expressions}
|
||||
\label{algorithmen_regex}
|
||||
|
||||
Nachdem die zu filternden Textdaten durch vorherige Schritte weitestgehend vorverarbeitet wurden, werden die Ergebnisdaten ein letztes Mal mithilfe von regulären Ausdrücken (\engl{Regular Expressions}) durchsucht. Aufgrund der guten Erweiterbarkeit der Regular Expressions ist es einfach, für jede Sprache einen individuellen Filter anzulegen, der den jeweiligen Zeichensatz beschriftet und unbekannte Sonderzeichen oder Symbole entfernt. So sind beispielsweise im Deutschen Umlaute erlaubt, während häufig auftretende, jedoch unerwünschte Symbole wie das phonetische Zeichen "æ" explizit entfernt werden können.
|
||||
Nachdem die zu filternden Textdaten durch vorherige Schritte weitestgehend vorverarbeitet wurden, werden die Ergebnisdaten ein letztes Mal mithilfe von regulären Ausdrücken (\engl{Regular Expressions}) durchsucht. Aufgrund der guten Erweiterbarkeit der Regular Expressions ist es einfach, für jede Sprache einen individuellen Filter anzulegen, der den jeweiligen Zeichensatz beschriftet und unbekannte Sonderzeichen oder Symbole entfernt. So sind beispielsweise im Deutschen Umlaute erlaubt, während häufig auftretende, jedoch unerwünschte Symbole wie das phonetische Zeichen "æ" oder mehrere hintereinandergereihte Leerzeichen explizit entfernt werden können.
|
||||
|
||||
% TODO Beispielhafter Vergleich der Daten vor bzw. nach Anwendung des Filters
|
||||
\begin{figure}[ht]
|
||||
\centering
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\lstinputlisting[firstnumber=2,linerange={2-14}]{include/postprocessing/duplicates.json}
|
||||
\end{minipage}
|
||||
\hfill
|
||||
\begin{minipage}{0.49\textwidth}
|
||||
\lstinputlisting[firstnumber=2,linerange={2-14}]{include/postprocessing/regex.json}
|
||||
\end{minipage}
|
||||
\caption{Auszug aus den Ergebnisdaten der Texterkennung aus \ref{fig:screenshot_postprocessing} nach der Filterung mit Regular Expressions. Findet der sprachabhängige Filter keine Treffer, wird das Wort aus den Ergebnisdaten entfernt.}
|
||||
\label{fig:screenshot_postprocessing_regex}
|
||||
\end{figure}
|
||||
@@ -54,21 +54,19 @@ Für die Verwendung von Tesseract ist es wichtig, unabhängig von der Diversitä
|
||||
|
||||
Bei der Texterkennung kommt es manchmal vor, dass grafische Elemente als Unicode-Symbole erkannt werden. Beispielsweise finden sich in den ungefilterten Ergebnisdaten oft Aufzählungszeichen "•" oder diverse Varianten von Bindestrichen "‒". Diese Zeichen sind gemäß Anwendungsanforderungen nicht relevant für die Schlagwortsuche und können somit entfernt \bzw ignoriert werden.
|
||||
|
||||
|
||||
\begin{figure}[ht]
|
||||
\begin{figure}[t]
|
||||
\centering
|
||||
\begin{minipage}{0.45\textwidth}
|
||||
\includegraphics[width=0.90\textwidth]{include/postprocessing/source.png}
|
||||
\end{minipage}
|
||||
\hfill
|
||||
\begin{minipage}{0.5\textwidth}
|
||||
\lstinputlisting[numbers=none]{include/postprocessing/source.json}
|
||||
\lstinputlisting[firstnumber=100,linerange={100-110}]{include/postprocessing/source.json}
|
||||
\end{minipage}
|
||||
\caption{Ungefilterte Liste von Ergebnisdaten bei Durchführung der Texterkennung in dem gezeigten Screenshot.}
|
||||
\caption{Auszug aus den ungefilterten Ergebnisdaten bei Durchführung der Texterkennung in dem gezeigten Screenshot.}
|
||||
\label{fig:screenshot_postprocessing}
|
||||
\end{figure}
|
||||
|
||||
|
||||
\subsubsection*{Mehrsprachigkeit}
|
||||
\label{annahmen_mehrsprachigkeit}
|
||||
|
||||
|
||||
398
include/postprocessing/confidence.detailed.json
Normal file
@@ -0,0 +1,398 @@
|
||||
[
|
||||
{
|
||||
"Text": "#:",
|
||||
"Confidence": 68.34635162353516
|
||||
},
|
||||
{
|
||||
"Text": "Variablendefinition",
|
||||
"Confidence": 91.65243530273438
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "Selektieren",
|
||||
"Confidence": 83.6968002319336
|
||||
},
|
||||
{
|
||||
"Text": "Sie",
|
||||
"Confidence": 96.80667877197266
|
||||
},
|
||||
{
|
||||
"Text": "das",
|
||||
"Confidence": 96.24165344238281
|
||||
},
|
||||
{
|
||||
"Text": "gewünschte",
|
||||
"Confidence": 96.33263397216797
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "ARCHIVE",
|
||||
"Confidence": 60.15034484863281
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 81.05281829833984
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 82.37826538085938
|
||||
},
|
||||
{
|
||||
"Text": "Bit",
|
||||
"Confidence": 96.97675323486328
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 83.05537414550781
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 90.97981262207031
|
||||
},
|
||||
{
|
||||
"Text": "Byte",
|
||||
"Confidence": 96.5757064819336
|
||||
},
|
||||
{
|
||||
"Text": "=",
|
||||
"Confidence": 57.80772399902344
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 74.51982116699219
|
||||
},
|
||||
{
|
||||
"Text": "Wort",
|
||||
"Confidence": 96.70946502685547
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": ";",
|
||||
"Confidence": 56.6358528137207
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 81.35908508300781
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 91.09779357910156
|
||||
},
|
||||
{
|
||||
"Text": "Doppelwort",
|
||||
"Confidence": 92.14013671875
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 78.05906677246094
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 91.90501403808594
|
||||
},
|
||||
{
|
||||
"Text": "Float",
|
||||
"Confidence": 96.87384033203125
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 85.72283935546875
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 87.7765121459961
|
||||
},
|
||||
{
|
||||
"Text": "String",
|
||||
"Confidence": 89.45089721679688
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "EN",
|
||||
"Confidence": 50.80462646484375
|
||||
},
|
||||
{
|
||||
"Text": "#:",
|
||||
"Confidence": 71.1268310546875
|
||||
},
|
||||
{
|
||||
"Text": "Variablendefinition",
|
||||
"Confidence": 91.83008575439453
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "Selektieren",
|
||||
"Confidence": 81.43798828125
|
||||
},
|
||||
{
|
||||
"Text": "Sie",
|
||||
"Confidence": 96.08175659179688
|
||||
},
|
||||
{
|
||||
"Text": "das",
|
||||
"Confidence": 95.81234741210938
|
||||
},
|
||||
{
|
||||
"Text": "gewünschte",
|
||||
"Confidence": 96.25562286376953
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "ARCHIVE",
|
||||
"Confidence": 60.15034484863281
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 78.20631408691406
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 89.17095184326172
|
||||
},
|
||||
{
|
||||
"Text": "Bit",
|
||||
"Confidence": 96.98982238769531
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 78.91883850097656
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 90.46824645996094
|
||||
},
|
||||
{
|
||||
"Text": "Byte",
|
||||
"Confidence": 96.63468933105469
|
||||
},
|
||||
{
|
||||
"Text": "=",
|
||||
"Confidence": 53.838905334472656
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 67.3315658569336
|
||||
},
|
||||
{
|
||||
"Text": "Wort",
|
||||
"Confidence": 96.75098419189453
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 81.84134674072266
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 91.8224868774414
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 78.66800689697266
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 85.53489685058594
|
||||
},
|
||||
{
|
||||
"Text": "Float",
|
||||
"Confidence": 96.89924621582031
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 83.45639038085938
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 89.75724029541016
|
||||
},
|
||||
{
|
||||
"Text": "String",
|
||||
"Confidence": 95.70439910888672
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
}
|
||||
]
|
||||
@@ -0,0 +1,101 @@
|
||||
[
|
||||
"#:",
|
||||
"Variablendefinition",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"Selektieren",
|
||||
"Sie",
|
||||
"das",
|
||||
"gewünschte",
|
||||
" ",
|
||||
"ARCHIVE",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"Bit",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"Byte",
|
||||
"=",
|
||||
"Treibervariable",
|
||||
"Wort",
|
||||
" ",
|
||||
" ",
|
||||
";",
|
||||
" ",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"Doppelwort",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"Float",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"String",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"EN",
|
||||
"#:",
|
||||
"Variablendefinition",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"Selektieren",
|
||||
"Sie",
|
||||
"das",
|
||||
"gewünschte",
|
||||
" ",
|
||||
"ARCHIVE",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"Bit",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"Byte",
|
||||
"=",
|
||||
"Treibervariable",
|
||||
"Wort",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"Float",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"String",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" "
|
||||
]
|
||||
90
include/postprocessing/duplicates.detailed.json
Normal file
@@ -0,0 +1,90 @@
|
||||
[
|
||||
{
|
||||
"Text": "bit",
|
||||
"Confidence": 96.98982238769531
|
||||
},
|
||||
{
|
||||
"Text": "float",
|
||||
"Confidence": 96.89924621582031
|
||||
},
|
||||
{
|
||||
"Text": "sie",
|
||||
"Confidence": 96.80667877197266
|
||||
},
|
||||
{
|
||||
"Text": "wort",
|
||||
"Confidence": 96.75098419189453
|
||||
},
|
||||
{
|
||||
"Text": "byte",
|
||||
"Confidence": 96.63468933105469
|
||||
},
|
||||
{
|
||||
"Text": "gewünschte",
|
||||
"Confidence": 96.33263397216797
|
||||
},
|
||||
{
|
||||
"Text": "das",
|
||||
"Confidence": 96.24165344238281
|
||||
},
|
||||
{
|
||||
"Text": "string",
|
||||
"Confidence": 95.70439910888672
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "doppelwort",
|
||||
"Confidence": 92.14013671875
|
||||
},
|
||||
{
|
||||
"Text": "treibervariable",
|
||||
"Confidence": 91.90501403808594
|
||||
},
|
||||
{
|
||||
"Text": "variablendefinition",
|
||||
"Confidence": 91.83008575439453
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 85.72283935546875
|
||||
},
|
||||
{
|
||||
"Text": "selektieren",
|
||||
"Confidence": 83.6968002319336
|
||||
},
|
||||
{
|
||||
"Text": "#:",
|
||||
"Confidence": 71.1268310546875
|
||||
},
|
||||
{
|
||||
"Text": "archive",
|
||||
"Confidence": 60.15034484863281
|
||||
},
|
||||
{
|
||||
"Text": "=",
|
||||
"Confidence": 57.80772399902344
|
||||
},
|
||||
{
|
||||
"Text": ";",
|
||||
"Confidence": 56.6358528137207
|
||||
},
|
||||
{
|
||||
"Text": "en",
|
||||
"Confidence": 50.80462646484375
|
||||
}
|
||||
]
|
||||
24
include/postprocessing/duplicates.json
Normal file
@@ -0,0 +1,24 @@
|
||||
[
|
||||
"bit",
|
||||
"float",
|
||||
"sie",
|
||||
"wort",
|
||||
"byte",
|
||||
"gewünschte",
|
||||
"das",
|
||||
"string",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"doppelwort",
|
||||
"treibervariable",
|
||||
"variablendefinition",
|
||||
"+",
|
||||
"selektieren",
|
||||
"#:",
|
||||
"archive",
|
||||
"=",
|
||||
";",
|
||||
"en"
|
||||
]
|
||||
398
include/postprocessing/normalize.detailed.json
Normal file
@@ -0,0 +1,398 @@
|
||||
[
|
||||
{
|
||||
"Text": "#:",
|
||||
"Confidence": 68.34635162353516
|
||||
},
|
||||
{
|
||||
"Text": "variablendefinition",
|
||||
"Confidence": 91.65243530273438
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "selektieren",
|
||||
"Confidence": 83.6968002319336
|
||||
},
|
||||
{
|
||||
"Text": "sie",
|
||||
"Confidence": 96.80667877197266
|
||||
},
|
||||
{
|
||||
"Text": "das",
|
||||
"Confidence": 96.24165344238281
|
||||
},
|
||||
{
|
||||
"Text": "gewünschte",
|
||||
"Confidence": 96.33263397216797
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "archive",
|
||||
"Confidence": 60.15034484863281
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 81.05281829833984
|
||||
},
|
||||
{
|
||||
"Text": "treibervariable",
|
||||
"Confidence": 82.37826538085938
|
||||
},
|
||||
{
|
||||
"Text": "bit",
|
||||
"Confidence": 96.97675323486328
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 83.05537414550781
|
||||
},
|
||||
{
|
||||
"Text": "treibervariable",
|
||||
"Confidence": 90.97981262207031
|
||||
},
|
||||
{
|
||||
"Text": "byte",
|
||||
"Confidence": 96.5757064819336
|
||||
},
|
||||
{
|
||||
"Text": "=",
|
||||
"Confidence": 57.80772399902344
|
||||
},
|
||||
{
|
||||
"Text": "treibervariable",
|
||||
"Confidence": 74.51982116699219
|
||||
},
|
||||
{
|
||||
"Text": "wort",
|
||||
"Confidence": 96.70946502685547
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": ";",
|
||||
"Confidence": 56.6358528137207
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 81.35908508300781
|
||||
},
|
||||
{
|
||||
"Text": "treibervariable",
|
||||
"Confidence": 91.09779357910156
|
||||
},
|
||||
{
|
||||
"Text": "doppelwort",
|
||||
"Confidence": 92.14013671875
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 78.05906677246094
|
||||
},
|
||||
{
|
||||
"Text": "treibervariable",
|
||||
"Confidence": 91.90501403808594
|
||||
},
|
||||
{
|
||||
"Text": "float",
|
||||
"Confidence": 96.87384033203125
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 85.72283935546875
|
||||
},
|
||||
{
|
||||
"Text": "treibervariable",
|
||||
"Confidence": 87.7765121459961
|
||||
},
|
||||
{
|
||||
"Text": "string",
|
||||
"Confidence": 89.45089721679688
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "en",
|
||||
"Confidence": 50.80462646484375
|
||||
},
|
||||
{
|
||||
"Text": "#:",
|
||||
"Confidence": 71.1268310546875
|
||||
},
|
||||
{
|
||||
"Text": "variablendefinition",
|
||||
"Confidence": 91.83008575439453
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "selektieren",
|
||||
"Confidence": 81.43798828125
|
||||
},
|
||||
{
|
||||
"Text": "sie",
|
||||
"Confidence": 96.08175659179688
|
||||
},
|
||||
{
|
||||
"Text": "das",
|
||||
"Confidence": 95.81234741210938
|
||||
},
|
||||
{
|
||||
"Text": "gewünschte",
|
||||
"Confidence": 96.25562286376953
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "archive",
|
||||
"Confidence": 60.15034484863281
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 78.20631408691406
|
||||
},
|
||||
{
|
||||
"Text": "treibervariable",
|
||||
"Confidence": 89.17095184326172
|
||||
},
|
||||
{
|
||||
"Text": "bit",
|
||||
"Confidence": 96.98982238769531
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 78.91883850097656
|
||||
},
|
||||
{
|
||||
"Text": "treibervariable",
|
||||
"Confidence": 90.46824645996094
|
||||
},
|
||||
{
|
||||
"Text": "byte",
|
||||
"Confidence": 96.63468933105469
|
||||
},
|
||||
{
|
||||
"Text": "=",
|
||||
"Confidence": 53.838905334472656
|
||||
},
|
||||
{
|
||||
"Text": "treibervariable",
|
||||
"Confidence": 67.3315658569336
|
||||
},
|
||||
{
|
||||
"Text": "wort",
|
||||
"Confidence": 96.75098419189453
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 81.84134674072266
|
||||
},
|
||||
{
|
||||
"Text": "treibervariable",
|
||||
"Confidence": 91.8224868774414
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 78.66800689697266
|
||||
},
|
||||
{
|
||||
"Text": "treibervariable",
|
||||
"Confidence": 85.53489685058594
|
||||
},
|
||||
{
|
||||
"Text": "float",
|
||||
"Confidence": 96.89924621582031
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 83.45639038085938
|
||||
},
|
||||
{
|
||||
"Text": "treibervariable",
|
||||
"Confidence": 89.75724029541016
|
||||
},
|
||||
{
|
||||
"Text": "string",
|
||||
"Confidence": 95.70439910888672
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
}
|
||||
]
|
||||
101
include/postprocessing/normalize.json
Normal file
@@ -0,0 +1,101 @@
|
||||
[
|
||||
"#:",
|
||||
"variablendefinition",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"selektieren",
|
||||
"sie",
|
||||
"das",
|
||||
"gewünschte",
|
||||
" ",
|
||||
"archive",
|
||||
"+",
|
||||
"treibervariable",
|
||||
"bit",
|
||||
"+",
|
||||
"treibervariable",
|
||||
"byte",
|
||||
"=",
|
||||
"treibervariable",
|
||||
"wort",
|
||||
" ",
|
||||
" ",
|
||||
";",
|
||||
" ",
|
||||
"+",
|
||||
"treibervariable",
|
||||
"doppelwort",
|
||||
"+",
|
||||
"treibervariable",
|
||||
"float",
|
||||
"+",
|
||||
"treibervariable",
|
||||
"string",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"en",
|
||||
"#:",
|
||||
"variablendefinition",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"selektieren",
|
||||
"sie",
|
||||
"das",
|
||||
"gewünschte",
|
||||
" ",
|
||||
"archive",
|
||||
"+",
|
||||
"treibervariable",
|
||||
"bit",
|
||||
"+",
|
||||
"treibervariable",
|
||||
"byte",
|
||||
"=",
|
||||
"treibervariable",
|
||||
"wort",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"+",
|
||||
"treibervariable",
|
||||
"+",
|
||||
"treibervariable",
|
||||
"float",
|
||||
"+",
|
||||
"treibervariable",
|
||||
"string",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" "
|
||||
]
|
||||
58
include/postprocessing/regex.detailed.json
Normal file
@@ -0,0 +1,58 @@
|
||||
[
|
||||
{
|
||||
"Text": "bit",
|
||||
"Confidence": 96.98982238769531
|
||||
},
|
||||
{
|
||||
"Text": "float",
|
||||
"Confidence": 96.89924621582031
|
||||
},
|
||||
{
|
||||
"Text": "sie",
|
||||
"Confidence": 96.80667877197266
|
||||
},
|
||||
{
|
||||
"Text": "wort",
|
||||
"Confidence": 96.75098419189453
|
||||
},
|
||||
{
|
||||
"Text": "byte",
|
||||
"Confidence": 96.63468933105469
|
||||
},
|
||||
{
|
||||
"Text": "gewünschte",
|
||||
"Confidence": 96.33263397216797
|
||||
},
|
||||
{
|
||||
"Text": "das",
|
||||
"Confidence": 96.24165344238281
|
||||
},
|
||||
{
|
||||
"Text": "string",
|
||||
"Confidence": 95.70439910888672
|
||||
},
|
||||
{
|
||||
"Text": "doppelwort",
|
||||
"Confidence": 92.14013671875
|
||||
},
|
||||
{
|
||||
"Text": "treibervariable",
|
||||
"Confidence": 91.90501403808594
|
||||
},
|
||||
{
|
||||
"Text": "variablendefinition",
|
||||
"Confidence": 91.83008575439453
|
||||
},
|
||||
{
|
||||
"Text": "selektieren",
|
||||
"Confidence": 83.6968002319336
|
||||
},
|
||||
{
|
||||
"Text": "archive",
|
||||
"Confidence": 60.15034484863281
|
||||
},
|
||||
{
|
||||
"Text": "en",
|
||||
"Confidence": 50.80462646484375
|
||||
}
|
||||
]
|
||||
@@ -0,0 +1,16 @@
|
||||
[
|
||||
"bit",
|
||||
"float",
|
||||
"sie",
|
||||
"wort",
|
||||
"byte",
|
||||
"gewünschte",
|
||||
"das",
|
||||
"string",
|
||||
"doppelwort",
|
||||
"treibervariable",
|
||||
"variablendefinition",
|
||||
"selektieren",
|
||||
"archive",
|
||||
"en"
|
||||
]
|
||||
502
include/postprocessing/source.detailed.json
Normal file
@@ -0,0 +1,502 @@
|
||||
[
|
||||
{
|
||||
"Text": "#:",
|
||||
"Confidence": 68.34635162353516
|
||||
},
|
||||
{
|
||||
"Text": "Variablendefinition",
|
||||
"Confidence": 91.65243530273438
|
||||
},
|
||||
{
|
||||
"Text": "BaER",
|
||||
"Confidence": 0
|
||||
},
|
||||
{
|
||||
"Text": "23",
|
||||
"Confidence": 12.867263793945312
|
||||
},
|
||||
{
|
||||
"Text": "2e84",
|
||||
"Confidence": 0
|
||||
},
|
||||
{
|
||||
"Text": "Seen",
|
||||
"Confidence": 2.7577896118164062
|
||||
},
|
||||
{
|
||||
"Text": "Ss",
|
||||
"Confidence": 0
|
||||
},
|
||||
{
|
||||
"Text": "PEER",
|
||||
"Confidence": 0
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "Selektieren",
|
||||
"Confidence": 83.6968002319336
|
||||
},
|
||||
{
|
||||
"Text": "Sie",
|
||||
"Confidence": 96.80667877197266
|
||||
},
|
||||
{
|
||||
"Text": "das",
|
||||
"Confidence": 96.24165344238281
|
||||
},
|
||||
{
|
||||
"Text": "gewünschte",
|
||||
"Confidence": 96.33263397216797
|
||||
},
|
||||
{
|
||||
"Text": "u",
|
||||
"Confidence": 10.228431701660156
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "‚+",
|
||||
"Confidence": 44.04110336303711
|
||||
},
|
||||
{
|
||||
"Text": "ARCHIVE",
|
||||
"Confidence": 60.15034484863281
|
||||
},
|
||||
{
|
||||
"Text": "tloat",
|
||||
"Confidence": 41.49772644042969
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 81.05281829833984
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 82.37826538085938
|
||||
},
|
||||
{
|
||||
"Text": "Bit",
|
||||
"Confidence": 96.97675323486328
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 83.05537414550781
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 90.97981262207031
|
||||
},
|
||||
{
|
||||
"Text": "Byte",
|
||||
"Confidence": 96.5757064819336
|
||||
},
|
||||
{
|
||||
"Text": "=",
|
||||
"Confidence": 57.80772399902344
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 74.51982116699219
|
||||
},
|
||||
{
|
||||
"Text": "Wort",
|
||||
"Confidence": 96.70946502685547
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": ";",
|
||||
"Confidence": 56.6358528137207
|
||||
},
|
||||
{
|
||||
"Text": "Konfiguration",
|
||||
"Confidence": 23.706192016601562
|
||||
},
|
||||
{
|
||||
"Text": "u",
|
||||
"Confidence": 7.046722412109375
|
||||
},
|
||||
{
|
||||
"Text": "—",
|
||||
"Confidence": 11.201736450195312
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 81.35908508300781
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 91.09779357910156
|
||||
},
|
||||
{
|
||||
"Text": "Doppelwort",
|
||||
"Confidence": 92.14013671875
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 78.05906677246094
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 91.90501403808594
|
||||
},
|
||||
{
|
||||
"Text": "Float",
|
||||
"Confidence": 96.87384033203125
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 85.72283935546875
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 87.7765121459961
|
||||
},
|
||||
{
|
||||
"Text": "String",
|
||||
"Confidence": 89.45089721679688
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "EN",
|
||||
"Confidence": 50.80462646484375
|
||||
},
|
||||
{
|
||||
"Text": "#:",
|
||||
"Confidence": 71.1268310546875
|
||||
},
|
||||
{
|
||||
"Text": "Variablendefinition",
|
||||
"Confidence": 91.83008575439453
|
||||
},
|
||||
{
|
||||
"Text": "Bae",
|
||||
"Confidence": 0
|
||||
},
|
||||
{
|
||||
"Text": "232e84",
|
||||
"Confidence": 0
|
||||
},
|
||||
{
|
||||
"Text": "Seen",
|
||||
"Confidence": 11.252548217773438
|
||||
},
|
||||
{
|
||||
"Text": "Ss",
|
||||
"Confidence": 35.66864013671875
|
||||
},
|
||||
{
|
||||
"Text": "Pe",
|
||||
"Confidence": 6.1341094970703125
|
||||
},
|
||||
{
|
||||
"Text": "BEe",
|
||||
"Confidence": 0
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "Selektieren",
|
||||
"Confidence": 81.43798828125
|
||||
},
|
||||
{
|
||||
"Text": "Sie",
|
||||
"Confidence": 96.08175659179688
|
||||
},
|
||||
{
|
||||
"Text": "das",
|
||||
"Confidence": 95.81234741210938
|
||||
},
|
||||
{
|
||||
"Text": "gewünschte",
|
||||
"Confidence": 96.25562286376953
|
||||
},
|
||||
{
|
||||
"Text": "u",
|
||||
"Confidence": 8.860099792480469
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "‚+",
|
||||
"Confidence": 44.04110336303711
|
||||
},
|
||||
{
|
||||
"Text": "ARCHIVE",
|
||||
"Confidence": 60.15034484863281
|
||||
},
|
||||
{
|
||||
"Text": "tloat",
|
||||
"Confidence": 41.49772644042969
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 78.20631408691406
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 89.17095184326172
|
||||
},
|
||||
{
|
||||
"Text": "Bit",
|
||||
"Confidence": 96.98982238769531
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 78.91883850097656
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 90.46824645996094
|
||||
},
|
||||
{
|
||||
"Text": "Byte",
|
||||
"Confidence": 96.63468933105469
|
||||
},
|
||||
{
|
||||
"Text": "=",
|
||||
"Confidence": 53.838905334472656
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 67.3315658569336
|
||||
},
|
||||
{
|
||||
"Text": "Wort",
|
||||
"Confidence": 96.75098419189453
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "ick",
|
||||
"Confidence": 33.786651611328125
|
||||
},
|
||||
{
|
||||
"Text": "_____",
|
||||
"Confidence": 22.93297576904297
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 81.84134674072266
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 91.8224868774414
|
||||
},
|
||||
{
|
||||
"Text": "D",
|
||||
"Confidence": 35.459503173828125
|
||||
},
|
||||
{
|
||||
"Text": "oppelwort",
|
||||
"Confidence": 35.459503173828125
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 78.66800689697266
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 85.53489685058594
|
||||
},
|
||||
{
|
||||
"Text": "Float",
|
||||
"Confidence": 96.89924621582031
|
||||
},
|
||||
{
|
||||
"Text": "+",
|
||||
"Confidence": 83.45639038085938
|
||||
},
|
||||
{
|
||||
"Text": "Treibervariable",
|
||||
"Confidence": 89.75724029541016
|
||||
},
|
||||
{
|
||||
"Text": "String",
|
||||
"Confidence": 95.70439910888672
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": " ",
|
||||
"Confidence": 95
|
||||
},
|
||||
{
|
||||
"Text": "EN",
|
||||
"Confidence": 46.050514221191406
|
||||
}
|
||||
]
|
||||
@@ -1 +1,127 @@
|
||||
[ "a", "elektieren", "Sie", "das", "gewünschte", "Objekt:", ":", "Konfiguration", "|+ARCHIVE", "float", "+", "Treibervariable", "Bit", "+", "Treibervariable", "Byte", "=", "Treibervariable", "Wort", "+", "Treibervariable", "Doppelwort", "+", "Treibervariable", "Float", "+", "Treibervariable", "String", " ", " ", " ", " ", " ", "u", "elektieren", "Sie", "das", "gewlinschte", "Objekt:", ":", "Konfiguration", "©", "|", "+", "ARCHIVE", "float", "+", "Treibervariable", "Bit", "+", "Treibervariable", "Byte", "=", "Treibervariable", "Wort", "+", "Treibervariable", "Doppelwort", "+", "Treibervatiable", "Float", "+", "Treibervariable", "String", " ", " ", " ", " ", " " ]
|
||||
[
|
||||
"#:",
|
||||
"Variablendefinition",
|
||||
"BaER",
|
||||
"23",
|
||||
"2e84",
|
||||
"Seen",
|
||||
"Ss",
|
||||
"PEER",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"Selektieren",
|
||||
"Sie",
|
||||
"das",
|
||||
"gewünschte",
|
||||
"u",
|
||||
" ",
|
||||
"‚+",
|
||||
"ARCHIVE",
|
||||
"tloat",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"Bit",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"Byte",
|
||||
"=",
|
||||
"Treibervariable",
|
||||
"Wort",
|
||||
" ",
|
||||
" ",
|
||||
";",
|
||||
"Konfiguration",
|
||||
"u",
|
||||
"—",
|
||||
" ",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"Doppelwort",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"Float",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"String",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"EN",
|
||||
"#:",
|
||||
"Variablendefinition",
|
||||
"Bae",
|
||||
"232e84",
|
||||
"Seen",
|
||||
"Ss",
|
||||
"Pe",
|
||||
"BEe",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"Selektieren",
|
||||
"Sie",
|
||||
"das",
|
||||
"gewünschte",
|
||||
"u",
|
||||
" ",
|
||||
"‚+",
|
||||
"ARCHIVE",
|
||||
"tloat",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"Bit",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"Byte",
|
||||
"=",
|
||||
"Treibervariable",
|
||||
"Wort",
|
||||
" ",
|
||||
" ",
|
||||
"ick",
|
||||
"_____",
|
||||
" ",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"D",
|
||||
"oppelwort",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"Float",
|
||||
"+",
|
||||
"Treibervariable",
|
||||
"String",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"EN"
|
||||
]
|
||||
127
include/postprocessing/source.words.json
Normal file
@@ -0,0 +1,127 @@
|
||||
[
|
||||
"#:",
|
||||
"Variablendefinition",
|
||||
"BaER",
|
||||
"23",
|
||||
"2e84",
|
||||
"Seen",
|
||||
"Ss",
|
||||
"PEER",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"Selektieren",
|
||||
"Sie",
|
||||
"das",
|
||||
"gew\u00FCnschte",
|
||||
"u",
|
||||
" ",
|
||||
"\u201A\u002B",
|
||||
"ARCHIVE",
|
||||
"tloat",
|
||||
"\u002B",
|
||||
"Treibervariable",
|
||||
"Bit",
|
||||
"\u002B",
|
||||
"Treibervariable",
|
||||
"Byte",
|
||||
"=",
|
||||
"Treibervariable",
|
||||
"Wort",
|
||||
" ",
|
||||
" ",
|
||||
";",
|
||||
"Konfiguration",
|
||||
"u",
|
||||
"\u2014",
|
||||
" ",
|
||||
"\u002B",
|
||||
"Treibervariable",
|
||||
"Doppelwort",
|
||||
"\u002B",
|
||||
"Treibervariable",
|
||||
"Float",
|
||||
"\u002B",
|
||||
"Treibervariable",
|
||||
"String",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"EN",
|
||||
"#:",
|
||||
"Variablendefinition",
|
||||
"Bae",
|
||||
"232e84",
|
||||
"Seen",
|
||||
"Ss",
|
||||
"Pe",
|
||||
"BEe",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"Selektieren",
|
||||
"Sie",
|
||||
"das",
|
||||
"gew\u00FCnschte",
|
||||
"u",
|
||||
" ",
|
||||
"\u201A\u002B",
|
||||
"ARCHIVE",
|
||||
"tloat",
|
||||
"\u002B",
|
||||
"Treibervariable",
|
||||
"Bit",
|
||||
"\u002B",
|
||||
"Treibervariable",
|
||||
"Byte",
|
||||
"=",
|
||||
"Treibervariable",
|
||||
"Wort",
|
||||
" ",
|
||||
" ",
|
||||
"ick",
|
||||
"_____",
|
||||
" ",
|
||||
"\u002B",
|
||||
"Treibervariable",
|
||||
"D",
|
||||
"oppelwort",
|
||||
"\u002B",
|
||||
"Treibervariable",
|
||||
"Float",
|
||||
"\u002B",
|
||||
"Treibervariable",
|
||||
"String",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
" ",
|
||||
"EN"
|
||||
]
|
||||
|
Before Width: | Height: | Size: 51 KiB After Width: | Height: | Size: 51 KiB |
|
Before Width: | Height: | Size: 64 KiB After Width: | Height: | Size: 64 KiB |
|
Before Width: | Height: | Size: 7.4 KiB After Width: | Height: | Size: 7.4 KiB |
|
Before Width: | Height: | Size: 5.1 KiB After Width: | Height: | Size: 5.1 KiB |