Kumulierte Zeichentrigramme-Korpusfrequenz

Beschreibung:

Die Summer der Häufigkeit aller (Zeichen-)Trigramme, die ein Type enthält, im Korpus.

Beispiel: Type Hans

Häufigkeit im Korpus
$$H1324760
$Ha431492
Han134819
ans144886
ns$498313
s$$7962327
$$Hans$$10496597

Dabei ist $ ein Platzhalter für Anfang bzw. Ende eines Wortes.

Datentyp:

Datentyp
Korpusfrequenz
Untertypen
absolut, normalisiert, absolut log10, normalisiert log10, Frequenzrang, Frequenzrang 123
Basis für die Normalisierung
pro Million Tokens (pro Million laufende Wörter im Korpus)
Abfrageoperatoren
größer oder gleich, kleiner oder gleich
Nullwert
-1

In folgenden Tabellen vorhanden:

In folgenden N-Gramm-Tabellen können Sie den Filter auf jede einzelne Komponente anwenden: