Durchschn. bed. Wahrsch., bigrammbasiert

Beschreibung:

Durchschnittliche bedingte Wahrscheinlichkeit eines Types, betrachtet in Bigrammkontexten. Betrachtet werden alle Bigramme mit dem gegebenen Type als zweiter Komponente. Für jedes einzelne Bigramm kann die bedingte Wahrscheinlichkeit der zweiten Komponente als unmittelbarer Nachfolger der ersten Komponente angegeben werden mit:

P(w2|w1) = C(w1w2)/C(w1)

C steht für die absolute Häufigkeit eines Types bzw. eines Bigramms. Die durchschnittliche bedingte Wahrscheinlichkeit wird unter Berücksichtigung der Frequenz des jeweiligen Bigramms berechnet:

AvgCondProb = sum(C(w1w2)*P(w2|w1)) / sum(C(w1w2))

Die Summenbildung erfolgt für jeden Type über alle Bigramme mit dem gegebenen Type als 2. Komponente. Dieses Maß dient als Grundlage für den durchschnittlichen Informationsgehalt eines Types.

Datentyp:

Datentyp
numerisch
Untertyp
Gleitkommazahl (double precision)
Abfrageoperatoren
größer oder gleich, kleiner oder gleich
Nullwert
-1.0

In folgenden Tabellen vorhanden:

In folgenden N-Gramm-Tabellen können Sie den Filter auf jede einzelne Komponente anwenden: