Häufigkeitstabellen



Die folgenden Häufigkeitstabellen enthalten Daten über die Häufigkeit des Auftretens von einzelnen Buchstaben in bestimmten Sprachen. Daraus lässt sich bei Substitution einfacher die Verschlüsselung erkennen, da zum Beispiel der Buchstabe E in "normalen" Texten der deutschen Sprache am häufigsten ist, kann man durch Auszählen der häufigsten Buchstaben in der Geheimbotschaft mit hoher Wahrscheinlichkeit die Verschlüsselung des E erkennen, wenn es sich um einen "normalen" Klartext handelt. Liegt dann auch noch eine Caesar-Verschlüsselung vor, ist damit der Schlüssel bereits gefunden. Bei anderen Substitutionen ist wenigstens ein erster Ansatz zur Entschlüsselung gefunden.

Außerdem kann man mit ziemlicher Sicherheit erkennen, ob eine Transposition vorliegt (wenn die ermittelten Häufigkeiten im Geheimtext den normalen Häufigkeiten sehr ähnlich sind), ob eine monoalphabetische Substitution vorliegt (wenn die Häufigkeiten im Geheimtext ähnlich zu einer Permutation der normalen Häufigkeiten sind) oder ob es sich um eine ganz andere Art der Verschlüsselung handelt (wenn keine Ähnlichkeiten der Häufigkeitsverteilungen zu erkennen sind).

Häufigkeiten der Einzelbuchstaben

 Buchstabe   Deutsch   Englisch   Französisch   Spanisch   Italienisch   Schwedisch 
a 6,5 % 8,2 % 7,6 % 12,5 % 11,7 % 9,3 %
b 1,9 % 1,5 % 0,9 % 1,4 % 0,9 % 1,3 %
c 3,0 % 2,8 % 3,3 % 4,7 % 4,5 % 1,3 %
d 5,1 % 4,3 % 3,7 % 5,9 % 3,7 % 4,5 %
e 17,4 % 12,7 % 14,7 % 13,7 % 12,0 % 10,0 %
f 1,7 % 2,2 % 1,1 % 0,1 % 0,1 % 2,0 %
g 3,0 % 2,0 % 0,9 % 1,0 % 1,6 % 3,3 %
h 4,8 % 6,1 % 0,7 % 0,7 % 1,5 % 2,1 %
i 7,6 % 7,0 % 7,5 % 6,3 % 11,3 % 5,1 %
j 0,3 % 0,2 % 0,5 % 0,4 % 0,7 %
k 1,2 % 0,8 % 0,05 % 3,2 %
l 3,4 % 4,0 % 5,5 % 5,0 % 6,5 % 5,2 %
m 2,5 % 2,4 % 3,0 % 3,2 % 2,5 % 3,5 %
n 9,8 % 6,7 % 7,1 % 6,7 % 6,9 % 8,8 %
o 2,5 % 7,5 % 5,4 % 8,7 % 9,8 % 4,1 %
p 0,8 % 1,9 % 3,0 % 2,5 % 3,0 % 1,7 %
q 0,02 % 0,1 % 1,4 % 0,9 % 0,5 % 0,007 %
r 7,0 % 6,0 % 6,6 % 6,9 % 6,4 % 8,3 %
s 7,3 % 6,3 % 7,9 % 8,0 % 5,0 % 6,3 %
t 6,2 % 9,1 % 7,2 % 4,6 % 5,6 % 8,7 %
u 4,4 % 2,8 % 6,3 % 3,9 % 3,0 % 1,8 %
v 0,7 % 1,0 % 1,6 % 0,9 % 2,1 % 2,4 %
w 1,9 % 2,4 % 0,1 % 0,02 % 0,03 %
x 0,03 % 0,2 % 0,4 % 0,2 % 0,1 %
y 0,04 % 2,0 % 0,3 % 0,9 % 0,6 %
z 1,1 % 0,1 % 0,1 % 0,5 % 0,5 % 0,02 %
œ 0,02 %
0,3 %
0,5 % siehe a
0,1 %
0,3 % siehe e
1,904 % siehe e
0,225 %
siehe i
siehe o
0,06 % siehe u

Kurze Wörter

Die folgenden Informationen sind aus dem Buch Entzifferte Geheimnisse von Friedrich L. Bauer, Abschnitt 15.7.2.

In der englischen Sprache gibt es genau zwei einbuchstabige Wörter, nämlich "a" und "I",
und die folgenden zweibuchstabigen Wörter (sortiert nach den Vokalen und dann jeweils nach Häufigkeiten)

an  at  as  am
he  be  me  we
in  is  it  if
on  or  to  of  do  go  no  so
my  by

Die zehn häufigsten Wörter im Englischen sind

the  of  and  to  a  in  that  it  is  I

Die zehn häufigsten Wörter im Deutschen sind

die  der  und  den  am  in  zu  ist  daß  es


Hier findet man entsprechende Häufigkeitstabellen für Bigramme und für Trigramme.


Autor: Lukas Gartner
Datum: 28.04.2010