Lösung zu Aufgabe 29

Zu entschlüsseln ist das Kryptogramm

XTEIA  DSLAS  QAFKS  FFKYI  VYOPY  UJQNI  PAYNI  LNVRA  TUSMY 
VTJSU  UYLAE  SEYVY  UCDTA  KSURF  KYTVV  SUGNV  RYVSV  YJDNA 
YDQVY  DSFYR

Eine Häufigkeitsanalyse liefert

ABCDE FGHIJK LMNOP QRSTUV WXYZ
80153 51043 43151 234105 7100114 0

Die häufigsten Bigramme im Kryptogramm sind "VY" (viermal), "SU", "YV" und "FK" (je dreimal), die häufigsten Trigramme "NVR" und "FKY" (je zweimal).

Da die Häufigkeitsverteilung die normalen Buchstabenhäufigkeiten einer natürlichen Sprache zeigt, vermutet man zunächst das Vorliegen einer Verschlüsselung durch einfache Substitution.

Man wird daher annehmen, daß das "E" zu einem "Y" verschlüsselt wurde. Dann steht "FKY" vermutlich für "THE", da ja "FK" für "TH" (relativ) häufig vorkommt. Weiterhin steht "V" für einen ebenfalls häufigen Buchstaben, der sowohl vor dem "E" als auch nach dem "E" häufig auftritt. Hierfür bietet sich das "R" an.

Damit hat man dann die partielle Entschlüsselungstabelle

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
- - - - - T - - - - H - - - - - - - - - - R - - E -

Da es keinen Hinweis auf eine Caesar-Verschlüsselung oder eine affine Verschlüsselung gibt, verfolgt man die Hypothese einer allgemeinen Substitution weiter.

Die Sequenz "FKSFFKY" im dritten und vierten Block entspricht dann "TH.TTHE", was "A" für "S" nahelegt. Das häufigste Bigramm in englischen Texten, das mit einem "A" beginnt ist aber "AN". Das dreimalige Auftreten von "SU" deutet darauf hin, daß "U" wohl für "N" steht. Weiterhin lautet das Ende des Kryptogramms "VYDSFYR" nun "RE.ATE.", was "RELATED" heißen könnte. Also wäre "D" zu "L" und "R" zu "D" zu entschlüsseln.

Nun ergibt sich eine neue partielle Entschlüsselungstabelle

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
- - - L - T - - - - H - - - - - - D A - N R - - E -

Die Sequenz "SURFKYTV", also "ANDTHE.R", steht wohl für "AND THEIR", also ist das "T" durch ein "I" zu entschlüsseln. Dann lautet aber "TUSMYVTJSU", also "INA.ERI.AN" wohl "IN AMERICAN". Damit steht das "M" wohl für sich selbst und das "J" für ein "C". Die einzigen noch zu entschlüselnden häufigen Buchstaben des Kryptogramms sind "A" und "N", die häufigsten noch unklaren Buchstaben im Klartext sind "O" und "S". Dann legt das Ende des Geheimtextes "NVRYVSVYJDNAYDQVYDSFYR", also ".RDERARECL..EL.RELATED", aber den Klartext "ORDER ARE CLOSELY RELATED" nahe. "N" steht also für "O", "A" steht für "S" und "Q" für "Y". Dies paßt auch gut zu der Entschlüsselung von "ASQAFKSFKY" zu "SAYS THAT THE" in den Blöcken zwei bis vier. Das Wort dahinter "IVYOPYUJQ", also ".RE..ENCY" heißt daher wohl "FREQUENCY". Also steht "I" für "F", "O" für "Q" und "P" für "U". Dann ist "YUCDTAK", also "EN.LISH", zu "ENGLISH" zu entschlüsseln, "LNVRA", also ".ORDS", zu "WORDS", "UYLAESEYV", also "NEWS.A.ER", zu "NEWSPAPER" und "VSUG", also "RAN." zu "RANK".

Das erste Wort "XTEIA", also ".IPFS", steht wohl für einen Eigennamen mit einem seltenen Anfangsbuchstaben, der sonst nicht vorkommt. Unter den noch verbliebenen Klartextbuchstaben "B", "J", "V", "X" und "Z" kann man durch Recherche im Internet leicht herausfinden, daß wohl der Linguist Georg Kingsley Zipf (1902 - 1950) gemeint ist, der das nach ihm benannte empirische Gesetz über die Häufigkeitsverteilung von Worten allgemein bekannt gemacht hat.

Damit hat man die Entschlüsselungstabelle

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
S ? G L P T K ? F C H W M O Q U Y D A I N R ? Z E ?

die dann den Klartext liefert:

ZIPFS  LAW  SAYS  THAT  THE  FREQUENCY  OF  USE  OF  WORDS  IN  AMERICAN  NEWSPAPER  ENGLISH  AND  THEIR  RANK  ORDER  ARE  CLOSELY  RELATED


Entdeckt wurde das Gesetz aber schon vorher beispielsweise von dem französischen Stenographen Jean-Baptiste Estoup (1868 - 1950) und dem deutschen Physiker Felix Auerbach (1856 - 1933). Felix Auerbach starb am 26. Februar 1933 gemeinsam mit seiner Frau Anna durch Selbstmord. Sie waren beide Juden. Eines der klassischen Bücher von Felix Auerbach war Die Furcht vor der Mathematik und ihre Überwindung aus dem Jahr 1925.


Bei der Erzeugung "zufällig" permutierter Geheimtextalphabete wendet man oft die von Wheatstone vorgeschlagene Methode der Verwendung eines Schlüsselwortes an. Daher kann man noch versuchen, dieses Schlüsselwort zu finden. Dazu vertauscht man zunächst die beiden Zeilen der Entschlüsselungstabelle und sortiert wieder nach der oberen Zeile, um die verwendete Verschlüsselungstabelle zu erhalten

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
S - J R Y I C K T - G D M U N E O V A F P - L - Q X

Da der Buchstabe "Y" im Geheimtextalphabet an fünfter Position auftritt, versucht man das Geheimtextalphabet zunächst in Spalten der Länge 5 und ab der dritten Spalte dann der Länge 4 anzuordnen:

SIGNAL
*CDEF*
JKHOPQ
RTUV*X
Y*

In der zweiten Zeile fehlen noch die Buchstaben "B" und "H", in der vierten Zeile noch der Buchstabe "W" und am Ende ein "Z". Das Schlüsselwort war

"SIGNAL"

Damit ist dann auch der vollständige Schlüssel mitsamt Schlüsselwort rekonstruiert.


Autor: Udo Hebisch
Datum: 19.05.2016