Homophone


Nachdem arabische Gelehrte entdeckt hatten, daß die einzelnen Buchstaben in den Klartexten natürlicher Sprachen mit ganz charakteristischen relativen Häufigkeiten auftreten, gelang es Abu-Yusuf Ya'qub ibn Ishaq al-Kindi (800 - 873), Kryptogramme, die mit einfachen monoalphabetischen Substitutionen verschlüsselt waren, zu entziffern.

Al Kindi beschreibt in seiner Abhandlung über die Entzifferung kryptographischer Botschaften die Methode wie folgt:

"Eine Möglichkeit, eine verschlüsselte Botschaft zu entziffern, vorausgesetzt, wir kennen ihre Sprache, besteht darin, einen anderen Klartext in derselben Sprache zu finden, der lang genug ist, um ein oder zwei Blätter zu füllen, und dann zu zählen, wie oft jeder Buchstabe vorkommt. Wir nennen den häufigsten Buchstaben den »ersten«, den zweithäufigsten den »zweiten«, den folgenden den »dritten« und so weiter, bis wir alle Buchstaben in der Klartextprobe durchgezählt haben. Dann betrachten wir den Geheimtext, den wir entschlüsseln wollen, und ordnen auch seine Symbole. Wir finden das häufigste Symbol und geben ihm die Gestalt des »ersten« Buchstabens der Klartextprobe, das zweithäufigste Symbol wird zum »zweiten« Buchstaben, das dritthäufigste zum »dritten« Buchstaben und so weiter, bis wir alle Symbole des Kryptogramms, das wir entschlüsseln wollen, auf diese Weise zugeordnet haben."

Als diese kryptoanalytische Methode allgemein bekannt wurde, versuchte man daher Verschlüsselungen zu benutzen, bei denen diese relativen Häufigkeiten im Geheimtext verwischt wurden. Ein Mittel hierzu waren die Homophone (griechisch: homos = gleich, phone = Klang). Hierunter versteht man verschiedene Zeichen im Geheimtextalphabet, die alle dasselbe Zeichen (denselben "Klang") im Klartextalphabet darstellen. Da aber natürlich nach wie vor zur Eindeutigkeit der Entschlüsselung, jedem Geheimtextzeichen höchstens ein Klartextzeichen zugeordnet sein darf, muß dann zwangsläufig das Geheimtextalphabet umfangreicher sein als das Klartextalphabet. Die früheste Verwendung von Homophonen (und Blendern) ist von Simeone de Crema 1401 in Mantua überliefert.


Eine modernere Variante ordnet jedem Klartextbuchstaben A,...,Z des lateinischen Alphabetes eine oder mehrere zweiziffrige Zahlen von 00 bis 99 zu. Dies geschieht so, daß den einzelnen Buchstaben um so mehr verschiedene Zahlen zugeordnet werden, je häfiger sie in der Häufigkeitstabelle sind, den Buchstaben mit Häufigkeiten bis höchstens einem Prozent also nur eine Zahl, den Buchstaben mit Häufigkeiten zwischen ein und zwei Prozent dann zwei verschiedene Zahlen usw. Dabei erfolgt die Zuordnung der konkreten Zahlen zufällig, um dem unbefugten Entzifferer möglichst keinen Ansatz für eine Kryptoanalyse zu liefern.

Bei der Verschlüsselung ist dann darauf zu achten, daß bei Buchstaben mit mehreren möglichen Geheimtextzeichen unter diesen Möglichkeiten stets zufällig ausgewählt wird, wiederum, um dem unbefugten Entzifferer keinen Ansatzpunkt für eine Häufigkeitsanalyse zu bieten.

Das folgende Beispiel für eine derartige Verschlüsselungstabelle mit Homophonen findet sich bei Singh, Geheime Botschaften, S. 74. Dabei sind die Häufigkeiten von Klartextbuchstaben in deutscher Sprache verwendet worden.

ABCDE FGHIJ KLMNO PQRST UVWXY Z
0978481345 2539658351 8422587195 2935407649 6189282152 66
1292814179 23506888 27599194 428669 63
33 6214 563293 18 00 779675 34
47 0116 7015 05 801785 60
53 0324 7304 07 112097
67 44 26 54 193008
46 37 72 3643
55 58 90
57 99
64 38
74
82
87
98
10
31
06

Als Beispiel für eine Verschlüsselung mit dieser Tabelle werde der Klartext

DIESER KLARTEXT IST JETZT ZU VERSCHLUESSELN

gewählt. Dann ergibt sich beispielsweise der folgende Geheimtext

DIESE RKLAR TEXTI STJET ZTZUV ERSCH LUESS ELN
0115441782 8084185340 8531219758 4349516408 6669666089 2440308173 2234167696 641899

Eine Häufigkeitsanalyse bietet für die unbefugte Entzifferung keinen erfolgreichen Ansatz, denn die einzigen doppelt auftretenden Geheimtextzeichen 18, 40, 64 und 66 kommen von den Klartextbuchstaben "L", "R", "E" und "Z", die ganz unterschiedliche Häufigkeiten haben. Dagegen ist es viel leichter, ein monoalphabetisch verschlüsseltes Kryptogramm zu dechiffrieren, wenn keine Homophone verwendet wurden. Dazu vergleiche man eine Caesar-Verschlüsselung desselben Klartextes.


Autor: Udo Hebisch
Datum: 08.06.2010