Es seien und nichtleere endliche Mengen, wobei die Elemente von Zustände und die Elemente von Zeichen genannt werden. Die Menge heißt in diesem Zusammenhang auch ein Alphabet. Weiterhin sei das freie Monoid über .
Eine rechtsseitige unitäre -Menge wird dann auch in der Form notiert und als deterministischer endlicher (Halbgruppen-)Automat bezeichnet.
Es reicht dann in der Tat aus, die Operation zu kennen, denn gilt, da die -Menge unitär ist, und für jedes Wort aus ist ja . in der -Menge eindeutig festgelegt.
Jedes Wort aus definiert also eine Transformation und die Abbildung mit für alle aus ist ein Homomorphismus von dem freien Monoid in das Monoid aller Transformationen auf . Das Bild wird dann auch das Transformationsmonoid des Automaten genannt.
Man kann nun deterministische endliche Automaten benutzen, um bestimmte formale Sprachen als Teilmengen von zu beschreiben. Dazu zeichnet man einen Anfangszustand aus und eine (eventuell auch leere) Teilmenge von als Endzustände aus und definiert für den Automaten dann
(1)
Man sagt, der Automat erkennt oder akzeptiert die Sprache , und nennt eine beliebige formale Sprache aus erkennbar, wenn es einen deterministischen endlichen Automaten mit gibt.
Eine alternative Definition der Erkennbarkeit formaler Sprachen erfolgt mit Hilfe erkennender Monoide.
Für jedes endliche Alphabet ist abzählbar unendlich und daher die Potenzmenge von überabzählbar. Es gibt also über einem festen Alphabet stets überabzählbar viele verschiedene formale Sprachen. Für jede feste endliche Menge mit gibt es auch nur endlich viele verschiedene deterministische endliche Automaten . Da es auf die Bezeichnung der Menge nicht ankommt, gibt es im wesentlichen nur endlich viele verschiedene deterministische Automaten mit Zuständen. Daher gibt es nur abzählbar viele verschiedene deterministische endliche Automaten und folglich auch nur abzählbar viele verschiedene erkennbare Sprachen. Es gibt also (überabzählbar viele) nicht erkennbare Sprachen. Man kann sogar leicht konkrete derartige Sprachen angeben (siehe unten).
Wählt man für einen beliebigen deterministischen endlichen Automaten den Startzustand aus beliebig und die Endzustandsmenge , dann erkennt die Sprache , wält man dagegen als leere Menge, so erkennt der Automat die leere Sprache .
Erkennt allgemein der Automat die Sprache und definiert man den Automaten , indem man setzt, so gilt offensichtlich .
Die Menge aller durch deterministische endliche Automaten erkennbaren Sprachen ist daher abgeschlossen gegenüber Komplementbildung und enthält die beiden Sprachen und .
Erkennt der Automat die Sprache und der Automat die Sprache , so erkennt der Produktautomat offensichtlich genau den Durchschnitt von und .
Die Menge aller durch deterministische endliche Automaten erkennbaren Sprachen ist daher abgeschlossen gegenüber Durchschnitten und (da sich Vereinigungen als Komplemente und Durchschnitte darstellen lassen) Vereinigungen, insgesamt also eine Boolesche Algebra. Da es Sprachen gibt, die nicht durch deterministische endliche Automaten erkennbar sind (siehe unten), ist dies eine echte Unteralgebra der Potenzmenge von .
Sei ein beliebiges Wort aus und die aus diesem Wort bestehende einelementige Sprache. Definiere den deterministischen endlichen Automaten auf der Zustandsmenge durch für und für alle anderen Kombinationen von Zuständen und Zeichen. Offensichtlich gilt dann und für alle anderen Worte aus . Also gilt und jede einelementige Sprache ist damit erkennbar. Da die Menge der erkennbaren Sprachen aber abgeschlossen gegenüber endlichen Vereinigungen ist, gilt der folgende Satz.
Jede endliche Sprache ist erkennbar.
Sei ein deterministischer endlicher Automat, der die Sprache erkennt und . Entweder gilt für jedes Wort aus dann , womit eine endliche Sprache ist, oder es gibt mindestens ein Wort aus mit . Betrachte im zweiten Fall die Folge der Zustände , die bei der Erkennung von durchl&auuml;ft. Da dies mehr als Zustände sind, kommt mindestens ein Zustand aus doppelt vor, etwa für . Dann läßt sich zerlegen in Teilworte , wobei mindestens nicht das leere Wort ist. Dann gilt aber für jedes Wort aus für ebenfalls und liegt in . Daher liegen alle bereits in . Diese Sprache ist also unendlich und enthält mit ein Wort einer Länge kleiner als . Es gilt also insbesondere genau dann, wenn kein Wort einer Länge kleiner als enthält, was man algorithmisch entscheiden kann.
Betrachtet man weiterhin für den Fall, daß unendlich ist, die Menge aller Längen von Wörtern aus , so zeigt die eben durchgeführte Überlegung, daß in dieser Menge natürlicher Zahlen keine Lücken größer als auftreten können, da die Längen der Wörter diesen Abstand haben. Treten also in für eine unendliche Sprache beliebig große Lücken auf, so kann diese Sprache von keinem deterministischen endlichen Automaten erkannt werden.
Die Sprache über dem Alphabet ist durch keinen deterministischen endlichen Automaten erkennbar, denn die Lücken zwischen den Längen und zweier aufeinander folgender Wörter aus werden beliebig groß.
Offensichtlich kann man in dem gerade angegebenen Beispiel die Exponentenfolge durch jede größere Potenz von , aber auch durch exponentiell wachsende Folgen wie oder auch durch die Folge der Primzahlen ersetzen, denn auch diese weist nach einem bekannten Resultat der Zahlentheorie beliebig große Lücken auf.