Sie sind auf Seite 1von 153

Quantum Computation

aus algorithmischer Sicht


von
Prof. Dr.rer.nat. Dr.-Ing.Thomas F. Sturm und
Prof. Dr.-Ing. Jrg Schulze

Oldenbourg Verlag Mnchen

Thomas Sturm studierte Mathematik an der TU Mnchen, wo er 1992 auch zum Dr. rer. nat.
promovierte. Eine zweite Promotion zum Dr.-Ing. erhielt er 2003 an der Universitt der Bundeswehr Mnchen. Von 1995 bis 2003 war er Projektwissenschaftler bei Siemens bzw. Infineon
Technologies. Seit 2004 lehrt Thomas Sturm als Fachhochschulprofessor fr Mathematik, insbesondere Technomathematik, an der Universitt der Bundeswehr Mnchen.
Jrg Schulze arbeitete nach dem Studium der Physik und der Promotion zum Dr.-Ing. als
Wissenschaftlicher Mitarbeiter an der Universitt der Bundeswehr Mnchen, wo er sich 2004
habilitierte. Ab 2005 war er bei der Siemens AG in Mnchen ttig. Parallel lehrte er als
Privatdozent an der Fakultt fr Physik der UdB Mnchen. Zum 1. Oktober 2008 wechselte
Jrg Schulze an die Universitt Stuttgart, wo er seitdem das Institut fr Halbleitertechnik leitet.

Bibliografische Information der Deutschen Nationalbibliothek


Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen
Nationalbibliografie; detaillierte bibliografische Daten sind im Internet ber
<http://dnb.d-nb.de> abrufbar.

2009 Oldenbourg Wissenschaftsverlag GmbH


Rosenheimer Strae 145, D -81671 Mnchen
Telefon: (089) 4 50 51- 0
oldenbourg.de
Das Werk einschlielich aller Abbildungen ist urheberrechtlich geschtzt. Jede Verwertung auerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulssig und
strafbar. Das gilt insbesondere fr Vervielfltigungen, bersetzungen, Mikroverfilmungen und
die Einspeicherung und Bearbeitung in elektronischen Systemen.
Lektorat: Kathrin Mnch
Herstellung: Dr. Rolf Jger
Coverentwurf: Kochan & Partner, Mnchen
Gedruckt auf sure- und chlorfreiem Papier
Gesamtherstellung: Books on Demand GmbH, Norderstedt
ISBN 978-3-486-58914-6

Vorwort
Quantenalgorithmen werden auch in populrwissenschaftlichen Beitrgen hufig diskutiert
und die mgliche neue Revolution auf dem Sektor der Informationsverarbeitung durch Quantencomputer oft zitiert. Es kommt dabei schnell der Eindruck einer sich neu entwickelnden
Geheimwissenschaft auf, die nur wenigen Eingeweihten zugnglich ist. Obwohl eine groe
Zahl von Wissenschaftlern, Ingenieuren und Informatikern mit Algorithmik mehr oder weniger intensiv befasst ist, erscheint vielen Nichtphysikern der Zugang zu Quantenalgorithmen
mysteris.
Eine Zielsetzung des Buches ist es, die algorithmische Sicht auf das Quantum Computation
durch Bereitstellung der Werkzeuge und mglichst vollstndige Modellierung herauszuarbeiten. Nach einer physikalischen Betrachtung der Quantenmechanik werden daher zunchst die
bentigten mathematischen Grundlagen eingefhrt, namentlich Vektorrume, darauf aufbauend Hilbertrume und die Tensorrechnung, gefolgt von den Grundlagen der Wahrscheinlichkeitsrechnung. Je nach Kenntnisstand des geneigten Lesers ist dieses Kapitel als Einfhrung,
Vertiefung, Wiederholung oder Notationsvereinbarung zu verstehen. Die Erfahrung hat gezeigt,
dass sich das Mysterise der Quantenalgorithmen oft nicht zuletzt aus unklaren Notationen
ergab.
Auf diesen Grundlagen wird ein Quantencomputer insoweit modelliert, wie es fr die Formulierung von Algorithmen notwendig ist, d.h. als mathematisches Modell der Quantenbits, der
Zeitentwicklung durch Gates und der abschlieenden Messungen. Auf diesem Modell werden
dann die klassischen Quantenalgorithmen jeweils vollstndig eingefhrt und erklrt. Schlielich wird die denkbare Umsetzung von Quantenalgorithmen auf heute existierende klassische
Computer diskutiert.
Nach Hoffnung der Autoren erscheint das Quantum Computation durch Lesen des Buches nicht
mehr mysteris, sondern einer breiteren Gruppe von Menschen mit den blichen Mitteln der
Mathematik fassbar. Die andere Denkweise bei Quantenalgorithmen bleibt faszinierend und
knnte auch andere Gebiete befruchten.
Wir danken dem Verlag fr das Interesse und die stets hervorragende Zusammenarbeit. Auerdem mchten wir insbesondere Herrn Prof. Dr. rer. nat. Dr.-Ing. h. c. Albert Gilg herzlich danken, der im Rahmen von Projekten der Siemens AG in Mnchen das Buchvorhaben initiierte
und frderte.
Thomas F. Sturm, Jrg Schulze

Inhaltsverzeichnis
1

Grundlagen aus der Quantenmechanik

1.1

Eine kleine historische Einfhrung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2

Physikalischer Zustandsraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.3

Observablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.4

Zeitliche Dynamik des Systems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.5

Quantenmechanik und Quantum Computation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Mathematische Grundlagen und Notationen

2.1
2.1.1
2.1.2
2.1.3
2.1.4
2.1.5

Vektoren und Vektorrume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


Gruppe, Ring, Krper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Vektorraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Untervektorrume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Lineare Unabhngigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Basis und Dimension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9
9
13
16
18
20

2.2
2.2.1
2.2.2
2.2.3

Hilbertrume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Skalarprodukt und Norm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Hilbertraum und Orthonormalbasis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Operatoren und Adjungierte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

24
24
28
29

2.3
2.3.1
2.3.2
2.3.3
2.3.4
2.3.5

Tensorprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Kartesisches Produkt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Konstruktion des Tensorproduktes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Charakterisierungssatz des Tensorproduktes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tensorprodukt von Hilbertrumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tensorprodukt von Tupelrumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

30
30
31
36
38
39

2.4
2.4.1
2.4.2
2.4.3
2.4.4
2.4.5
2.4.6

Wahrscheinlichkeitstheoretische Begriffe und Grundlagen . . . . . . . . . . . . . . . . . . . . .


Mae auf -Algebren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Der Integralbegriff von Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Wahrscheinlichkeitsrume und Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Charakterisierung von Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Stochastische Unabhngigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Stochastische Konvergenzbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

41
41
45
49
52
59
61

VIII

Inhaltsverzeichnis

Modellierung eines Quantencomputers

65

3.1
3.1.1
3.1.2

Das Quantenbit (Qbit) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65


Definition eines Qbits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
Messung eines Qbits bezglich einer Basis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

3.2
3.2.1
3.2.2
3.2.3
3.2.4
3.2.5

Multi-Qbits und ihre Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


Definition von Multi-Qbits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Charakterisierung von Multi-Qbit-Zustnden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Messung eines Multi-Qbits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Vollstndige Messung eines Multi-Qbits bezglich einer Basis . . . . . . . . . . . . . . . .
Partielle Messung eines Multi-Qbits bezglich einer Basis . . . . . . . . . . . . . . . . . . . .

68
68
70
72
74
76

3.3
3.3.1
3.3.2
3.3.3
3.3.4
3.3.5
3.3.6

Unitre Operationen auf Quantenbits (Zeitentwicklung) . . . . . . . . . . . . . . . . . . . . . . .


Definition von Gates (Unitre Operatoren). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tensorprodukt von Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Elementare Gates fr ein Qbit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Elementare Gates fr zwei Qbits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Gates fr Boolesche Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Quanten-Fouriertransformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

83
83
84
86
89
90
92

Quantenalgorithmen fr Quantencomputer

95

4.1

Das Grundprinzip der Quantenalgorithmen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

4.2
4.2.1
4.2.2

Der Deutsch-Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
Zielsetzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
Formulierung des Verfahrens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

4.3
4.3.1
4.3.2

Der Deutsch-Jozsa-Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Zielsetzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Formulierung des Verfahrens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

4.4
4.4.1
4.4.2

Der Grover-Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100


Zielsetzung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
Formulierung des Verfahrens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

4.5
4.5.1
4.5.2
4.5.3
4.5.4
4.5.5

Der Shor-Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106


Anwendungshintergrund: Das RSA-Verschlsselungsverfahren . . . . . . . . . . . . . . . . 106
Primfaktorzerlegung durch Ordnungsbestimmung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Quantenalgorithmus zur Ordnungsbestimmung durch Phasenschtzung . . . . . . . . 111
Ordnungsbestimmung durch Kettenbruchzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
Gesamtalgorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

Quantenalgorithmen fr klassische Computer

5.1

Vorberlegungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

5.2

Speicherplatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

5.3
5.3.1

Algorithmen fr ausgewhlte Gates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125


Hadamard-Gate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

123

Inhaltsverzeichnis

IX

5.3.2
5.3.3

Fouriertransformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
Exponentialgate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

5.4

Implementierung von Messungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

5.5

Kaskadierte Messungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

5.6

Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

Literaturverzeichnis

137

Index

139

Grundlagen aus der


Quantenmechanik

1.1

Eine kleine historische Einfhrung

Mit der Erkenntnis der Maxwellschen Theorie elektromagnetischer Phnomene, dass sich elektromagnetische Felder im Vakuum mit Lichtgeschwindigkeit ausbreiten, schien der Jahrhunderte alte Streit ber die Natur des Lichts Korpuskel oder Welle? zugunsten der Wellennatur
endgltig entschieden, bis Max Plancks Arbeiten ber die Theorie der Schwarzkrper- bzw.
Hohlraumstrahlung diese scheinbare Endgltigkeit wieder in Frage stellte. Um die spektrale
Energiedichteverteilung der Hohlraumstrahlung erklren zu knnen, sah sich Planck gezwungen, die Strahlungsenergie zu einer gegebenen Frequenz f beziehungsweise1 als ein ganzzahliges Vielfaches eines Grundquantums2 hf =  anzunehmen. Flankiert durch zahlreiche
experimentelle Ergebnisse verschiedener Forscher, die mit Hilfe einer Kathodenstrahlrhre im
Zeitraum 18971905 gewonnen wurden, kam damit Einstein zu der Erkenntnis, dass man Licht
der Frequenz f unter bestimmten experimentellen Umstnden als Korpuskel (Einstein prgte
den Begriff des Photons) mit der Energie W = h f =  und den damit verbundenen
Lichtstrahl als einen Korpuskelstrahl betrachten muss. Der Streit ber die Natur, die Dualitt
des Lichtes war wieder erffnet.
Die Flle der experimentellen Resultate, die mit Hilfe unterschiedlich modifizierter Kathodenstrahlrhren in den ersten 20 Jahren des 20. Jahrhunderts gesammelt wurden, motivierte die
Forscher auch zur Frage nach der Struktur der Atome. Jeder Versuch einer rein klassischen Interpretation scheiterte. Erst durch das semiklassische Bohrsche Atommodell, welches das Atom
aus einer Hlle von korpuskularen Elektronen, die einen festen, positiv geladenen Kern auf
Kreisbahnen umkreisen, bestehend beschreibt, gelang 1913 ein erster befriedigender Ansatz.
Allerdings musste man dafr die klassisch nicht begrndbare Quantisierung des Bahndrehimpulses der Elektronen akzeptieren, die als Drittes Bohrsches Postulat berhmt geworden ist
und die eine Auswahlregel fr die erlaubten Kreisbahnradien der Elektronenbahnen darstellt.
Louis de Broglie erkannte, dass sich diese Quantisierungsregel befriedigend als ein Stehende
Welle-Phnomen beschreiben lsst, billigt man den Elektronen eine Wellennatur durch Einfhrung einer Wellenlnge zu. Inspiriert dadurch erhob Louis de Broglie in seiner Dissertation
Recherches sur la thorie des Quanta 1924 den Welle-Teilchen-Dualismus zu einem Grundprinzip der Natur und postulierte, dass er auch auf jegliche Arte fester Materie anwendbar ist.
Folgt man de Broglies Postulat, so muss sich eine Wellengleichung fr z. B. ein ruhemassebehaftetes nicht-relativistisches Teilchen finden lassen, die die Ausbreitung der Materiewelle
1 Kreisfrequenz

= 2 f .
Naturkonstante  (Dirac-Konstante bzw. reduziertes Plancksches Wirkungsquantum) hat den Wert  =
wobei h das Plancksche Wirkungsquantum ist mit h 6.626 1034Js, siehe [13].
2 Die

h
,
2

1 Grundlagen aus der Quantenmechanik

(r, t), die nun das Korpuskel darstellt, im Raum und in der Zeit richtig beschreibt. Die Formulierung dieser Wellengleichung gelang 1926 Erwin Schrdinger und trgt seitdem ihm zu
Ehren seinen Namen. Fr ein nicht-relativistisches Korpuskel der Masse m, welches sich mit
dem Impuls p im Potential Wpot (r, t) bewegt, lautet sie:


2
(r, t)
=
+ Wpot (r, t) (r, t) = H (r, t).
(1.1)
i
t
2m
Der in der Schrdinger-Gleichung (1.1) eingefhrte Operator H wird Hamilton-Operator genannt.
Die Schrdinger-Gleichung ist so konstruiert, dass die ebene Welle
  

(r, t) = 0 exp i( k, r t)

(1.2)

Lsung ist und sich als Dispersionsrelation der nicht-relativistische Energiesatz fr ruhemassebehaftete Teilchen ergibt:
 = Wges =

2 k 2
p2
+ Wpot =
+ Wpot = Wkin + Wpot.
2m
2m

(1.3)

Diese Konstruktion fhrt aber zu dem Problem, dass sich nur komplexwertige Wellenfunktionen (r, t) ergeben, die sich physikalisch nicht interpretieren lassen, da die physikalische
Interpretierbarkeit an reellwertige und damit physikalisch messbare Funktionen geknpft ist.
Diese Schwierigkeit behebt die auf Born, Bohr und Heisenberg zurckgehende Kopenhagener Deutung der Quantenmechanik von 1927, die auf einer Wahrscheinlichkeitsinterpretation
fut: Der Deutung zufolge ist die Wellenfunktion (r, t) selbst nicht interpretierbar, auch wenn
man ihr den wohlklingenden Namen Aufenthaltswahrscheinlichkeitsdichtenamplitude gab,
vergleiche auch Definition 2.83 auf Seite 58. Wohl ist aber das Betragsquadrat der Wellenfunktion interpretierbar, welches ein Ma fr die Wahrscheinlichkeit ist, das Teilchen am Ort r zum
Zeitpunkt t zu finden:
g(r, t) := |(r, t)|

(1.4)

Zu einem Zeitpunkt t muss das Teilchen mit Wahrscheinlichkeit 1 irgendwo im Raum gefunden
werden, so dass also die folgende Normierungsbedingung gilt:


!
g(r, t) dr =
|(r, t)|2 dr = 1.
(1.5)
R3

R3

1.2 Physikalischer Zustandsraum

1.2

Physikalischer Zustandsraum

Nun betrachten wir etwas mathematisch abstrahiert eine Wellenfunktion als eine Abbildung
von einem k-dimensionalen reellen Parameterraum in die komplexen Zahlen:
: Rk C
Die Menge der mglichen Wellenfunktionen zur Beschreibung eines Teilchens lsst sich zu
einem Funktionenraum zusammenfassen



L 2 (Rk ) := : Rk C messbar und ||2 integrierbar .
In diesem Zusammenhang steht Messbarkeit fr die Lebesgue-Messbarkeit von Funktionen,
siehe Abschnitt 2.4.2 auf Seite 45 und [1, 23].
L 2 (Rk ) ist damit ein komplexer unendlichdimensionaler Vektorraum. Um eine Norm und ein
Skalarprodukt fr Wellenfunktionen angeben zu knnen, siehe Abschnitt 2.2.1 auf Seite 24,
mssen noch redundante Wellenfunktionen zu Klassen zusammengefasst werden, d.h. Wellenfunktionen, die hinsichtlich des Lebesgue-Maes fast berall gleich sind, was in physikalischer
Interpretation fr ununterscheidbare Wellenfunktionen steht. Fr solche Wellenfunktionen verwendet man die quivalenzrelation
1 2

1 (x) = 2 (x) fr fast alle x Rk .

Auf dem Faktorraum


L2 (Rk ) := L 2 (Rk )/N



von L 2 (Rk ) nach der Untermenge N := L2 (Rk ) = 0 fast berall lsst sich ein

Skalarprodukt und eine dazu korrespondierende Norm,  = , , fr die beschriebenen
Wellenfunktionen festlegen, und L2 (Rk ) ist dann der Hilbertraum der Wellenfunktionen, vgl.
Abschnitt 2.2.1. Ein Element aus L2 (Rk ) entspricht dabei einem Zustand des Systems.
Die mathematische Lsung der Schrdingergleichung (1.1) ergibt gleich eine ganze Schar von
Lsungen mit C. Die Kopenhagener Deutung besagt nun, dass diese Schar von Wellenfunktionen nur einen einzigen Zustand beschreibt und sich auf eine normierte Darstellung
reduzieren lsst. Durch die Normierung der Form (1.5) ergibt sich eine statistische Wahrscheinlichkeitsinterpretation.
Das physikalische System kann verschiedene Zustnde einnehmen, die durch jeweils eine Wellenfunktion ausgedrckt werden und wegen der Linearitt des Hilbertraumes kann es auch
alle durch eine Linearkombination dieser Zustnde entstehenden Zustnde einnehmen [4]. Eine Linearkombination von normierten Zustnden ist zwar nicht selbst normiert, aber der neu
entstandene Zustand befindet sich auf einem Vektorstrahl, auf dem sich auch der quivalente
normierte Zustand befindet.
Der Teilchen-Spin ist der einzig relevante Parameter in der Quanteninformationstheorie, denn
der Spin lsst sich identifizieren mit dem Bit b B := {0, 1}, der klassischen Informationseinheit. Die Identifikation erfolgt beispielsweise durch Spin-up () als 1 (Bit gesetzt) und

1 Grundlagen aus der Quantenmechanik

Spin-down () als 0 (Bit nicht gesetzt). Der Spin ist unabhngig von den anderen Parametern.
Zerlegt man nun die Wellenfunktion in zwei Wellenfunktionen, die vektoriell wieder zu


(x)
(x) =
(1.6)
(x)
zusammengefasst werden, so spricht man von der Spinor-Wellenfunktion. Diese hat dann entsprechend eine Spin-up- und eine Spin-down-Komponente. Wendet man nun die bisherigen
berlegungen auf die Spinor-Wellenfunktion an, so erhlt man das erste Postulat zur Beschreibung des physikalischen Systems.

Postulat 1 Physikalischer Zustandsraum


Der Spin-Zustand eines physikalischen Systems wird durch eine quadratintegrierbare SpinorWellenfunktion


(x)
: Rk C2 , (x) =
,
(x)
im Hilbertraum L2 (Rk ) L2 (Rk ) ber C in Abhngigkeit des Parameters x Rk charakterisiert. Zudem soll die Normierungsbedingung



2 k
2 k
(x) d x :=
| (x)| d x +
| (x)|2 dk x := 1
(1.7)
Rk

Rk

Rk

gelten.

(1.7) ist natrlich die bertragung der Normierungsbedingung (1.5) der Kopenhagener Deutung. Damit kann die Beobachtung des Spin-Zustands eines Teilchens als Zufallsexperiment
mit dem Wahrscheinlichkeitsraum3
({, }, {{}, {, }, {}, {}}, P )

(1.8)

angesehen werden. Beobachtet man nun ein Teilchen, so ist die Wahrscheinlichkeit fr einen
Spin-up durch

P () =
| (x)|2 dk x
Rk

gegeben, dem ersten Summanden von Gleichung (1.7). Analog wird die Wahrscheinlichkeit
fr ein Spin-down-Teilchen bestimmt. Im Unterschied zur klassischen Informationseinheit Bit,
welches entweder gesetzt ist oder nicht, ist der Spin-Zustand wahrscheinlichkeitsbehaftet.
Da die mglichen Zustnde eines Spin-Teilchens somit nur vom zweidimensionalen Funktionswert der Spinor-Wellenfunktion abhngen, lsst sich die Zustandsbeschreibung vom bisherigen
3 Eine

Einfhrung in die Wahrscheinlichkeitstheorie findet sich in Abschnitt 2.4.

1.2 Physikalischer Zustandsraum

Hilbertraum L2 (Rk ) L2 (Rk ) reduzieren auf die Vektoren in einem zweidimensionalen Hilbertraum H, der als Zustandsraum des Spin-Teilchens bezeichnet wird. In dieser vereinfachten
vektoriellen Darstellung beschreiben die (normierten) Vektoren aus H die Spin-Zustnde.
Im Hilbertraum H sei nun eine spezielle Orthonormalbasis
B = {v1 , v2 } ,

v1 , v2 H

ausgezeichnet. Zu jedem Zustand H gibt es dann eine eindeutige Darstellung


= 1 v1 + 2 v2

mit 1 , 2 C.

(1.9)

Wird die Normierungsbedingung 2 = 1 gefordert, so folgt


|1 |2 + |2 |2 = 1.

(1.10)

Durch die Darstellung (1.9) und (1.10) wird Postulat 1 auf der vorherigen Seite in der reduzierten Form erfllt. Die vektorielle Sichtweise erlaubt die vereinfachte Beschreibung der SpinWahrscheinlichkeiten als
P () = |1 |2 ,

P () = |2 |2 .

Das in Abschnitt 2.3 auf Seite 30 definierte Tensorprodukt erlaubt die Erweiterung auf eine
beliebige Anzahl n von Spin-Teilchen, deren Zustnde beschrieben werden als Vektoren aus
Hn =

H.

i=1

Dabei ist Hn ein Hilbertraum der Dimension 2n ber C. Jeder Zustand aus Hn kann
geschrieben werden als
=

2

i1 =1

...

2


i1 ...in vi1 . . . vin .

in =1

In Definition 3.1 auf Seite 65 und Definition 3.5 auf Seite 68 werden diese Folgerungen aus
Postulat 1 auf der vorherigen Seite noch einmal przise formuliert.

1 Grundlagen aus der Quantenmechanik

1.3

Observablen

Als Observablen bezeichnet man die Messgren eines physikalischen Systems, die zu einem
festen Zeitpunkt und whrend eines bestimmten Zustandes gemessen werden knnen. In der
Quantenmechanik sind Observablen im Allgemeinen Mengen von linearen Operatoren, die auf
den Wellenfunktionen bzw. auf den Zustnden in vektorieller Darstellung wirken. Die mglichen Messwerte einer Observablen ergeben sich gem einer Wahrscheinlichkeitsverteilung.
Eine Messung verndert das System dahingehend, dass es in einen neuen Zustand bergeht, der
zum jeweiligen Messoperator gehrt. Man bezeichnet das als Zustandsreduktion des Systems.

Postulat 2 Messung
Es sei durch {M0 , . . . , Mm1 } eine Menge von Operatoren gegeben, die die Eigenschaft
besitzen
m1


Mj Mj = I,

j=0

wobei I die identische Abbildung ist und Mj der zu Mj adjungierte Operator. Ist das Quantensystem vor der Messung im Zustand , so ist die Wahrscheinlichkeit fr das Ergebnis j
gegeben durch
pj := Mj 2 ,

j = 0, . . . , m 1.

Nach der Messung mit einem Messergebnis j befindet sich das System im Zustand
1
Mj .
pj

In Abschnitt 3.2.3 wird dieses Postulat mathematisch vollstndig ausformuliert.


Sind Mj Projektoren, also
Mj = Mj

und Mj2 = Mj ,

und projizieren sie auf je orthogonale Untervektorrume, so lsst sich die Menge der Operatoren
zu einem einzelnen hermiteschen Operator A zusammenfassen, der dann Observable genannt
wird:
A :=

m1

j=0

j Mj Mj =

m1


j Mj

j=1

In diesem wichtigen Spezialfall sind die Messergebnisse die Eigenwerte 0, . . . , m 1 von A


und das System befindet sich nach der Messung in einem Eigenzustand bezglich A.

1.4 Zeitliche Dynamik des Systems

1.4

Zeitliche Dynamik des Systems

Stellt man die Frage nach der Bestimmung der rein zeitlichen Entwicklung eines quantenmechanischen Systems, gibt erneut die Schrdinger-Gleichung (1.1) Auskunft:
i

(t)
= H (t).
t

(1.11)

Da der Hamilton-Operator den Energie-Operator des gegebenen Problems darstellt (hier: nichtrelativistisches Korpuskel der Masse m, welches sich mit dem Impuls p im Potential Wpot(r, t)
bewegt), folgt in mathematischer Konsequenz, dass H hermitesch mit reellen Eigenwerten ist,
die die Observablen des Systems darstellen. Auerdem gilt, dass die Gesamtenergie des Systems eine zeitliche Erhaltungsgre ist, womit folgt:
H
= 0.
t

(1.12)

Damit lsst sich nun die Zeitentwicklung eines quantenmechanischen Systems folgendermaen
beschreiben: Zum Zeitpunkt t = 0 befindet sich das System in einem definierten Anfangszustand (0) = 0 . Somit hat die Schrdinger-Gleichung (1.11) unter Bercksichtigung von
(1.12) die Lsung


iH t
(t) = exp
0 = U (t) 0 .
(1.13)

U (t) nennt man den Zeitentwicklungsoperator des Systems. Damit folgt fr H die gruppentheoretische Interpretation als Propagator der Zeitentwicklung. Ist H in (1.11) selbstadjungiert, so ist der Zeitentwicklungsoperator U (t) des Systems zu jedem Zeitpunkt unitr, siehe
Abschnitt 3.3 auf Seite 83.
Es ergibt sich hieraus das dritte Postulat der Quantenmechanik.
Postulat 3

Zeitentwicklung des physikalischen Systems

Die zeitabhngige Entwicklung der Zustnde eines physikalischen Systems wird durch die
zeitabhngige Schrdinger-Gleichung
i

(t)
= H (t)
t

(1.14)

beschrieben. Der bei einem selbstadjungierten und zeitunabhngigen Hamiltonoperator resultierende Zeitentwicklungsoperator


iH t
U (t) = exp

ist unitr.

(1.15)

1 Grundlagen aus der Quantenmechanik

1.5

Quantenmechanik und Quantum Computation

Eine Konsequenz der Kopenhagener Deutung der Quantenmechanik ist, dass der Zustand eines quantenmechanischen Systems als Superposition von Basiszustnden begriffen wird. Damit
verbunden ist eine Wahrscheinlichkeitsverteilung, die angibt, mit welcher Wahrscheinlichkeit
das quantenmechanische System in einen dieser Basiszustnde fllt, wenn man den Systemzustand durch eine Messung bestimmt. Die Wahrscheinlichkeit, dass bei einer Messung ein
bestimmter Systemzustand gemessen wird, ist dabei durch das Betragsquadrat der Wellenfunktion bezglich dieses Zustandes gegeben. Allerdings verndert die Zeitentwicklung des Systems nach einer solchen Messung den Zustand des Systems wieder, so dass (mit Ausnahme von
Wahrscheinlichkeitsaussagen) nichts ber den Systemfolgezustand ausgesagt werden kann. Dazu ist eine erneute Messung ntig, um das System wieder in einen der mglichen Basiszustnde
zu werfen.
Ein einfaches Beispiel ist der Spin eines Teilchens, z.B. eines Elektrons. Die mglichen Basiszustnde sind Spin-up und Spin-down. ber ein ungemessenes Teilchen mit Spin
lsst sich also nur sagen, dass es einen Spin besitzt und dass man bei einer Messung den Zustand Spin-up bzw. Spin-down nur mit einer bestimmten Wahrscheinlichkeit P () bzw.
P () = 1 P () messen wird. In welchem konkreten Spin-Zustand sich das ungemessene
Teilchen befindet, lsst sich also nicht sagen. Damit lsst sich verknappt nur formulieren:
Vor der Messung:
= 1 +2 ,

P () = |1 |2 , P () = |2 |2 .

Nach der Messung:


P () = 1, P () = 0 oder P () = 0, P () = 1.
Nach der Messung bewirkt die zeitliche Entwicklung des Systems wieder eine Vernderung der
durch die Messung bestimmten Wahrscheinlichkeitsverteilung.
Aus diesem physikalischen Sachverhalt wurde die Idee des Quantum Computation basierend
auf q-Bits geboren: Quantum Computation bedeutet die Durchfhrung von Algorithmen auf
Systemen, deren Zustnde Superpositionen von Basiszustnden sind und deren zeitliche Entwicklungen sich durch (unitre) Operatoren darstellen lassen. Die Systemzustnde sind mit
Wahrscheinlichkeitsverteilungen verknpft, die die Wahrscheinlichkeiten dafr angeben, dass
eine Auswertung (Messung) der Systemzustnde bestimmte Basiszustnde ergeben.

Mathematische Grundlagen und


Notationen

Die folgende Zusammenstellung der bentigten mathematischen Grundlagen kann je nach Vorwissen selektiv gelesen werden bzw. dient als Referenz fr die im Spteren verwendeten Notationen. Um dieses Kapitel knapp zu halten, wird auf Beweise in der Regel verzichtet und
jeweils auf die Literatur verwiesen.
Fr den ersten Abschnitt 2.1 gilt dies im Besonderen, da die Theorie der Vektorrume Teil
jedes naturwissenschaftlichen und ingenieurwissenschaftlichen Studiengangs sein sollte. Eine
Vertiefung findet statt mit dem nachfolgenden Abschnitt 2.2, in dem u.a. das bentigte Skalarprodukt eingefhrt ist, welches als in der zweiten Komponente1 linear definiert wird. Damit
werden Hilbertrume definiert und die fr die Quantenalgorithmen wichtigen Operatoren auf
Hilbertrumen.
Die in der Physik und bei den Quantenalgorithmen oft gebrauchte Tensorrechnung wird in
anderen Fchern selten oder nur nebenbei betrachtet. Im Abschnitt 2.3 wird das Tensorprodukt
elementar eingefhrt, d.h. es wird ber einen konstruktiven Ansatz definiert anstatt als Element
eines gewissen Faktorraums, um die Verstndlichkeit zu erhhen.
Bei der Messung eines Quantenzustands handelt es sich um einen stochastischen Vorgang. Die
bentigten Werkzeuge aus der Wahrscheinlichkeitstheorie werden in Abschnitt 2.4 bereitgestellt.

2.1

Vektoren und Vektorrume

2.1.1

Gruppe, Ring, Krper

Definition 2.1:

Gruppe

Es sei G eine Menge mit einer inneren Verknpfung . Das Paar (G, ) heit eine Gruppe,
wenn die folgenden Eigenschaften gelten:
(i) In (G, ) gilt das assoziative Gesetz, d.h. fr alle a, b, c G gilt
a (b c) = (a b) c.
1 In vielen Mathematik-Lehrbchern wird es als in der ersten Komponente linear festgelegt, aber fr die Anwendung
erweist sich die zweite Komponente als schreibfreundlicher und wird daher in der Physik gern so gebraucht.

10

2 Mathematische Grundlagen und Notationen


(ii) Es existiert ein neutrales Element e G, d.h. fr alle a G gilt
a e = e a = a.
(iii) Zu jedem Element a G existiert ein inverses Element a1 G mit
a a1 = a1 a = e.
Gilt auerdem das kommutative Gesetz, d.h. wenn fr alle a, b G gilt
a b = b a,
so heit (G, ) eine kommutative Gruppe oder eine abelsche Gruppe2 .

(Z, +) ist damit eine kommutative Gruppe, wobei gilt:


Das neutrale Element ist die Zahl 0, da a + 0 = 0 + a = a.
Zu jedem a Z ist a das jeweilige inverse Element, welches in der Gruppendefinition
mit a1 bezeichnet wurde.
(Z, +) ist der Urtyp der Gruppen.
Gruppen mssen nicht unendlich gro sein und auch nicht unbedingt kommutativ, wie das folgende Beispiel illustriert.
Beispiel 1
Wir betrachten drei nummerierte Sitzpltze und die Menge V = {v1 , . . . , v6 } aller sechs
mglichen Vertauschungen dieser Sitzpltze. Diese Vertauschungen seien
v1
v2
v3
v4
v5
v6

= 1 1,
= 1 1,
= 1 2,
= 1 2,
= 1 3,
= 1 3,

2 2,
2 3,
2 1,
2 3,
2 1,
2 2,

3 3,
3 2,
3 3,
3 1,
3 2,
3 1.

Die Hintereinanderausfhrung u v von zwei Vertauschungen u, v V , wobei erst v und


dann u durchgefhrt wird, ergibt wieder eine Vertauschung der drei Pltze. Also ist eine
innere Verknpfung. In (V, ) gilt das assoziative Gesetz3 . v1 ist das neutrale Element, denn
v1 vj = vj v1 = vj ,
2 nach N.

H. Abel (18021829)

3 Nachweis: Fleiaufgabe!

fr alle j = 1, . . . , 6.

2.1 Vektoren und Vektorrume

11

Die inversen Elemente ergeben sich durch die Umkehrung der Vertauschung, also
v11 = v1 ,

v21 = v2 ,

v31 = v3 ,

v41 = v5 ,

v51 = v4 ,

v61 = v6 .

Damit ist (V, ) eine Gruppe. Diese Gruppe ist aber nicht kommutativ, denn es gilt:
v2 v3 = 1 3, 2 1, 3 2 = v5 ,
v3 v2 = 1 2, 2 3, 3 1 = v4 = v2 v3
In der Gruppentheorie [12, 15] werden Gruppenstrukturen untersucht und charakterisiert. Anwendungen finden sich u.a. in der Quantenphysik.
Nimmt man nun noch eine zweite Verknpfung hinzu, erhalten wir die algebraische Struktur
eines Ringes.
Definition 2.2:

Ring

Es sei R eine Menge mit zwei inneren Verknpfungen + und . Das Tripel (R, +, ) heit
ein Ring, wenn die folgenden Eigenschaften gelten:
(i) (R, +) ist eine kommutative Gruppe.
(ii) In R gilt das assoziative Gesetz bezglich , d.h. fr alle a, b, c R gilt
a (b c) = (a b) c.
(iii) Es gilt das distributive Gesetz der Verknpfung bezglich der Verknpfung +, d.h.
fr alle a, b, c R gilt
a (b + c) = (a b) + (a c),
(b + c) a = (b a) + (c a).
Gilt auerdem das kommutative Gesetz bezglich der Verknpfung , so heit (R, +, ) ein
kommutativer Ring.
Das neutrale Element bezglich der Verknpfung + wird Nullelement genannt.
Besitzt der Ring auch ein neutrales Element bezglich der Verknpfung , so nennt man es
Einselement und spricht von einem Ring mit Einselement.
(Z, +, ) ist damit ein kommutativer Ring mit Einselement, wie man sofort aus der Definition
ersieht. Das Nullelement ist natrlich die Null und das Einselement ist die Eins.
Damit haben wir zum einen alle Eigenschaften der Grundrechenarten auf der Menge der ganzen
Zahlen festgehalten, zum anderen knnen wir knftig die Eigenschaften einer Menge mit ihren
Verknpfungen beschreiben, indem wir sie als Gruppe oder Ring nachweisen.

12

2 Mathematische Grundlagen und Notationen

Definition 2.3: Krper


Es sei K eine Menge mit zwei inneren Verknpfungen + und . Das Tripel (K, +, ) heit
ein Krper, wenn die folgenden Eigenschaften gelten:
(i) (K, +) ist eine kommutative Gruppe, d.h.
(K1) In (K, +) gilt das assoziative Gesetz, d.h. fr alle a, b, c K gilt
a + (b + c) = (a + b) + c.
(K2) Es existiert ein Nullelement 0 K, d.h. fr alle a K gilt
a + 0 = 0 + a = a.
(K3) Zu jedem Element a K existiert ein inverses Element a K mit
a + (a) = (a) + a = 0,

Abkrzung: a a = a + a = 0.

(K4) In (K, +) gilt das kommutative Gesetz, d.h. fr alle a, b K gilt


a + b = b + a.
(ii) (K \ {0} , ) ist eine kommutative Gruppe, d.h.
(K5) In (K \ {0} , ) gilt das assoziative Gesetz, d.h. fr alle a, b, c K \ {0} gilt
a (b c) = (a b) c.
(K6) Es existiert ein Einselement 1 K, d.h. fr alle a K \ {0} gilt
a 1 = 1 a = a.
(K7) Zu jedem Element a K \ {0} existiert ein inverses Element a1 K \ {0}
mit
a a1 = a1 a = 1.
(K8) In (K \ {0} , ) gilt das kommutative Gesetz, d.h. fr alle a, b K gilt
a b = b a.
(iii) Es gilt das distributive Gesetz der Verknpfung bezglich der Verknpfung +.
(K9) Fr alle a, b, c K gilt
(K10) Fr alle a, b, c K gilt

a (b + c) = (a b) + (a c).
(b + c) a = (b a) + (c a).

Sind bei einem Krper (K, +, ) die Verknpfungen aus dem Kontext heraus klar, so wird
auch K als Bezeichnung fr den Krper verwendet.
In der obigen Definition haben wir alle Recheneigenschaften der rationalen Zahlen versammelt,
d.h. (Q, +, ) ist der Krper der rationalen Zahlen; abgekrzt nur Q genannt.

2.1 Vektoren und Vektorrume

13

Beispiel 2
In der digitalen Nachrichtentechnik spielt der binre Krper (B, , ) eine groe Rolle.
B := {0, 1} ist der kleinste Krper und besteht nur aus seinen beiden neutralen Elementen.
Die beiden inneren Verknpfungen sind wie folgt definiert:
1 1 = 0,
1 0 = 1,
0 1 = 1,
0 0 = 0,

1  1 = 1,
1  0 = 0,
0  1 = 0,
0  0 = 0.

Es lassen sich weitere endliche Krper mit pm Elementen konstruieren, wobei p eine Primzahl
ist, die Galoiskrper4 oder Galoisfelder genannt werden. Sie werden z.B. in der Kryptologie
zur Erzeugung von Schlsseln verwendet und dienen als Grundlage fr symbolbasierte Codes
in der Kanalcodierung; am bekanntesten sind die Reed-Solomon-Codes.

2.1.2

Vektorraum

Fr Verschiebungsvektoren aus geometrienahen Anwendungen sind eine Reihe von Gesetzmigkeiten bekannt, etwa die Gruppeneigenschaft bezglich der Addition oder die Gesetze zur
Multiplikation mit Skalaren aus R.
Nun definieren wir eine Menge mit Verknpfungen, die diesen Gesetzen folgen, als Vektorraum. Statt R knnte man auch einen anderen Krper wie Q oder C fr die Skalare verwenden;
in der Definition halten wir dies offen.
Definition 2.4:

Vektorraum

Es sei (K, +, ) ein Krper und V eine Menge mit einer inneren Verknpfung + zwischen
Elementen aus V und einer ueren Verknpfung , die fr jedes K und jedes v V
ein Element v = v V definiert.
Ein Element v V heit ein Vektor, ein Element K heit ein Skalar, und V heit ein
Vektorraum ber dem Krper K bzw. ein K-Vektorraum, wenn die folgenden Eigenschaften
gelten:
(i) (V, +) ist eine kommutative Gruppe, d.h.
(V1) In (V, +) gilt das assoziative Gesetz, d.h. fr alle u, v, w V gilt
u + (v + w) = (u + v) + w.
(V2) Es existiert ein Nullvektor 0 V , d.h. fr alle v V gilt
v + 0 = 0 + v = v.
4 Nach Evariste

Galois (18111832).

14

2 Mathematische Grundlagen und Notationen


(V3) Zu jedem Vektor v V existiert ein negativer Vektor v V mit
v + (v) = (v) + v = 0,

Abkrzung: v v = v + v = 0.

(V4) In (V, +) gilt das kommutative Gesetz, d.h. fr alle u, v V gilt


u + v = v + u.
(ii) Es gelten die folgenden Gesetze fr die Multiplikation von Skalaren mit Vektoren:
(V5) Fr alle , K und alle v V gilt
( ) v = ( v).
(V6) Fr alle , K und alle v V gilt
( + ) v = v + v.
(V7) Fr alle K und alle u, v V gilt
(u + v) = u + v.
(V8) Fr alle v V gilt
1 v = v.
Statt R-Vektorraum sagt man auch reeller Vektorraum, statt C-Vektorraum sagt man auch
komplexer Vektorraum.

Zur Vereinfachung der Schreibweise haben wir + sowohl fr die Addition zwischen Skalaren
als auch zwischen Vektoren verwendet. Ebenso wurde fr die Multiplikation zwischen Skalaren und zwischen Skalar und Vektor verwendet. Fr den Nullvektor und das Nullelement des
Krpers haben wir jeweils das Zeichen 0 verwendet; bei der Pfeilschreibweise wrde man 0
und 0 verwenden.
Merke: Jede Menge mit Verknpfungen, die die Eigenschaften von Definition 2.4 auf der vorherigen Seite erfllen, ist ein Vektorraum! Es muss keinen geometrischen oder physikalischen
Bezug fr Vektorrume geben.
Zu den einfachsten und grundlegendsten Vektorrumen gehren die Rume der n-Tupel.

2.1 Vektoren und Vektorrume

15

Vektorraum Kn

Satz und Definition 2.5

Fr einen Krper K und n N ist die Menge aller reellen n-Tupel das n-fache kartesische
Produkt
Kn := K . . . K .



n-fach

Fr die Elemente u Kn sei die Spaltenschreibweise



u1
..
u = . mit u1 , . . . , un K
un
vereinbart. Bezglich der Addition


v1
u1 + v1
u1

.. ..
..

. + . :=
.
un

vn

un + vn

und der Vervielfachung


u1
u1


... := ...
un

fr alle u1 , . . . , un , v1 , . . . , vn K

fr alle , u1, . . . , un K

un

ist Kn ein K-Vektorraum.


Beweis. Der Beweis folgt elementar aus den Krper-Eigenschaften, siehe Definition 2.3 auf
Seite 12, mit denen die nachzuweisenden Vektorraum-Eigenschaften gelten.

Der Nullvektor im Kn ist gegeben durch

0
..
. .
0
Die Spaltenschreibweise fr die n-Tupel aus Kn ist vereinbart, da diese Vektoren spter
in der Matrizenrechnung verwendet werden und selbst Spezialflle von Matrizen sind.
Durch Verwendung des Transponierungszeichens  kann man die Spalten auch platzsparend als Zeile schreiben:

u1
..

(u1 , . . . , un ) := . .
un

16

2 Mathematische Grundlagen und Notationen


Ist n = 1, so entspricht R1 dem Krper R selbst. Daher ist R selbst der einfachste reelle
Vektorraum.

Beispiel 3
Im R4 gilt:

5
4
1
2 5 7
3+6 = 9 ,
11
7
4


0
1
1
2 1 1
3 6 = 3 ,
6
2
4

1
1
2
1 2
1

3 =
3 .
2
2
4
2

Es gibt eine Vielzahl weiterer Vektorrume:


Vektorraum der Matrizen
Vektorraum der stetig differenzierbaren Funktionen
Vektorraum der Polynome
...

2.1.3

Untervektorrume

Satz und Definition 2.6 Untervektorraum


Sei V ein K-Vektorraum. Eine Teilmenge U V heit Untervektorraum von V , wenn
U = und wenn fr alle u, v U und alle K gilt:
u + v U,

u U.

Ein Untervektorraum U von V ist zusammen mit der durch V gegebenen Addition und
Skalarmultiplikation selbst ein K-Vektorraum.

Beweis.

[10]

2.1 Vektoren und Vektorrume


Satz und Definition 2.7

17

Linearkombination, lineare Hlle

Sei V ein K-Vektorraum. Sind v1 , . . . , vn V und 1 , . . . , n K, so nennt man


n


i vi = 1 v1 + . . . + n vn V

i=1

eine Linearkombination der Vektoren v1 , . . . , vn und 1 , . . . , n heien die Koeffizienten


der Linearkombination.
Die Menge aller Linearkombinationen der Vektoren v1 , . . . , vn

span {v1 , . . . , vn } := v V
v=
j vj , mit j K V

j=1

heit lineare Hlle von v1 , . . . , vn . Die lineare Hlle ist der von v1 , . . . , vn aufgespannte
Untervektorraum von V und damit selbst ein K-Vektorraum.
Beweis.

Die Summe zweier Linearkombinationen ist wieder eine Linearkombination:


n


i vi +

i=1

n


i vi =

i=1

n


(i + i )vi span {v1 , . . . , vn } .

i=1

Das -fache einer Linearkombination ist wieder eine Linearkombination:

n

i=1

i vi =

n


(i )vi span {v1 , . . . , vn } .

i=1

Nach Satz und Definition 2.6 ist die lineare Hlle damit ein Untervektorraum.

Beispiel 4
Ist V = R3 , so ist

2 2

span 3 = 3 R3 R
0 0

ein Untervektorraum von R3 . Geometrisch interpretiert handelt es sich dabei um eine Gerade im dreidimensionalen Raum durch den Nullpunkt.

18

2 Mathematische Grundlagen und Notationen

2.1.4

Lineare Unabhngigkeit
a
b
c

Abbildung 2.1: Kollineare Vektoren

Betrachtet man Verschiebungsvektoren, deren Reprsentanten parallel zueinander sind,


wie in Abbildung 2.1, so bezeichnet man sie als kollineare Vektoren (zu einer Geraden
gehrend). Zwei zueinander kollineare Vektoren a und b knnen somit durch Multiplikation mit einem Skalar ineinander bergefhrt werden, also b = a mit R; oder
allgemeiner formuliert
1a + 2b = 0 mit 1 , 2 R \ {0} .
Findet man aber keine Linearkombination dieser Art, d.h. wenn 1 = 2 = 0 sein
muss, damit 0 erzeugt werden kann, dann sind a und b nicht kollinear und werden linear
unabhngig genannt.

3c
2b

1a
Abbildung 2.2: Komplanare Vektoren

Betrachtet man Verschiebungsvektoren a, b und c, deren Reprsentanten nach geeigneter Streckung wie in Abbildung 2.2 ein Dreieck als geschlossene Vektorkette bilden, so
bezeichnet man sie als komplanare Vektoren (zu einer Ebene gehrend). Es gilt also dann
1a + 2b + 3c = 0

mit 1 , 2 , 3 R und nicht alle i sind Null.

Findet man aber keine Linearkombination dieser Art, d.h. wenn 1 = 2 = 3 = 0 sein
muss, damit 0 erzeugt werden kann, dann sind a, b und c nicht komplanar und werden
linear unabhngig genannt.
Dieser Begriff der linearen Unabhngigkeit lsst sich fr beliebige Vektorrume formulieren.

2.1 Vektoren und Vektorrume


Definition 2.8:

19

Lineare Unabhngigkeit

Sei V ein K-Vektorraum. Endlich viele Vektoren v1 , . . . , vn V heien linear unabhngig,


wenn eine Linearkombination von v1 , . . . , vn nur dann Null sein kann, wenn alle Koeffizienten der Linearkombination Null sind (triviale Linearkombination), d.h. wenn aus
1 v1 + . . . + n vn = 0
stets folgt, dass
1 = . . . = n = 0.
Anderenfalls heien die Vektoren v1 , . . . , vn linear abhngig, d.h. es gibt dann 1 , . . . , n
K, die nicht alle Null sind, mit
1 v1 + . . . + n vn = 0.
Beispiel 5
Die Vektoren v1 , v2 R3 mit


1
0
v1 := 0 , v2 := 2
0
3
sind linear unabhngig, da

0
1
1
0 = 1 v1 + 2 v2 = 0 + 22 = 22
0
32
32

nur gelten kann, wenn 1 = 2 = 0.


Mit


1
v3 := 4
6

gilt aber, dass v1 , v2 , v3 nicht linear unabhngig sind, denn es gilt


v1 2v2 + v3 = 0.
Lemma 2.9 Lineare (Un-)Abhngigkeit
Sei V ein K-Vektorraum. Vektoren v1 , . . . , vn V sind genau dann linear abhngig, wenn
einer von ihnen als Linearkombination der anderen darstellbar ist.
Beweis.

Aus
1 v1 + . . . + n vn = 0

20

2 Mathematische Grundlagen und Notationen

mit mindestens einem i = 0 folgt


vi =

1
(1 v1 + . . . + i1 vi1 + i+1 vi+1 + . . . + n vn ).
i

Umgekehrt gilt, dass wenn


vi = 1 v1 + . . . + i1 vi1 + i+1 vi+1 + . . . + n vn ,
dann gilt
0 = 1 v1 + . . . + i1 vi1 + (1)vi + i+1 vi+1 + . . . + n vn .


2.1.5

Basis und Dimension

Definition 2.10: Basis


Sei V ein K-Vektorraum. Ein n-Tupel (v1 , . . . , vn ) von Vektoren aus V heit Basis von V,
wenn gilt
(i) v1 , . . . , vn sind linear unabhngig.
(ii) V wird von den Basisvektoren aufgespannt, d.h.
V = span {v1 , . . . , vn } .
Beispiel 6
Fr den Vektorraum R3 gilt

0
0
1
span 0 , 1 , 0 = R3 .
0
1
0
Auerdem ist



1
0
0
1
1 0 + 2 1 + 3 0 = 2
3
0
0
1
nur dann Null, wenn 1 = 2 = 3 = 0, d.h. die drei Einheitsvektoren sind linear unabhngig. Damit bilden sie eine Basis des R3 ; die sogenannte kanonische Basis.

2.1 Vektoren und Vektorrume

21

Lemma 2.11 Eindeutigkeit der Basisdarstellung


Sei V ein K-Vektorraum mit einer Basis (v1 , . . . , vn ). Dann ist jedes v V in eindeutiger
Weise als
Linearkombination
der Basisvektoren darstellbar, d.h. zu jedem v V gibt es

1

genau ein ... Kn , fr das gilt
n
v = 1 v1 + . . . + n vn .

Beweis.

Da V = span {v1 , . . . , vn }, gibt es zu jedem v V eine Linearkombination


v = 1 v1 + . . . + n vn .

Ist nun durch


v = 1 v1 + . . . + n vn
eine weitere Linearkombination gegeben, dann ist
(1 1 )v1 + . . . + (n n )vn = v v = 0
Wegen der linearen Unabhngigkeit von v1 , . . . , vn folgt daraus i i = 0, also i = i fr
i = 1, . . . , n.

Man nennt die Basisdarstellung auch Komponentenzerlegung, da man einen Vektor bezglich
der Basis in Komponenten zerlegt.
Beispiel 7
Im R2 ist durch (b1 , b2 ) mit
 
1
b1 = 21 , b2 = 2 ,
3
2
eine Basis gegeben. Mit Lemma 2.11 ist jeder Vektor aus R2 eindeutig als Linearkombination dieser Basisvektoren darstellbar.
 
9
Betrachtet man v =
, so lsst sich die Komponentenzerlegung geometrisch eindeutig
8
mit einem Vektorparallelogramm durchfhren, siehe Abbildung 2.3 auf Seite 22. Im vorliegenden Beispiel gilt
1      
 
2
1
9
8


4b1 + 2b2 = 4 1 + 2 2 =
+
=
= v.
6
8
2
3
2
     
=:
v1

=:
v2

v1 und v2 nennt man auch die Vektorkomponenten von v bezglich der betrachteten Basis.

22

2 Mathematische Grundlagen und Notationen

v
v2

b2
v1
b1
Abbildung 2.3: Komponentenzerlegung eines Vektors

Satz 2.12 Basisergnzungssatz


Sei V ein K-Vektorraum und v1 , . . . , vr , w1 , . . . , ws V . Sind v1 , . . . , vr linear unabhngig
und gilt
span {v1 , . . . , vr , w1, . . . , ws } = V,
dann kann man (v1 , . . . , vr ) durch eventuelle Hinzunahme geeigneter Vektoren aus
{w1 , . . . , ws } zu einer Basis von V ergnzen.
Beweis.

[10]

Satz 2.13 Basislnge


Ist V ein K-Vektorraum und sind (v1 , . . . , vn ) und (w1 , . . . , wm) Basen von V , so ist n = m.
Beweis.

[10]

Definition 2.14: Dimension


(i) Besitzt ein K-Vektorraum V eine Basis (v1 , . . . , vn ), so heit V ein endlichdimensionaler Vektorraum und n die Dimension von V, geschrieben als dim V = n.
(ii) Besitzt ein K-Vektorraum V = {0} fr kein n N eine Basis (v1 , . . . , vn ), so heit
V ein unendlichdimensionaler Vektorraum und man schreibt dim V = .

2.1 Vektoren und Vektorrume

23

(iii) Fr den K-Vektorraum {0} setzt man dim {0} = 0.


Lemma 2.15 Dimension von Kn
Fr den K-Vektorraum Kn gilt dim Kn = n.
Die Einheitsvektoren bilden eine Basis (e1 , . . . , en ).

Beweis.

Daher ist der Raum der Ortsvektoren aus der Anschauungsebene ein zweidimensionaler Vektorraum und der gewhnliche Raum der Ortsvektoren ein dreidimensionaler Vektorraum.
Mit den entwickelten Werkzeugen ist die Behandlung hherdimensionaler Vektorrume kein
Problem. In der Physik nimmt man oft die Zeit als vierte Komponente zu den drei Raumkomponenten hinzu, d.h. man betrachtet den R4 . Zusammen mit der Zeit entsteht somit ein
vierdimensionaler Vektorraum, den man nicht unbedingt geometrisch interpretieren muss.
Satz 2.16 Eigenschaften endlichdimensionaler Vektorrume
Sei V ein K-Vektorraum mit dim V = n fr ein n N. Dann gilt:
(i) Je n linear unabhngige Vektoren aus V bilden eine Basis von V .
(ii) Ist V = span {v1 , . . . , vn }, dann ist (v1 , . . . , vn ) eine Basis von V .
(iii) Je r Vektoren aus V mit r > n sind linear abhngig.
(iv) Ist U V ein Untervektorraum von U , so ist entweder U = V oder dim U < dim V .

Beweis.

[10]

Beispiel 8
Im komplexen Vektorraum C3 sind die Vektoren

7i
1
3 + 4i
v1 := 0 , v2 := 2 + i , v3 := 5
0
5i
0
linear unabhngig. Da dim C3 = 3, ist (v1 , v2 , v3 ) eine Basis von C3 .
Im reellen Vektorraum R2 mssen die Vektoren
 
 


1
7
5
,
,
2
19
216
linear abhngig sein, da dim R2 = 2.
Sind v1 , . . . , vr , r N, Vektoren aus V \ {0} mit dim V = n, so gilt
1 dim (span {v1 , . . . , vr }) min {n, r} .

24

2 Mathematische Grundlagen und Notationen

2.2

Hilbertrume

2.2.1

Skalarprodukt und Norm

Die Abbildung
 : Rn R+
0,

x  x := !

n


x2i =

"
x21 + . . . + x2n ,

i=1

die jedem x Rn geometrisch gesehen die Lnge des Vektors zuordnet, heit euklidische Norm
auf dem Rn . Die allgemeine Normdefinition lautet wie folgt:
Definition 2.17: Norm, normierter Raum
Ist K = R oder K = C und ist V ein K-Vektorraum, so heit eine Abbildung
 : V R+
0
Norm, wenn folgende Eigenschaften gelten:
(i) Positivitt:
v 0 fr alle v V ;
v = 0 nur fr v = 0.
(ii) Linearitt:
v = || v

fr alle K, v V.

(iii) Dreiecksungleichung:
u + v u + v

fr alle u, v V.

Man nennt (V, ) dann normierter Raum.


Die euklidische Norm ist damit natrlich eine Norm. Es lassen sich viele weitere Normen finden. Auf dem R3 ist z.B.
xsum := |x1 | + |x2 | + |x3|
die Summennorm, die ebenfalls alle Normeigenschaften erfllt, aber nicht mehr die Lnge des
Vektors x berechnet.
Die Berechnung von Winkeln zwischen Vektoren spielt eine groe Rolle in der Anwendung der
Vektorrechnung und ebenfalls in der weiteren Ausarbeitung der Theorie.

2.2 Hilbertrume

25

Beispiel 9
Ein physikalisches Gesetz besagt, dass fr die Verschiebung eines Krpers der Masse m
durch eine Kraft F um ein Wegstck s eine Arbeit W der Gre
W =F s
zu leisten ist.
Wirkt nun eine vektorielle Kraft F nicht parallel zum Weg s, den der Krper nimmt, wie in
Abbildung 2.4 dargestellt, so wirkt nur die zu s parallele Komponente Fs von F .
Fr die geleistete Arbeit gilt somit
# #
# #
# #
# #
# #
# #
W = #Fs # s = #F # s cos (s, F ) = #F # s cos (F , s).

F

(s, F )
m

Fs

s

Abbildung 2.4: Komponentenzerlegung einer Kraft

Das im Beispiel verwendete Produkt zur Berechnung der Arbeit wird als Skalarprodukt bezeichnet und mit einer eigenen Bezeichnung versehen. Fr das Skalarprodukt zweier Vektoren
a und b aus Rn soll
# #
 
# #
a, b := a #b# cos (a, b)
gelten.
Die Abbildung
,  : Rn Rn R,
(x, y)  x, y :=

n


xi yi = x1 y1 + . . . + xn yn

i=1

heit Standard-Skalarprodukt auf dem Rn . Eine alternative Schreibweise fr x, y ist x y.


Die Abbildung
,  : Cn Cn C,
(x, y)  x, y :=

n

i=1

xi yi = x1 y1 + . . . + xn yn

26

2 Mathematische Grundlagen und Notationen

heit Standard-Skalarprodukt auf dem Cn . Eine alternative Schreibweise fr x, y ist x y.


Die allgemeine Skalarproduktdefinition lautet wie folgt:

Definition 2.18: Skalarprodukt, Prhilbertraum


Ist K = R oder K = C und ist V ein K-Vektorraum, so heit eine Abbildung
,  : V V K
Skalarprodukt, wenn folgende Eigenschaften gelten:
(i) (Konjugierte) Symmetrie:
u, v = v, u

fr alle u, v V.

(ii) Linearitt in der zweiten Komponente:


u, v1 + v2  = u, v1  + u, v2  fr alle u, v1 , v2 V ;
u, v = u, v
fr alle K, u, v V.
(iii) Positive Definitheit:
v, v 0 fr alle v V ;
v, v = 0 nur fr v = 0.
Man nennt (V, , ) dann K-Prhilbertraum.
Die Konjugation z = xiy fr z = x+iy C und x, y R kann fr reelle Vektorrume
weggelassen werden bzw. es gilt x = x fr alle x R.
Die Linearitt in der zweiten Komponente ist eine Konzession an die Schreibweisen in
der Quantenmechanik, da man sonst sehr oft die Linearitt in der ersten Komponente
fordert. Fr reelle Vektorrume ergibt sich auch hier kein Unterschied.
Das Standard-Skalarprodukt erfllt alle diese Eigenschaften und ist damit natrlich ein
Skalarprodukt.
Mit dieser Definition kann man nun auch Skalarprodukte z.B. fr Vektorrume von Funktionen
festlegen.

2.2 Hilbertrume

27

Definition 2.19: Winkel, orthogonale Vektoren


Es sei (V, , ) ein Prhilbertraum.
(i) Fr x, y V mit x = 0, y = 0, ist der ffnungswinkel (x, y) zwischen x und y
definiert durch
cos((x, y)) :=

Re(x, y)
,
x y

0 (x, y) .

(ii) Zwei Vektoren x, y V heien orthogonal zueinander, wenn


x, y = 0.
Man sagt dann auch, x steht senkrecht auf y und man schreibt xy, um die Orthogonalitt auszudrcken.
Lemma 2.20 Induzierte Norm auf Prhilbertrumen
Ist K = R oder K = C und ist (V, , ) ein K-Prhilbertraum, so ist durch

 : V R+
x  v, v
0,
eine Norm auf V definiert, die durch das Skalarprodukt induzierte Norm.

Beweis.

[9, 24]

Beispiel 10
Fr a, b Rn gilt mit den Eigenschaften von Definition 2.18 auf der vorherigen Seite fr
das Standard-Skalarprodukt:
2

a + b = a + b, a + b
= a, a + b + b, a + b
= a, a + a, b + b, a + b, b
2

= a + 2 a b cos (a, b) + b .


Stehen a und b aufeinander senkrecht, so ist cos (a, b) = 0. Die Vektoren a und b sind dann
die Katheten eines rechtwinkeligen Dreiecks und a + b ist die Hypotenuse. Wir erhalten
damit den Satz von Pythagoras:
2

a + b = a + b .
Die folgende Ungleichung kann oft ntzlich eingesetzt werden.

28

2 Mathematische Grundlagen und Notationen

Satz 2.21 Cauchy-Schwarzsche Ungleichung


Ist (V, , ) ein Prhilbertraum, so gilt die
| x, y | x y ,

Beweis.

2.2.2

fr alle x, y V.

[10]

Hilbertraum und Orthonormalbasis

Eine Folge (xn )nN von Vektoren xn V eines Prhilbertrumes V heit Cauchy-Folge, falls
es zu jedem > 0 ein N N gibt, so dass xn xm  < fr alle n, m > N .
Die Folge konvergiert gegen ein v V , falls es zu jedem > 0 ein N N gibt, so dass
xn v < fr alle n > N .
Definition 2.22: Hilbertraum
Es sei K = R oder K = C und (V, , ) sei ein K-Prhilbertraum mit der induzierten
Norm . (V, , ) heit ein Hilbertraum, falls er vollstndig ist, d.h. falls alle CauchyFolgen aus V bezglich  gegen ein Element aus V konvergieren.
(Cn , , ) mit dem Standard-Skalarprodukt ist ein Beispiel fr einen Hilbertraum.
Auf endlichdimensionalen Hilbertrumen lassen sich in einfacher Weise Orthogonalbasen betrachten. Dies funktioniert auch bei unendlichedimensionalen Hilbertrumen, siehe [9], aber
fr Quantencomputer gengen endlichdimensionale Hilbertrume.
Definition 2.23: Orthonormalbasis, Hilbertbasis
Es sei n N und es sei (V, , ) ein n-dimensionaler K-Hilbertraum fr K = R oder
K = C. Eine Basis (v1 , . . . , vn ) von V heit Orthonormalbasis oder Hilbertbasis, falls gilt
vj , vk  = jk ,

fr alle j, k = 1, . . . , n.

Dabei bezeichnet jk das Kronecker-Symbol mit


$
1, fr j = k,
.
jk =
0, sonst
Lemma 2.24 Hilbertbasis von Cn
Fr jedes n N bilden die Einheitsvektoren (e1 , . . . , en ) eine Orthonormalbasis von Cn
versehen mit dem Standard-Skalarprodukt.
Beweis.
toren.

Folgt sofort aus den Definitionen des Standard-Skalarprodukts und der Einheitsvek

2.2 Hilbertrume

2.2.3

29

Operatoren und Adjungierte

Definition 2.25: Lineare Abbildung


Gegeben seien ein Krper K und zwei Vektorrume V und W ber K. Eine Abbildung
f : V W
heit lineare Abbildung, wenn sie folgende beiden Forderungen erfllt:
(i) f(x + y) = f(x) + f(y),
(ii) f(x) = f(x),

fr alle x, y V .

(Additivitt)

fr alle x V und alle K.

(Homogenitt)

Definition 2.26: Linearer Operator


Es sei (V, , ) ein K-Hilbertraum fr K = R oder K = C. Eine lineare Abbildung
A : V V heit Automorphismus oder linearer Operator auf V .
Ist v V , so schreibt man auch abkrzend Av := A(v).
Lineare Abbildungen zwischen endlichdimensionalen Vektorrumen lassen sich bezglich gegebener Basen mit Hilfe einer Matrix darstellen. Ein linearer Operator A : Cn Cn wird aus
Bequemlichkeit oft mit der Matrix bezglich der Einheitsbasis identifiziert.

Satz und Definition 2.27 Adjungierter Operator


Es sei (V, , ) ein K-Hilbertraum fr K = R oder K = C. Ist A ein linearer Operator auf
V , so gibt es genau einen linearen Operator A mit der Eigenschaft
A x, y = x, Ay ,

fr alle x, y V.

A heit adjungierter Operator zu A.

Beweis.

[9]

Lemma 2.28 Eigenschaften adjungierter Operatoren


Es sei (V, , ) ein K-Hilbertraum fr K = R oder K = C. Fr alle linearen Operatoren
A, B auf V und K gilt:

(A + B) = A + B ,

(A) = A ,

A = A.

30

2 Mathematische Grundlagen und Notationen

Beweis.
&
%

(A + B) x, y = x, (A + B)y = x, Ay + x, By


%

&

= A x, y + B x, y = (A + B )x, y ;

(A) x, y = x, (A)y = x, Ay = A x, y = A x, y ;


%
&
A x, y = x, A y = A y, x = y, Ax = Ax, y .


Definition 2.29: Selbstadjungierter Operator (hermitesch)


Es sei (V, , ) ein K-Hilbertraum fr K = R oder K = C. Ein linearer Operator A heit
selbstadjungiert oder hermitesch, falls A = A gilt.

2.3

Tensorprodukt

2.3.1

Kartesisches Produkt

Die Elemente eines kartesischen Raumes V W bestehen aus den Tupeln (v, w) mit Elementen
aus V und W .

Definition 2.30: Tupel, kartesischer Produktraum


Zu einem Krper K sei V ein n-dimensionaler K-Vektorraum und W ein m-dimensionaler
K-Vektorraum.
Fr v V und w W heie (v, w) ein Tupel mit den Komponenten v und w. Die Menge
aller solchen Tupel



V W := (v, w) v V, w W
heit Produktraum (kartesisches Produkt von Vektorrumen). Auf V W sei definiert die
innere Verknpfung +
(v, w) + (
v, w)
:= (w + v, w + w),

fr alle (v, w), (


v , w)
V W

und die uere Verknpfung


(v, w) := (v, w),

fr alle

(v, w) V W, K.

2.3 Tensorprodukt

31

Satz 2.31 Vektorraumeigenschaft des kartesischen Produktraumes


Ist K ein Krper und ist V ein n-dimensionaler K-Vektorraum und W ein m-dimensionaler
K-Vektorraum, so ist der kartesische Produktraum V W mit seinen Verknpfungen ein
(n + m)-dimensionaler K-Vektorraum.
Ist (v1 , . . . , vn ) eine Basis von V und (w1 , . . . , wm ) eine Basis vom W , so ist durch
((v1 , 0), . . . , (vn , 0), (0, w1), . . . , (0, wm))
eine Basis von V W gegeben.

Definition 2.32: Mehrfache Bildung kartesischer Produkte


Zu einem Krper K seien die endlichdimensionalen Vektorrume U, V, W gegeben. Die
kanonisch isomorphen Rume (U V ) W und U (V W ) werden identifiziert und
man schreibt
U V W = (U V ) W = U (V W ).
Fr n N definiert man weiter
U n := U U . . . U

2.3.2

(n-fach).

Konstruktion des Tensorproduktes

In Analogie zu Tupeln und Produktraum werden nun Tensoren und Tensorraum eingefhrt. Ein
Tensor x y ist wie das Tupel (x, y) ein neues Objekt der Anschauung. Im Unterschied zu
den Tupeln erweitert man die Menge der Tensoren um formale Summen von Tensoren der Art
x y, die man dann auch wieder Tensoren nennt.
Definition 2.33: Tensor, Tensorraum
Zu einem Krper K sei V ein n-dimensionaler K-Vektorraum mit einer Basis (v1 , . . . , vn ),
und W sei ein m-dimensionaler K-Vektorraum mit einer Basis (w1 , . . . , wm ).
(i) Fr x V und y W heit x y ein zerlegbarer Tensor mit den Komponenten x
und y.
(ii) Die Menge

m
n 


V W := t t =
tjk vj wk mit tjk K

j=1 k=1

heit Tensorraum (Tensorprodukt von Vektorrumen) und jedes t V W heit


Tensor. t wird bezglich der gegebenen
Basen eindeutig durch die Faktoren tjk cha'n '
m
rakterisiert, die rein formal ber j=1 k=1 tjk vj wk verknpft sind.

32

2 Mathematische Grundlagen und Notationen


(iii) Es gelte die Fundamentalidentitt fr alle x =

n
'
j=1

xy =

m
n 


xj vj V, y =

m
'
k=1

yk wk W :

xj yk vj wk .

j=1 k=1

(iv) Auf V W sei definiert die innere Verknpfung +


s + t :=

m
n 


(sjk + tjk ) vj wk ,

fr alle

s, t V W

j=1 k=1

und die uere Verknpfung


t :=

m
n 


( tjk ) vj wk ,

fr alle

t V W, K.

j=1 k=1

In der Konstruktion des Tensorraumes wurden beliebige, aber fest gewhlte Basen von V und
W verwendet. Aufgrund der Fundamentalidentitt ist der Tensorraum aber unabhngig von
den jeweils gewhlten Basen. Man betrachte dazu eine alternative Basis (
v1 , . . . , vn ) von V
und eine alternative Basis (w
1, . . . , w
m ) von W mit
vp =

n


hpj vj ,

wq =

j=1

m


gqk wk .

k=1

definiert. Fr ein t V W
gilt dann
Mit diesen Basen sei nun der Tensorraum V W
t=

m
n 


tpq vp wq

p=1 q=1

( n m
m
n 


j=1 k=1

Fund.id.

n 
m


tpq

p=1 q=1

hpj tpq gqk

m
n 


hpj gqk vj wk

j=1 k=1

vj wk V W.

p=1 q=1

Entsprechend zeigt man die umgekehrte Richtung.


Der Tensorraum V W , also die Menge der Tensoren, ist somit unabhngig von der gewhlten
Basis. Die Darstellung eines Tensors mit seinen Faktoren ist aber natrlich basisabhngig.
Satz 2.34 Vektorraumeigenschaft des Tensorraumes
Ist K ein Krper und ist V ein n-dimensionaler K-Vektorraum und W ein m-dimensionaler
K-Vektorraum, so ist der Tensorraum V W mit seinen Verknpfungen ein (n m)-dimensionaler K-Vektorraum.
Ist (v1 , . . . , vn ) eine Basis von V und (w1 , . . . , wm) eine Basis vom W , so ist durch
(v1 w1 , . . . , vn wm )
eine Basis von V W gegeben.

2.3 Tensorprodukt

33

Beweis. Zum Vektorraum-Nachweis mssen die acht definierenden Eigenschaften nachgewiesen werden.
(V1) In (V W, +) gilt das assoziative Gesetz, denn fr alle t, s, u V W folgt sofort mit
Definition 2.33 auf Seite 31
t + (s + u) = (t + s) + u.
(V2) Es existiert ein Nulltensor 0 V W , nmlich
0 :=

m


0 vj wk ,

k=1

wobei fr alle t V W W gilt


t + 0 = 0 + t = t.
(V3) Zu jedem Tensor t V W existiert ein negativer Tensor t V W , nmlich
t :=

m
n 


(tjk ) vj wk

j=1 k=1

mit
t + (t) = (t) + t = 0,

Abkrzung: t t = t + t = 0.

(V4) In (V W, +) gilt das kommutative Gesetz sofort mit Definition 2.33 auf Seite 31, d.h.
fr alle s, t V W gilt
s + t = t + s.
(V5) Fr alle , K und alle t V W gilt
( ) t = ( )

m
n 


tjk vj wk

j=1 k=1

=
=

m
n 


(( ) tjk ) vj wk

j=1 k=1
m
n 


( ( tjk )) vj wk

j=1 k=1
m
n 


( tjk ) vj wk = ( t).

j=1 k=1

34

2 Mathematische Grundlagen und Notationen

(V6) Fr alle , K und alle t V W gilt


( + ) t = ( + )

m
n 


tjk vj wk

j=1 k=1

=
=
=

m
n 


(( + ) tjk ) vj wk

j=1 k=1
m
n 


(tjk + tjk ) vj wk

j=1 k=1
m
n 


tjk vj wk +

j=1 k=1

m
n 


tjk vj wk

j=1 k=1

= t + t.
(V7) Fr alle K und alle s, t V W gilt
(s + t) =

n 
m


(sjk + tjk ) vj wk

j=1 k=1

=
=

n 
m


( (sjk + tjk )) vj wk

j=1 k=1
m
n 


( sjk + tjk ) vj wk = s + t.

j=1 k=1

(V8) Fr alle t V W gilt


1t=1
=

m
n 


tjk vj wk =

j=1 k=1
m
n 


m
n 


(1 tjk ) vj wk

j=1 k=1

tjk vj wk = t.

j=1 k=1

Weiter gilt, dass ein Tensor t V W genau dann der Nulltensor ist, wenn gilt
t=

m
n 


tjk vj wk

mit tjk = 0 fr alle 1 j n, 1 k m.

j=1 k=1

Das ist aber gleichbedeutend damit, dass die Tensoren v1 w1 , . . . , vn wm linear unabhngig
sind. Da sich jeder Tensor als Linearkombination dieser Tensoren darstellen lsst, liegt damit
eine Basis vor. Somit ist V W mit seinen Verknpfungen ein (n m)-dimensionaler KVektorraum.


2.3 Tensorprodukt

35

Satz 2.35 Bilinearitt der kanonischen Abbildung


Zu einem Krper K seien die endlichdimensionalen Vektorrume V und W gegeben. Die
kanonische Abbildung
: V W V W,

(v, w)  v w

ist bilinear, d.h. fr alle x, x


V , y, y W , K gilt
(x + x) y = x y + x y,
x (y + y) = x y + x y,
(x y) = (x) y = x (y).

Beweis.
(x + x
) y =
=
=

m
n 

j=1 k=1
m
n 

j=1 k=1
m
n 


(xj + xj ) yk vj wk
(xj yk + x
j yk ) vj wk
xj yk vj wk +

j=1 k=1

m
n 


x
j yk vj wk

j=1 k=1

= xy+x
y,
x (y + y) = x y + x y (analog),
m
m
n 
n 


(x y) =
xj yk vj wk =
xj yk vj wk
j=1 k=1

=
=

m
n 

j=1 k=1
n 
m


j=1 k=1

( xj ) yk vj wk = (x) y
xj ( yk ) vj wk = x (y).

j=1 k=1


Definition 2.36: Mehrfache Bildung von Tensorrumen
Zu einem Krper K seien die endlichdimensionalen Vektorrume U, V, W gegeben. Die
kanonisch isomorphen Rume (U V ) W und U (V W ) werden identifiziert und
man schreibt
U V W = (U V ) W = U (V W ).

36

2 Mathematische Grundlagen und Notationen


Fr n N definiert man weiter
U n := U U . . . U

(n-fach).

Satz 2.37 Multilinearitt der kanonischen Abbildung


Zu einem Krper K seien die endlichdimensionalen Vektorrume V1 , . . . , Vp gegeben. Die
kanonische Abbildung
: V1 . . . Vp V1 . . . Vp ,

(v1 , . . . , vp)  v1 . . . vp

ist multilinear.
Beweis.


2.3.3

Der Beweis folgt durch induktive Anwendung von Satz 2.35 auf der vorherigen Seite.

Charakterisierungssatz des Tensorproduktes

Satz 2.38 Charakterisierungssatz des Tensorproduktes


Zu einem Krper K seien die endlichdimensionalen Vektorrume V1 , . . . , Vp und der endlichdimensionale Vektorraum U gegeben und man betrachte die kanonische Abbildung
: V1 . . . Vp V1 . . . Vp ,

(v1 , . . . , vp)  v1 . . . vp .

Zu jeder multilinearen Abbildung


B : V1 . . . Vp U
gibt es genau eine lineare Abbildung
b : V1 . . . Vp U
mit der Eigenschaft
B = b .
Das folgende Diagramm ist somit kommutativ:
V1 . . . Vp

V1 . . . Vp
b

2.3 Tensorprodukt

37

Beweis. Der Beweis wird gefhrt fr p = 2 mit V := V1 und W := V2 . Die allgemeine


Aussage folgt dann induktiv.
Im ersten Schritt wird gezeigt, dass zu einer gegebenen linearen Abbildung b : V W U
genau eine bilineare Abbildung B : V W U existiert mit B = b . Diese Aussage ist
aber trivial, da bilinear ist und b linear, d.h. B = b ist damit sofort bilinear.
Nun sei eine bilineare Abbildung B : V W U gegeben und wir konstruieren eine zugehrige lineare Abbildung b : V W U .
Die Abbildungsvorschrift fr b wird zunchst fr die zerlegbaren Tensoren x y V W
festgelegt:
b(x y) = b (x, y) := B(x, y).
Ist (v1 , . . . , vn ) eine Basis von V und (w1 , . . . , wm ) eine Basis vom W , so bedeutet dies
b(vj wk ) = B(vj , wk )

fr alle 1 j n, 1 k m,

d.h. die Abbildung b ist auf einer Basis von V W eindeutig festgelegt und somit ist ber
b(t) :=

m
n 


tjk B(vj , wk ).

j=1 k=1

die eindeutige lineare Abbildung b auf V W festgelegt. Es gilt insbesondere

m
n 
n
m



xj yk B(vj , wk ) = B
xj vj ,
yk wk = B(x, y),
b(x y) =
j=1 k=1

j=1

k=1

d.h. diese lineare Abbildung erfllt (notwendigerweise) fr alle Tensoren x y V W die


Eigenschaft
b(x y) = b (x, y) := B(x, y).


38

2.3.4

2 Mathematische Grundlagen und Notationen

Tensorprodukt von Hilbertrumen

Das Tensorprodukt von Hilbertrumen ist in kanonischer Weise selbst ein Hilbertraum.

Satz 2.39 Tensorprodukt von Hilbertrumen


Es sei (V, +, , , V ) ein n-dimensionaler C-Hilbertraum mit einer Basis (v1 , . . . , vn ),
und (W, +, , , W ) sei ein m-dimensionaler C-Hilbertraum mit einer Basis (w1 , . . . , wm ).
Dann ist durch
,  : (V W ) (V W ) C
m 
m
n 
n 

(t, s) 
tjk spq vj , vp V wk , wq W
j=1 k=1 p=1 q=1

ein Skalarprodukt auf V W gegeben. Insbesondere gilt


x y, x
y = x, x
V y, yW

fr alle x y, x
y V W.

Sind (v1 , . . . , vn ) und (w1 , . . . , wm) jeweils Orthonormalbasen, so gilt


t, s =

m
n 


tjk sjk

fr alle t, s V W.

j=1 k=1

(V W, +, , , ) ist ein (n m)-dimensionaler C-Hilbertraum.

Beweis. Der Beweis der Skalarprodukteigenschaft erfolgt durch einfaches Nachprfen: Man
betrachte t, s, r V W und C:
s, t =

n 
n 
m 
m


sjk tpq vj , vp V wk , wq W

j=1 k=1 p=1 q=1

=
=
t, s + r =

n 
n 
m 
m

j=1 k=1 p=1 q=1
m 
n 
m
n 

p=1 q=1 j=1 k=1
m 
m
n 
n 


sjk tpq vp , vj V wq , wk W


tpq sjk vp , vj V wq , wk W = t, s .
tjk (spq + rpq ) vj , vp V wk , wq W

j=1 k=1 p=1 q=1

= t, s + t, r .
m 
n 
n 
m

t, s =
tjk (spq ) vj , vpV wk , wq W = t, s .
j=1 k=1 p=1 q=1

2.3 Tensorprodukt

39

Sind (v1 , . . . , vn ) und (w1 , . . . , wm) jeweils Orthonormalbasen, so gilt


vj , vp V = jp

wk , wq W = kq

und

und damit
m
n 


t, s =

tjk sjk

fr alle t, s V W.

j=1 k=1

Mit dieser Darstellung folgt auch sofort


t, t =

m
n 


tjk tjk =

j=1 k=1

m
n 


|tjk |2 0

und

t, t = 0 nur fr t = 0.

j=1 k=1

Schlielich betrachte man fr beliebige Basen noch


x=

n


xj vj , x
=

j=1

n


x
p vp V,

y=

p=1

m


yk wk , y =

m


yq wq W.

q=1

k=1

Es gilt:
x y, x
y =

m 
m
n 
n 


xj yk x
p yq vj , vp V wk , wq W

j=1 k=1 p=1 q=1

* n

j=1

xj vj ,

n


x
p vp

p=1

*m


yk wk ,

k=1

m

q=1

+
yq wq
W

= x, x
V y, yW
Die Vollstndigkeit von V W zeigt man elementar ber Verwendung von Orthonormalbasen.


2.3.5

Tensorprodukt von Tupelrumen

Das Tensorprodukt zweier Tupelrume Kn und Km ergibt einen (n m)-dimensionalen Vektorraum Kn Km . Dieser knnte mit dem Matrizenvektorraum Kn,m identifiziert werden, aber
diese Identifikation ist nicht vertrglich mit einer mehrfachen Anwendung des Tensorproduktes. Daher identifiziert man Kn Km mit Knm , wobei die Basis lexikographisch angeordnet
wird.
Definition 2.40: Kanonisches Tensorprodukt von Tupelrumen
Gegeben seien ein Krper K und n, m N. Weiter seien e1 , . . . , en und f1 , . . . , fm die
Einheitsvektoren von Kn und Km und es seien g1 , . . . , gnm die Einheitsvektoren von Knm .
Das kanonische Tensorprodukt sei definiert durch die Identifikation
Kn Km Knm ,
wobei die Basis des Kn Km in lexikographischer Reihenfolge der Basis des Knm zugeordnet werde, also
ej fk = g(j1)m+k

fr alle 1 j n, 1 k m.

40

2 Mathematische Grundlagen und Notationen

Lemma 2.41 Kanonisches Tensorprodukt


Gegeben seien ein Krper K und n, m N. Unter Verwendung des kanonischen Tensorproduktes gilt:

x1 y1
x1 y2
.

..
x1
y1

x1 ym
x2 y2 x y
. . = 2 1 . fr alle x Kn , y Km .
. . .
.
.
.
.
xn
ym
x y
2 m
.
..

xn ym

Beweis. Der Beweis folgt mit Definition 2.33 auf Seite 31 und Definition 2.40 auf der vorherigen Seite.

Lemma 2.42 Vertrglichkeit der Tensorraumidentifikation
Gegeben seien ein Krper K und n, m, p N. Die Identifikation des Tensorraumes mit
einem Tupelraum ist vertrglich mit der mehrfachen Produktbildung, d.h. es gilt
(Kn Km ) Kp = Knm Kp = Knmp = Kn Kmp = Kn (Km Kp ) ,
(x y) z = x (y z) fr alle x Kn , y Km , z Kp .

Beweis. Der Beweis folgt sofort aufgrund der Erweiterbarkeit der lexikographischen Anordnungstruktur.


2.4 Wahrscheinlichkeitstheoretische Begriffe und Grundlagen

41

Beispiel 11
Fr alle x K2 , y K3 und z K2 gilt:

x1 y1 z1
x1 y1 z2

x1 y2 z1

x1 y2 z2


x y z
 
 
y1
1 3 1
x1
z
x y z
y2 1 = 1 3 2 .
xyz =
x2
x2
x2 y1 z1
y3
x y z
2 1 2
x y z
2 2 1
x y z
2 2 2
x2 y3 z1
x2 y3 z2

2.4

Wahrscheinlichkeitstheoretische Begriffe und


Grundlagen

Im Folgenden werden grundlegende Begriffe der Wahrscheinlichkeitstheorie eingefhrt, die


hier Verwendung finden. Dieser berblick folgt der Darstellung in [11, 1719, 22].

2.4.1

Mae auf -Algebren

Wir betrachten eine beliebige nichtleere Basismenge . Eine Menge F P() wird als
Mengensystem (ber ) bezeichnet, wobei P die Potenzmenge (Menge aller Teilmengen) von
darstellt. Mit R := R {, +} wird eine Erweiterung der Menge aller reellen Zahlen
definiert. Die algebraische Struktur von R wird folgendermaen auf R erweitert: Fr alle a R
gilt:
a + () = () + a = () + () = (), + () = +,

(), fr a > 0,
0,
fr a = 0,
a () = () a =
(), fr a < 0,
a
() () = +, () () = ,
= 0.

Somit ist R kein Krper. Die Vorzeichen bei drfen bei den obigen Formeln nicht kombiniert werden, denn der Ausdruck +(+) ist nicht definiert. Die Bedeutung der Festlegung
0 () = () 0 = 0 wird spter deutlich. Vorsicht ist allerdings bei den Grenzwertstzen
geboten:


1
lim
= (+) 0 = 0.
x
x+
x

42

2 Mathematische Grundlagen und Notationen

Ergnzt man die Ordnungsstruktur von R durch < a, a < + fr alle a R und <
+, so ist (R, ) eine geordnete Menge. Aufgrund topologischer berlegungen knnen wir
unter Verzicht auf die entsprechenden Grenzwertstze vereinbaren, dass die Folge (n)nN den
Grenzwert + R besitzt. Fr + schreiben wir oft . In Analogie zur Berechnung
von Volumina in der Geometrie versucht man, Mengen aus einem Mengensystem F ber
Mae (Volumina) zuzuordnen. Zu diesem Zweck zeichnet man spezielle Funktionen aus.
Definition 2.43: (-endliches) Ma
Sei F P(), F. Eine Funktion : F R heit Ma auf F , falls die folgenden
Bedingungen erfllt sind:
(M1) (A) 0

fr alle A F ,

(M2) () = 0,
(M3) Fr jede Folge (Ai )iN paarweise disjunkter Mengen mit Ai F ,

,
i N, und
Ai F gilt:
i=1

(
-

)
Ai

i=1

(Ai )

(-Additivitt).

i=1

Besitzen fr eine Folge (Bi )iN mit Bi Bi+1 , Bi F und


i N, ein endliches Ma, so wird als -endlich bezeichnet.

,
i=1

Bi = alle Mengen Bi ,

Es wre naheliegend, Mae auf der Potenzmenge von zu betrachten. Allerdings ist diese Vorgehensweise problematisch, da es zum Beispiel nicht mglich ist, ein translationsinvariantes
Ma auf der Potenzmenge des R3 mit (R3 ) = 1 zu finden. Daher hat man sich im Allgemeinen mit speziellen Mengensystemen ber (Teilmengen der Potenzmenge) zu begngen.
Dies fhrt auf den Begriff der -Algebra.
Definition 2.44: -Algebra
Ein Mengensystem S P() heit -Algebra ber , falls die folgenden Axiome erfllt
sind:
(S1) S,
(S2) Aus A S folgt Ac := \ A S,
(S3) Aus Ai S, i N, folgt

,
i=1

Ai S.

Die folgende Eigenschaft von -Algebren ist wichtig.

2.4 Wahrscheinlichkeitstheoretische Begriffe und Grundlagen

43

Satz 2.45 Durchschnittsstabilitt von -Algebren


Sei I eine.beliebige nichtleere Menge und Si fr jedes i I eine -Algebra ber , so
ist auch
Si eine -Algebra ber . Diese Eigenschaft wird Durchschnittsstabilitt von
iI

-Algebren genannt.
Wir knnen also von erzeugten -Algebren sprechen.
Definition 2.46: Erzeugte -Algebra
Sei F P() und sei .die Menge aller -Algebren ber , die F enthalten, dann wird
die -Algebra (F ) :=
S als die von F erzeugte -Algebra bezeichnet.
S

Fr = Rn , n N, betrachten wir die -Algebra


Bn = ({([a1 , b1 [ . . . [an , bn [) Rn ; ai bi , i = 1, . . . , n}),
wobei [a1 , b1 [ . . . [an , bn [ := , falls aj bj fr mindestens ein j {1, . . . , n}. Auf dieser
-Algebra lsst sich nun ein eindeutiges Ma n durch
n
/
(b ai ), falls alle bi > ai ,
n (([a1 , b1 [ . . . [an , bn [) Rn ) = i=1 i

0,
sonst
festlegen. Dieses Ma heit Lebesgue-Borel-Ma. Die -Algebra Bn wird als Borelsche Algebra bezeichnet. Alle fr die Praxis wichtigen Teilmengen des Rn (etwa alle offenen, abgeschlossenen und kompakten Teilmengen) sind in Bn enthalten. Das Ma n ist unter allen
translationsinvarianten Maen auf Bn das einzige Ma mit ([0, 1[ . . . [0, 1[) = 1. Sei
nun ein Ma auf einer -Algebra S ber , so heit jede Menge A S mit (A) = 0 eine
-Nullmenge. Es ist nun naheliegend, jeder Teilmenge B A einer -Nullmenge ebenfalls
das Ma (B) = 0 zuzuordnen. Allerdings ist nicht gewhrleistet, dass fr jedes B A auch
B S gilt. Das fhrt zum Begriff der Vervollstndigung und des vollstndigen Maes.
Definition 2.47: Vollstndiges Ma, Vervollstndigung
Ein Ma auf einer -Algebra S ber heit vollstndig, falls jede Teilmenge einer Nullmenge zu S gehrt und damit eine -Nullmenge ist. Ist nicht vollstndig, so heit die
-Algebra
S0 := {A N ; A S, N Teilmenge einer -Nullmenge}
-Vervollstndigung von S. Mit 0 (A N ) := (A) ist 0 ein vollstndiges Ma auf S0 .
Die Mengen der -Algebra B0n heien Lebesgue-messbare Mengen. Das Ma n0 auf B0n heit
Lebesgue-Ma. Die zugehrigen Nullmengen heien Lebesguesche Nullmengen.
Betrachtet man eine Funktion F : R R mit folgenden Eigenschaften:

44

2 Mathematische Grundlagen und Notationen


F ist monoton steigend,
F ist stetig von links,

so ist durch

F ([a, b[ R) :=

F (b) F (a),

falls < a < b <

lim F (b) F (a),

falls < a < b =

F (b) lim F (a), falls = a < b <


a

lim
F
(b)
lim F (a), falls = a, b =

b
0,
falls a b

ein eindeutiges Ma F auf B definiert. Dieser Sachverhalt fhrt zu folgender Definition.


Definition 2.48: Maerzeugende Funktion
Eine monoton steigende Funktion F : R R, die stetig von links ist, heit maerzeugende
Funktion.
F
Das Ma F heit Lebesgue-Borel-Stieltjes-Ma. Das vollstndige Ma F
0 auf der -VerF
F
vollstndigung B0 von B heit Lebesgue-Stieltjes-Ma. Die Mengen A B0 heien LebesgueStieltjes-messbar. Durch analoge Vorgehensweise lassen sich maerzeugende Funktionen auf
= Rn definieren. Wir wollen darauf aber nicht nher eingehen.

Definition 2.49: Messraum, Maraum


Ist S eine -Algebra ber , so heit das Paar (, S) Messraum. Ist ein Ma auf S, so
heit das Tripel (, S, ) Maraum.
Nun untersuchen wir spezielle Funktionen zwischen zwei Grundmengen 1 , 2 = .
Definition 2.50: Messbare Abbildung
Seien (1 , S1 ) und (2 , S2 ) zwei Messrume.
Eine Abbildung T : 1 2 mit T 1 (A
) := {x 1 ; T (x) A
} S1 fr alle
A
S2 heit S1 -S2 -messbar.
Messbare Abbildungen spielen in der Wahrscheinlichkeitstheorie bei der Definition von Zufallsvariablen eine wichtige Rolle. Der folgende Satz zeigt, dass fr den Nachweis der Messbarkeit einer Abbildung nicht immer das Urbild T 1 (A
) fr alle Mengen A
S2 untersucht
werden muss.

2.4 Wahrscheinlichkeitstheoretische Begriffe und Grundlagen

45

Satz 2.51 Messbarkeit bei einer erzeugten -Algebra


Seien (1 , S1 ) und (2 , S2 ) zwei Messrume, wobei S2 = (F ) von einem Mengensystem
F erzeugt ist. Die Abbildung T : 1 2 ist genau dann S1 -S2 -messbar, falls T 1 (A
)
S1 fr alle A
F .

Sind drei Messrume (1 , S1 ), (2 , S2 ), (3 , S3 ) und zwei Abbildungen


T1 : 1 2 , T1 S1 -S2 -messbar,
T2 : 2 3 , T2 S2 -S3 -messbar,
gegeben, so ist die Abbildung
T2 T1 : 1 3 ,  T2 (T1 ()), S1 -S3 -messbar.

Satz 2.52 Bildma


Seien (1 , S1 , 1 ) ein Maraum, (2 , S2 ) ein Messraum und T : 1 2 S1 -S2 -messbar,
so ist durch
1
2
2 (A
) := 1 T 1 (A
) , A
S2 ,
ein Ma 2 auf S2 definiert.
Das Ma 2 wird als Bildma von 1 bezeichnet mit der Schreibweise 2 = T (1 ).

2.4.2

Der Integralbegriff von Lebesgue

Um Zufallsgren analysieren zu knnen, bentigt man einen Integralbegriff. Daher soll im


Folgenden kurz die Integrationstheorie fr messbare Abbildungen zusammengefasst werden.
Zunchst betrachten wir die Integration einer speziellen Klasse von Funktionen.

Definition 2.53: elementare Funktion


Sei (, S) ein Messraum. Eine S-B-messbare Funktion e : R heit elementare
Funktion, falls sie nur endlich viele verschiedene Funktionswerte annimmt.

Eine spezielle elementare Funktion ist die Indikatorfunktion


$
IA : R,

1, falls A
0, sonst

die anzeigt, ob Element einer Menge A S ist. Mit Hilfe von Indikatorfunktionen lassen
sich die elementaren Funktionen darstellen.

46

2 Mathematische Grundlagen und Notationen

Satz 2.54 Darstellung elementarer Funktionen


Sei (, S) ein Messraum. Ist e : R eine elementare Funktion, so existieren eine natrliche Zahl n, paarweise disjunkte Mengen A1 , . . . , An S und reelle Zahlen 1 , . . . , n
mit:
e=

n


i IAi ,

i=1

n


Ai = .

i=1

Die eben betrachtete Darstellung von e heit eine Normaldarstellung von e. Sind alle i paarweise verschieden, so spricht man von einer krzesten Normaldarstellung von e. Krzeste Normaldarstellungen sind eindeutig. Aus der Normaldarstellung elementarer Funktionen folgt sofort: Summe, Differenz und Produkt elementarer Funktionen sind elementare Funktionen. Fr
alle c R ist auch c e eine elementare Funktion, wenn e eine elementare Funktion ist.
Nun betrachten wir nichtnegative elementare Funktionen auf einem Maraum (, S, ) und
definieren das (-)Integral dieser Funktionen.
Definition 2.55: (-)Integral nichtnegativer elementarer Funktionen
Sei (, S, ) ein Maraum und e : R+
0, e =

n
'
i=1

i IAi , i 0, i = 1, . . . , n, eine

nichtnegative elementare Funktion in Normaldarstellung, so wird





e d :=

e d :=

n


i (Ai )

i=1

als (-)Integral von e ber bezeichnet.


3
3
Damit e d wohldefiniert ist, ist natrlich zu zeigen, dass e d unabhngig von der Wahl
der Normaldarstellung fr e ist.
Sei nun E die Menge aller nichtnegativen elementaren Funktionen auf (, S, ), so erhalten
wir eine Abbildung

Int : E R+
,
e


e d.
0
Die folgenden Eigenschaften von Int lassen sich leicht nachweisen:

IA d = (A) fr alle A S.
3
(e)d = e d fr alle e E, R+
0.
3
3
3
(u + v)d = u d + v d fr alle u, v E.
3
3
Ist u() v() fr alle , so ist u d v d fr alle u, v E.
3

2.4 Wahrscheinlichkeitstheoretische Begriffe und Grundlagen

47

Whlen wir = Rn , S = Bn , = n und f : R+


0 , x  0, so erhalten wir


0 dn = 0 n (Rn ) = 0 = 0.

f dn =

Unsere Vereinbarung 0 = 0 erlaubt uns somit, das (n -)Integral ber die Nullfunktion zu
berechnen.
Betrachtet man die Menge R der um {} erweiterten reellen Zahlen, so bildet die Menge


B := A P(R); A R B
eine -Algebra ber R. Um nun den Integralbegriff auf eine grere Klasse von Funktionen
fortzusetzen, bentigen wir die folgende Definition.
Definition 2.56: numerische Funktion
Eine auf einer nichtleeren Menge A definierte Funktion f : A R heit numerische
Funktion.
Nun betrachten wir nichtnegative numerische Funktionen, die als Grenzwert einer Folge elementarer Funktionen gegeben sind.
Satz 2.57 Grenzwerte spezieller Folgen elementarer Funktionen

Seien (, S) ein Messraum und f : R+


0 eine nichtnegative, S-B-messbare numerische
Funktion, so gibt es eine monoton steigende Folge (en )nN von nichtnegativen elementaren
Funktionen en : R+
0 , n N, die punktweise gegen f konvergiert. Wir schreiben dafr:
en f.
Nach diesen Vorbereitungen sind wir in der Lage, die (-)Integration auf eine spezielle Klasse
von Funktionen in naheliegender Weise fortzusetzen.
Definition 2.58: (-)Integral fr messbare, nichtnegative numerische Funktionen

Seien (, S, ) ein Maraum und f : R+


0 eine S-B-messbare, nichtnegative numerische Funktion. Sei ferner (en )nN eine monoton steigende Folge nichtnegativer elementarer
Funktionen en : R+
0 , n N, mit en f, so definieren wir durch



en d
f d := f d := lim
n

das (-)Integral von f ber .


Da die approximierende Folge elementarer Funktionen fr f nicht eindeutig ist, muss natrlich
erwhnt werden, dass das eben definierte Integral wohldefiniert ist. Wir werden nun in einem
letzten Schritt die Klasse der integrierbaren Funktionen erweitern. Dazu dient die folgende
Definition.

48

2 Mathematische Grundlagen und Notationen

Definition 2.59: Positivteil, Negativteil einer numerischen Funktion

Seien (, S) ein Messraum und f : R eine S-B-messbare


numerische Funktion, so
wird die Funktion
4
f(), falls f() 0
+
+
f : R0 , 
0, sonst
Positivteil von f und die Funktion
4
f(), falls f() 0
,


f : R+
0
0,
sonst
Negativteil von f genannt.
Die folgenden Eigenschaften von f + und f sind unmittelbar einzusehen:
f + () 0, f () 0 fr alle .

numerische Funktionen.
f + und f sind S-B-messbare
f = f+ f.
Mit Hilfe des Positiv- und Negativteils einer messbaren numerischen Funktion f : R
knnen wir das (-)Integral auf messbare numerische Funktionen erweitern.
Definition 2.60: (-)integrierbar, (-)quasiintegrierbar, (-)Integral

Seien (, S, ) ein Maraum und


3 +f : R eine3 S-B-messbare numerische Funktion.
f heit (-)integrierbar, falls f 3d < und f d
3 < .
f heit (-)quasiintegrierbar, falls f + d < oder f d < .
Ist f (-)quasiintegrierbar, so ist durch




f d := f d := f + d f d

das (-)Integral von f ber definiert.


Als (-)Integral ber einer Menge A S definieren wir fr (-)quasiintegrierbares f IA :


f d := f IA d.
A

Betrachtet man speziell den Maraum (Rn , Bn , n ), so wird das (n -)Integral als LebesgueIntegral bezeichnet. Ist f (n -)integrierbar, so heit f Lebesgue-integrierbar. Ist ein Ma F
durch eine maerzeugende Funktion F : Rn R gegeben, so wird das (F -)Integral als
Lebesgue-Stieltjes-Integral bezeichnet und in der Form


f dF := f dF
geschrieben. Lebesgue-Stieltjes-Integrale besitzen die wichtige Eigenschaft, dass sie hufig
durch Riemann-Integrale berechnet werden knnen.

2.4 Wahrscheinlichkeitstheoretische Begriffe und Grundlagen

2.4.3

49

Wahrscheinlichkeitsrume und Zufallsvariablen

In der Wahrscheinlichkeitstheorie werden Methoden zur Beschreibung und Analyse von Zufallsexperimenten (Experimente mit nicht vorhersehbarem Ausgang) bereitgestellt (fr Details
sei auf [1, 2, 19, 23] verwiesen). Der umgangssprachliche Begriff Zufallsexperiment wird
durch einen Maraum (, S, P ) mit der Eigenschaft P () = 1 mathematisch przisiert. Wir
definieren daher:

Definition 2.61: Wahrscheinlichkeitsraum, Wahrscheinlichkeitsma, Ereignis


Ein Maraum (, S, P ) mit P () = 1 wird als Wahrscheinlichkeitsraum bezeichnet. Die
Punkte heien Ergebnisse, die Mengen A S Ereignisse. Das Ma P wird als
Wahrscheinlichkeitsma bezeichnet. Fr alle Ereignisse A wird P (A) die Wahrscheinlichkeit von A genannt.

Wir werden im Folgenden davon ausgehen, dass ein Zufallsexperiment durch einen Wahrscheinlichkeitsraum (, S, P ) gegeben ist. Es ist in der Praxis oft nicht leicht, ein verbal formuliertes Zufallsexperiment durch einen Wahrscheinlichkeitsraum zu modellieren insbesondere
dann, wenn das Experiment ungenau formuliert ist. Die Elemente der Menge stellen die
mglichen Ergebnisse des Zufallsexperimentes dar.

Beispiel 12: Scheibenschieen


Wir betrachten das Schieen mit einem Gewehr auf eine kreisfrmige Schiescheibe mit
dem Radius r = 1 und dem Mittelpunkt m = (0, 0) . Wir nehmen an, dass bei jedem
Schuss die Scheibe getroffen wird. Als Ergebnis eines Schusses erhalten wir einen Punkt
= (1 , 2 ) := K 1

,0

1
:= {x R2 ; x2 }.

Wir whlen S := {A K 1 ,0 ; A B2 } als -Algebra und P = 2 |S als Wahrschein


lichkeitsma auf S. Da der Schtze bei jedem Schuss umso mehr Punkte (Ringe) erhlt, je
kleiner der Abstand seines Schusses zum Mittelpunkt der Schiescheibe ist, interessiert als
Ergebnis in erster Linie dieser Abstand zum Mittelpunkt.
Man betrachtet also eine Funktion
1
d : [0, ] =:
,  2 .

Kann man nun mit Hilfe der Funktion d und des Wahrscheinlichkeitsraumes (, S, P ) jeder
Menge A S
:= {B [0, 1 ]; B B} eine Wahrscheinlichkeit zuordnen? Dies ist genau
dann mglich, wenn d S-S
-messbar ist.

50

2 Mathematische Grundlagen und Notationen

Definition 2.62: (n-dimensionale reelle, numerische) Zufallsvariable


Seien (, S, P ) ein Wahrscheinlichkeitsraum und (
, S
) ein Messraum, dann heit eine
S-S
-messbare Funktion X :
Zufallsvariable.
Ist
= Rn , n N, und S
= Bn , so wird X als n-dimensionale reelle Zufallsvariable
so wird X als numerische Zufallsvariable bezeichnet.
bezeichnet. Ist
= R und S
= B,
Eine eindimensionale reelle Zufallsvariable wird reelle Zufallsvariable genannt.
Als geeignetes Wahrscheinlichkeitsma P
auf S
ergibt sich das Bildma von X. Somit erhalten wir fr unser obiges Beispiel P
(A
) = P (d1 (A
)) fr alle A
S
. Die Tatsache,
dass 2 ({}) = 0 fr alle K 1 ,0 , verdeutlicht den Sinn der Verwendung von Ereignissen

A S.
Definition 2.63: Verteilung einer Zufallsvariablen, Bildma
Seien (, S, P ) ein Wahrscheinlichkeitsraum, (
, S
) ein Messraum und X :

eine Zufallsvariable, dann wird das Bildma PX von X Verteilung von X genannt.
Nach unserer Interpretation von Wahrscheinlichkeitsrumen ist der Wert X() einer Zufallsvariablen an der Stelle vom Ergebnis eines Zufallsexperimentes abhngig. Wir fragen danach,
welcher Wert von X zu erwarten ist.
Definition 2.64: Erwartungswert einer numerischen Zufallsvariablen
Seien (, S, P ) ein Wahrscheinlichkeitsraum und X eine (P -)quasiintegrierbare numerische Zufallsvariable X : R, dann wird durch

E (X) := X dP
der Erwartungswert von X definiert.
Den Erwartungswert einer n-dimensionalen reellen Zufallsvariablen definiert man durch komponentenweise Bildung des Erwartungswertes.
Um eine Vorstellung vom Begriff des Erwartungswertes zu bekommen, betrachten wir die folgende reelle Zufallsvariable auf (, S, P ): Seien A1 , . . . , An paarweise disjunkte Mengen aus
n
'
S mit
Ai = und 1 , . . . , n nichtnegative reelle Zahlen, dann ist
i=1

X : R, 

n


i IAi ()

i=1

eine reelle Zufallsvariable. Fr den Erwartungswert von X erhalten wir


E (X) =

n

i=1

i P (Ai ).

2.4 Wahrscheinlichkeitstheoretische Begriffe und Grundlagen

51

Der Erwartungswert ist in diesem Fall also eine gewichtete Summe der mglichen Werte von
X, wobei die Gewichte gerade die Wahrscheinlichkeiten fr das Auftreten dieser Werte sind.
Gilt P (Ai ) = n1 fr alle i = 1, . . . , n, so erhalten wir als Erwartungswert das arithmetische
Mittel der Werte von X.
Ist eine reelle Zufallsvariable (P -)integrierbar, so lsst sich der Erwartungswert von X auch
mit Hilfe des Bildmaes PX berechnen:


E (X) = x dPX (x) := f dPX mit f : R R, x  x.
Da wir auch an Erwartungswerten von speziellen Funktionen von X interessiert sind, bentigen
wir den folgenden Satz.
Satz 2.65 Messbarkeit stetiger Funktionen reeller Zufallsvariablen
Seien X eine reelle Zufallsvariable definiert auf dem Wahrscheinlichkeitsraum (, S, P )
und g : R R eine stetige Funktion, dann ist g X : R, g(X()) eine reelle
Zufallsvariable auf (, S, P ).
Somit folgt sofort, dass fr eine reelle Zufallsvariable X auf (, S, P ) und fr jedes k N
und jedes R auch (X )k und |X |k reelle Zufallsvariablen auf (, S, P ) sind. Dies
ermglicht die folgende Definition.
Definition 2.66: zentrierte (absolute) Momente k-ter Ordnung
Sei X eine auf
(, S, P ) definierte reelle Zufallsvariable,
1 dem Wahrscheinlichkeitsraum
2
dann heit E |X |k , k N, das in zentrierte
2Moment k-ter Ordnung von
1 absolute
k
k
X. Ist (X ) (P -)quasiintegrierbar, so heit E (X ) das in zentrierte Moment
k-ter Ordnung. Ist = 0, so spricht man nur von absoluten Momenten bzw. Momenten
k-ter Ordnung.
Besonders interessant ist der Fall k = 2.
Definition 2.67: Varianz einer reellen Zufallsvariablen
Sei X eine auf dem Wahrscheinlichkeitsraum (, S, P ) definierte, (P -)integrierbare reelle
Zufallsvariable, dann heit

2
Var (X) := (X E (X)) dP
die Varianz von
X.
Die Zahl = Var (X) wird als Streuung oder Standardabweichung von X bezeichnet.
Oft schreibt man 2 fr Var (X). Die Varianz ist ein Ma fr die zu erwartende Abweichung
von X und E (X).

52

2 Mathematische Grundlagen und Notationen

Lemma 2.68 Standardisierung


Sei X eine auf dem Wahrscheinlichkeitsraum (, S, P ) definierte, (P -)integrierbare reelle
Zufallsvariable mit Streuung 0 < < . Dann ist
Y :=

X E (X)

eine Zufallsvariable mit Erwartungswert E (Y ) = 0 und Varianz Var (Y ) = 1.

Den bergang von X zu Y bezeichnet man als Standardisierung von X.

2.4.4

Charakterisierung von Verteilungen

Im Folgenden betrachten wir einige wichtige Begriffe der elementaren Wahrscheinlichkeitstheorie. Ausgangspunkt ist der Wahrscheinlichkeitsraum (, S, P ) und zwei Mengen A, B S
mit P (B) > 0. Auf S definieren wir nun ein Wahrscheinlichkeitsma P B : S [0, 1] durch
A  P P(AB)
. Durch den bergang von P zu P B erhlt die Menge B das Wahrscheinlich(B)
keitsma 1. Wir interpretieren P B (A) als die Wahrscheinlichkeit von A unter der Bedingung,
dass das Ereignis B (P B -)fast sicher eintrifft. Dies fhrt zur Definition der bedingten Wahrscheinlichkeit.

Definition 2.69: bedingte Wahrscheinlichkeit


Sei (, S, P ) ein Wahrscheinlichkeitsraum und A, B S mit P (B) > 0. Dann heit

P (A|B) :=

P (A B)
P (B)

die (bedingte) Wahrscheinlichkeit von A unter der Bedingung B.

2.4 Wahrscheinlichkeitstheoretische Begriffe und Grundlagen

53

Satz 2.70 Formel von der totalen Wahrscheinlichkeit, Satz von Bayes
Sei (, S, P ) ein Wahrscheinlichkeitsraum und {Di ; i N} eine Partition5 von , so
dass Di S und P (Di ) > 0 fr alle i N.
(i) Es gilt die Formel von der totalen Wahrscheinlichkeit:
P (A) =

P (Di ) P (A|Di ),

fr alle A S.

i=1

(ii) Ist A S mit P (A) > 0, so gilt


P (Di |A) =

P (A|Di ) P (Di )
,
P (A)

fr alle i N.

(iii) Es gilt der Satz von Bayes:


P (A|Di ) P (Di )
,
P (Di |A) = '

P (Dj ) P (A|Dj )

fr alle i N.

j=1

Analoge Formeln ergeben sich natrlich fr eine endliche Partition {Di ; i = 1, . . . , n}


von .
Es soll nun die Frage untersucht werden, unter welchen Voraussetzungen ein Wahrscheinlichkeitsma P in der folgenden Art und Weise durch ein Ma dargestellt werden kann.
Definition 2.71: Dichte
Sei (, S, P ) ein Wahrscheinlichkeitsraum und ein Ma auf S. Wenn eine nichtnegative,

S-B-messbare
numerische Funktion f : R existiert mit

P (A) = f d, fr alle A S,
A

so heit f eine Dichte(funktion) des Wahrscheinlichkeitsmaes P bezglich . Man sagt


auch, dass P bezglich eine Dichte f besitzt.
Satz 2.72 Beziehung zwischen (P -) und (-)Nullmengen
Seien (, S, P ) ein Wahrscheinlichkeitsraum, ein Ma auf S und f eine Dichte von P
bezglich , dann gilt fr alle A S mit (A) = 0: P (A) = 0.
Die folgende Definition resultiert aus dem eben betrachteten Satz.
5 {D

; i N} heit eine Partition von , falls die Mengen Di paarweise disjunkt sind und =


i=1

Di .

54

2 Mathematische Grundlagen und Notationen

Definition 2.73: absolute Stetigkeit von P bezglich


Seien (, S, P ) ein Wahrscheinlichkeitsraum und ein Ma auf S. P heit absolutstetig
bezglich , falls fr alle A S mit (A) = 0 gilt: P (A) = 0.
Wie der folgende Satz zeigt, ist die absolute Stetigkeit bezglich eines -endlichen Maes
das entscheidende Kriterium fr die Existenz einer Dichte.
Satz 2.74 Radon-Nikodym
Seien (, S, P ) ein Wahrscheinlichkeitsraum und ein -endliches Ma auf S, dann besitzt
P genau dann eine Dichte bezglich , wenn P absolutstetig bezglich ist.
Nun betrachten wir eine spezielle Klasse von Wahrscheinlichkeitsmaen. Mit |A| wird die Anzahl der Elemente (Mchtigkeit) von A bezeichnet.
Definition 2.75: diskretes Wahrscheinlichkeitsma, diskrete Zufallsvariable
Sei (Rn , Bn , P ), n N, ein Wahrscheinlichkeitsraum. Das Wahrscheinlichkeitsma P
heit diskret, falls eine Menge B Bn mit |B| |N| und P (B) = 1 existiert. Eine
m-dimensionale reelle Zufallsvariable X definiert auf (Rn , Bn , P ), m N, heit diskret,
falls das Bildma PX von X ein diskretes Wahrscheinlichkeitsma auf (Rm , Bm ) ist.
Da fr m = n das Bildma PX der Zufallsvariablen X : Rn Rn , x  x, gleich P ist, wird
oft der Begriff Verteilung statt Wahrscheinlichkeitsma verwendet. Um nun mit Hilfe des Satzes
von Radon-Nikodym diskrete Verteilungen (Wahrscheinlichkeitsmae) durch Dichtefunktionen
darstellen zu knnen, bentigen wir ein spezielles Ma.
Definition 2.76: Zhlma
Das auf einer -Algebra S ber definierte Ma
4
|A|, falls |A| endlich ist
: S R, A 
, sonst
wird als das Zhlma auf S bezeichnet.
Sei nun (Rn , Bn , P ) ein Wahrscheinlichkeitsraum und P eine diskrete Verteilung auf Bn mit
P (B) = 1 fr ein B Bn und |B| |N|, dann gilt fr alle C Bn :
P (C) = P (C B) + P (C B c ) = P (C B).
n
n
Somit gengt es, den Wahrscheinlichkeitsraum (B, BB
, P ) mit BB
:= {C B; C Bn } =
P(B) zu betrachten. Da ein -endliches Ma auf P(B) ist und (A) = 0 genau dann gilt,

2.4 Wahrscheinlichkeitstheoretische Begriffe und Grundlagen

55

wenn A = , ist jedes Wahrscheinlichkeitsma auf P(B) absolutstetig bezglich . Somit


existiert zu jedem Wahrscheinlichkeitsma P auf P(B) eine Dichte f : B R+
0 mit



P (A) = f d =
f() =
P ({}) fr alle A P(B).
A

Es lt sich also jede diskrete Verteilung auf Bn durch eine Folge (pj )jN0 nichtnegativer

'
reeller Zahlen mit
pj = 1 darstellen.
j=0

Definition 2.77: spezielle diskrete Verteilungen


Sei (R, B, P ) ein Wahrscheinlichkeitsraum mit einem diskreten Wahrscheinlichkeitsma P
und P (N0 ) = 1.
(i) Poisson-Verteilung:
Ist
P ({j}) = pj = e

j
,
j>

j N0 , > 0,

so spricht man von einer Poisson6 -Verteilung mit Parameter .


(ii) Gleichverteilung und Laplace-Experiment:
Ist
P ({j}) = pj =

1
,
k+1

fr j = 0, . . . , k, und pj = 0 fr j > k, k N0 ,

so wird diese Verteilung Gleichverteilung genannt. Ein Zufallsexperiment, das durch


einen Wahrscheinlichkeitsraum mit Gleichverteilung reprsentiert wird, heit Laplace7 Experiment.
(iii) Binomial-Verteilung und Bernoulli-Experiment:
Whlt
man p R, 0 < p < 1, und B = {0, 1, 2, . . ., s}, s N, so wird (mit
1s2
s>
:=
(sj)>j> ) die durch
j
 
s j
p (1 p)sj
P ({j}) = pj =
j

fr j = 0, . . . , s, und pj = 0 fr j > s,

gegebene Verteilung Binomial-Verteilung B(s, p) mit Parameter s, p genannt. Ein Zufallsexperiment, das durch einen Wahrscheinlichkeitsraum mit Binomial-Verteilung
mit Parameter s, p reprsentiert wird, heit Bernoulli8-Experiment mit Parameter s, p.
6 nach D.

Poisson (17811840)
S. de Laplace (17491827)
8 nach J. Bernoulli (16541705)
7 nach P.

56

2 Mathematische Grundlagen und Notationen


(iv) Eine auf einem Wahrscheinlichkeitsraum (, S, P ) definierte reelle Zufallsvariable
X heit poissonverteilt / gleichverteilt / binomialverteilt, wenn das Bildma P = PX
poissonverteilt / gleichverteilt / binomialverteilt ist.

Ein Bernoulli-Experiment kann folgendermaen interpretiert werden: Man betrachtet ein Zufallsexperiment, bei dem es nur zwei mgliche Ergebnisse gibt, nmlich mit Wahrscheinlichkeit
p das Ergebnis T (Treffer) und mit Wahrscheinlichkeit (1 p) das Ergebnis N (Niete). Dieses Experiment fhren wir s-mal durch, ohne dass sich die Ergebnisse gegenseitig beeinflussen.
Die Wahrscheinlichkeit,
dass nach diesen s Versuchen genau j Treffer auftreten, ist gegeben
12
durch sj pj (1 p)sj , 0 j s, s N. Somit wird die s-malige Durchfhrung unseres Experimentes durch ein Bernoulli-Experiment beschrieben, falls die Ergebnisse sich nicht
gegenseitig beeinflussen. Fr sehr groe s und sehr kleine p ist es mglich, eine BinomialVerteilung durch die wesentlich einfacher zu berechnende Poisson-Verteilung mit Parameter
= s p zu approximieren.
Nun betrachten wir die folgende naheliegende Definition.
Definition 2.78: absolutstetige Zufallsvariable
Sei (Rn , Bn , P ), n N, ein Wahrscheinlichkeitsraum. Eine m-dimensionale reelle Zufallsvariable X definiert auf (Rn , Bn , P ), m N, heit absolutstetig, falls das Bildma PX von
X ein absolutstetiges Wahrscheinlichkeitsma auf Bm bezglich m ist.
Nach dem Satz von Radon-Nikodym ist PX genau dann absolutstetig bezglich m , wenn PX
eine Dichte bezglich m besitzt. Mit Hilfe der beiden nchsten Definitionen ist es mglich,
alle Wahrscheinlichkeitsmae auf B zu klassifizieren.
Definition 2.79: Verteilungsfunktion
Sei (Rn , Bn , P ), n N, ein Wahrscheinlichkeitsraum. Die Funktion
F : Rn [0, 1], (x1 , . . . , xn )  P (] , x1[ . . . ] , xn[)
wird als Verteilungsfunktion von P bezeichnet. Die Verteilungsfunktion des Bildmaes PX
einer m-dimensionalen reellen Zufallsvariable X : Rn Rm , m N, wird auch Verteilungsfunktion von X genannt.

Definition 2.80: stetiges Wahrscheinlichkeitsma, stetige Zufallsvariable


Sei (Rn , Bn , P ), n N, ein Wahrscheinlichkeitsraum. Das Wahrscheinlichkeitsma (die
Verteilung) P heit stetig, falls die Verteilungsfunktion von P stetig ist. Eine m-dimensionale
reelle Zufallsvariable X definiert auf (Rn , Bn , P ), n N, m N, heit stetig, falls die Verteilungsfunktion von X stetig ist.
Die Verteilungsfunktion einer diskreten Verteilung ist eine Treppenfunktion und damit nicht
stetig. Die Verteilungsfunktion einer bezglich n absolutstetigen Verteilung auf Bn ist stetig

2.4 Wahrscheinlichkeitstheoretische Begriffe und Grundlagen

57

(fr n = 1 sogar absolut stetig im topologischen Sinne). Die Umkehrung gilt aber nicht, da
es stetige Wahrscheinlichkeitsmae P gibt, die nicht absolutstetig bezglich n sind. Diese
Wahrscheinlichkeitsmae werden singulr genannt.
Definition 2.81: singulres Wahrscheinlichkeitsma
Sei (Rn , Bn , P ), n N, ein Wahrscheinlichkeitsraum. Das Wahrscheinlichkeitsma (die
Verteilung) P heit singulr bezglich n , wenn eine Menge N Bn existiert mit n (N ) =
0 und P (N ) = 1.
Nun sind wir in der Lage, die Verteilungsfunktion einer reellen Zufallsvariable in drei Komponenten zu zerlegen.

Satz 2.82 Zerlegungssatz von Lebesgue


Sei X eine reelle Zufallsvariable mit Verteilungsfunktion F , die auf einem Wahrscheinlichkeitsraum (R, B, P ) definiert ist, dann gibt es nichtnegative reelle Zahlen a1 , a2 , a3 mit
a1 + a2 + a3 = 1 und drei Funktionen Fi : R R, i = 1, 2, 3, mit:
F = a1 F1 + a2 F2 + a3 F3 .
F1 ist Verteilungsfunktion einer diskreten Zufallsvariable auf (R, B, P ), F2 ist Verteilungsfunktion einer bezglich absolutstetigen reellen Zufallsvariable auf (R, B, P )
und F3 ist Verteilungsfunktion einer stetigen reellen Zufallsvariable auf (R, B, P ),
deren Bildma singulr bezglich ist.

Riemann-Integration
Ist P1 ein bezglich absolutstetiges Wahrscheinlichkeitsma auf (R, B), so existiert eine
Dichte f mit

P1 (A) = f d, A B.
A

Die Funktion f ist in einem Intervall [a, b], a < b, Riemann-integrierbar, falls sie auf diesem Intervall beschrnkt ist und die Menge der Unstetigkeitsstellen von f auf [a, b] das Lebesgue-Ma
Null hat. Sind diese Voraussetzungen an f erfllt, so knnen wir fr jede (P1 -)integrierbare
Funktion g : [a, b] R das (P1 -)Integral von g ber dem Intervall [a, b] durch ein RiemannIntegral berechnen, falls g f Riemann-integrierbar ber [a, b] ist:

[a,b]

b


g f d =

g dP1 =
[a,b]

g(x) f(x) dx.


a

58

2 Mathematische Grundlagen und Notationen

Definition 2.83: Dichtefunktion


Sei d : Rn R, n N, eine stetige Funktion mit folgenden Eigenschaften:
d(x) 0 fr alle x Rn ,

d(x) dx =

Rn

3
-

...

d(x) dx1 . . . dxn = 1,

3
dann ist auch d dn = 1 und wir knnen die Funktion d als Dichte eines Wahrscheinlichkeitsmaes bezglich n auffassen.
Nun betrachten wir fr jeden Vektor Rn und fr jede positiv definite Matrix Rn,n die
Funktion


1
(x )T 1 (x )
n

.
, : R R, x 
exp
2
(2)n det()
Offensichtlich ist , (x) > 0 fr alle , x Rn , Rn,n, positiv definit.
Aus der Analysis (Substitutionsregel, Satz von Fubini) ist das Folgende bekannt:




(x )T 1 (x )
dx = (2)n det()
exp
2
Rn

fr alle Rn , Rn,n , positiv definit. Somit knnen wir , als Dichte eines Wahrscheinlichkeitsmaes bezglich n auffassen.
Definition 2.84: Normalverteilung
Seien (, S, P ) ein Wahrscheinlichkeitsraum, Rn , n N, und Rn,n , positiv
definit. Die Zufallsvariable X, : Rn heit N (, ) normalverteilt, falls ihr Bildma
PX, bezglich n die folgende Dichte besitzt:


1
(x )T 1 (x )
n
.
, : R R, x 
exp
2
(2)n det()
Um die Parameter und einer Normalverteilung interpretieren zu knnen, bentigen wir die
folgende Definition.
Definition 2.85: Covarianz, unkorreliert, Korrelationskoeffizient
Seien (, S, P ) ein Wahrscheinlichkeitsraum und X : R, Y : R zwei reelle,
(P -)integrierbare Zufallsvariable mit (P -)integrierbarem Produkt X Y .
(i) Dann heit
Cov (X, Y ) := E ((X E (X)) (Y E (Y ))) = E (X Y )E (X)E (Y )
die Covarianz von X und Y X und Y heien unkorreliert, falls Cov (X, Y ) = 0.

2.4 Wahrscheinlichkeitstheoretische Begriffe und Grundlagen

59

(ii) Besitzen die Zufallsvariablen X bzw. Y zudem endliche Varianzen Var (X) > 0 bzw.
Var (Y ) > 0, so wird die Gre
Cov (X, Y )
(X, Y ) :=
Var (X) Var (Y )
Korrelationskoffizient von X und Y genannt.

Normalverteilte Zufallsvariablen spielen in der Wahrscheinlichkeitstheorie eine bedeutende


Rolle, auf die wir im Zusammenhang mit dem zentralen Grenzwertsatz9 noch zu sprechen
kommen. Zunchst fassen wir einige Eigenschaften einer N (, ) normalverteilten Zufallsvariablen X, zusammen. Dazu fassen wir die Funktion X, : Rn als Abbildung
1 1
2
n
 X,
(), . . . , X,
()
i
auf. Jede Funktion X,
: R, i = 1, . . . , n, ist eine reelle Zufallsvariable. Definiert man

1 n 22
1 1 1 2
, . . . , E X,
,
E (X, ) := E X,
so erhlt man
E (X, ) = .
Ferner gilt mit = (i,j )i,j=1,...,n :


j
i
= i,j ,
, X,
Cov X,

i, j = 1, . . . , n.

Daher heit die Covarianzmatrix von X, .

2.4.5

Stochastische Unabhngigkeit

Auf der Basis eines Wahrscheinlichkeitsraumes (, S, P ) haben wir fr A, B S und P (B) >
0 durch P B (A) = P P(AB)
ein Wahrscheinlichkeitsma auf S eingefhrt. Wir interpretier(B)
ten P B (A) als die Wahrscheinlichkeit von A unter der Bedingung, dass B (P B -)fast sicher
eintrifft. Nun stellt sich die Frage, wann diese Bedingung die Wahrscheinlichkeit fr A nicht
ndert, wann also P B (A) = P (A|B) = P (A) gilt. Wir erhalten:
P B (A) = P (A|B) = P (A) P (A B) = P (A) P (B).

9 siehe dazu Definition

2.92 auf Seite 62 und Satz 2.93 auf Seite 62

60

2 Mathematische Grundlagen und Notationen

Definition 2.86: stochastisch unabhngige Ereignisse


Seien (, S, P ) ein Wahrscheinlichkeitsraum und A1 , . . . , An S, n N, dann heien die
Ereignisse A1 , . . . , An stochastisch unabhngig, falls fr alle k N, k n, und fr alle
ij N, 1 j k, mit 1 i1 < . . . < ik n gilt:

k
5

j=1

Aij =

k
6

P (Aij ).

j=1

Die stochastische Unabhngigkeit einer Menge {Ai S; i I}, I = , von Ereignissen fhrt
man auf die stochastische Unabhngigkeit ihrer endlichen Teilmengen zurck.

Definition 2.87: stochastische Unabhngigkeit einer Menge von Ereignissen


Seien (, S, P ) ein Wahrscheinlichkeitsraum und {Ai S; i I}, I = , eine Menge
von Ereignissen, dann heien diese Ereignisse stochastisch unabhngig, falls Ai1 , . . . , Ain
fr jedes n N mit n |I| und fr jede Menge {i1 , . . . , in } I stochastisch unabhngig
sind.

Um stochastisch unabhngige Zufallsvariable definieren zu knnen, wird zunchst die stochastische Unabhngigkeit von Mengensystemen betrachtet.

Definition 2.88: stochastische Unabhngigkeit von Mengensystemen


Seien (, S, P ) ein Wahrscheinlichkeitsraum und {Fi S; i I}, I = , eine Menge von
Mengensystemen ber , dann heien diese Mengensysteme stochastisch unabhngig, falls
fr jedes n N mit n |I| und fr jedes {i1 , . . . , in } I die n Ereignisse Ai1 , . . . , Ain
fr beliebige Aik Fik , i = 1, . . . , n, stochastisch unabhngig sind.

Definition 2.89: von einer Zufallsvariablen erzeugte -Algebra


Sei (, S, P ) ein Wahrscheinlichkeitsraum, (
, S
) ein Messraum und X :
eine

Zufallsvariable. Weiter sei F die Menge aller -Algebren ber , fr


. die gilt: X ist C-S messbar genau dann, wenn C F. Die Menge (X) := (F ) =
C ist ebenfalls eine
-Algebra und wird die von X erzeugte -Algebra genannt.

CF

Unter allen -Algebren A ber ist (X) die kleinste, fr die X A-S
-messbar ist. Somit sind
wir in der Lage, die stochastische Unabhngigkeit von Zufallsvariablen in naheliegender Weise
durch die stochastische Unabhngigkeit von speziellen Mengensystemen zu definieren.

2.4 Wahrscheinlichkeitstheoretische Begriffe und Grundlagen

61

Definition 2.90: stochastische Unabhngigkeit von Zufallsvariablen


Seien (, S, P ) ein Wahrscheinlichkeitsraum, (
, S
) ein Messraum und
{Xi :
; i I}, I = , eine Menge von Zufallsvariablen, dann heien diese Zufallsvariablen stochastisch unabhngig, falls die Mengensysteme {(Xi ); i I} stochastisch
unabhngig sind.
Die stochastische Unabhngigkeit von Zufallsvariablen ist ein zentraler Begriff der Wahrscheinlichkeitstheorie und im Wesentlichen Bestandteil der Modellierung zu untersuchender Vorgnge.

2.4.6

Stochastische Konvergenzbegriffe

Da eine Folge von reellen Zufallsvariablen eine Funktionenfolge ist, betrachtet man wie in
der Analysis (z.B. gleichmige- und punktweise Konvergenz) auch in der Wahrscheinlichkeitstheorie verschiedene Konvergenzbegriffe.
Definition 2.91: verschiedene Konvergenzbegriffe fr Folgen reeller Zufallsvariablen
Seien (, S, P ) ein Wahrscheinlichkeitsraum, (Xi )iN eine Folge reeller Zufallsvariablen
Xi : R, i N, und X : R ebenfalls eine reelle Zufallsvariable, dann konvergiert
(Xi )iN definitionsgem
(i) im r-ten Mittel (r R+ ) gegen X genau dann, wenn



|Xi X|r dP = 0,
|X|r dP < , lim
|Xi |r dP < fr alle i N,
i

(ii) stochastisch gegen X genau dann, wenn fr alle > 0


lim P ({ ; |Xi () X()| < }) = 1,

(iii) mit Wahrscheinlichkeit 1 gegen X genau dann, wenn


8
7
= 1,
P
; lim Xi () = X()
i

(iv) in Verteilung gegen X genau dann, wenn




f dPXi = f dPX
lim
i

fr alle beliebig oft differenzierbaren Funktionen f : R R mit kompaktem Trger.


Die stochastische Konvergenz von (Xi )iN gegen X wird oft durch
(P -) lim Xi = X, st-lim Xi = X oder Xi X nach Wahrscheinlichkeit
i

62

2 Mathematische Grundlagen und Notationen

dargestellt. Die Konvergenz mit Wahrscheinlichkeit 1 von (Xi )iN gegen X heit auch (P -)fast
sichere Konvergenz und wird durch Xi X (P -)f.s. dargestellt. Die Konvergenz nach Verteilung wird auch als schwache Konvergenz bezeichnet. Die folgenden Implikationen lassen sich
leicht nachweisen.
schwache
Konvergenz

stochastische
Konvergenz

Konvergenz mit
Wahrscheinlichkeit 1

Konvergenz im
r-ten Mittel

Ausgehend von einem Wahrscheinlichkeitsraum (, S, P ) betrachten wir spezielle Folgen


(Xi )iN , von reellen Zufallsvariablen Xi : R, i N, deren Quadrate Xi2 : R,
 Xi2 () fr alle i N (P -)integrierbar sind. Wegen



|Xi | dP =
|Xi | dP +
|Xi | dP

{; |Xi ()|1}

{; |Xi ()|>1}

1+

|Xi | dP 1 +

Xi2 dP

fr alle i N

{; |Xi ()|>1}

besitzen die Zufallsvariablen Xi , i N, endliche Erwartungswerte. Dies erlaubt die folgende


Definition.
Definition 2.92: Der zentrale Grenzwertsatz
Sei (, S, P ) ein Wahrscheinlichkeitsraum und (Xi )iN eine Folge von reellen Zufallsvariablen Xi : R, i N, deren Quadrate Xi2 : R,  Xi2 () fr alle i N
(P -)integrierbar sind mit Varianzen Var (Xi ) > 0 fr alle i N. Wir vereinbaren, dass
fr die Folge (Xi )iN genau dann der zentrale Grenzwertsatz gilt, wenn die Folge (Ti )iN
standardisierter reeller Zufallsvariablen
i
'

(Xj E (Xj ))

j=1

Ti : R,  

!Var

i
'

j=1

),

i N,

Xj

in Verteilung gegen eine N (0, 1) normalverteilte Zufallsvariable konvergiert.


Satz 2.93 Der zentrale Grenzwertsatz fr stoch. unabh., ident. vert. Zufallsvar.
Seien (, S, P ) ein Wahrscheinlichkeitsraum und (Xi )iN eine Folge stochastisch unabhngiger, identisch verteilter (d.h. PXi = PXj fr alle i, j N) reeller Zufallsvariablen
Xi : R mit 0 < Var (Xi ) < fr alle i N, dann gilt fr (Xi )iN der zentrale
Grenzwertsatz.

2.4 Wahrscheinlichkeitstheoretische Begriffe und Grundlagen

63

Satz von de Moivre-Laplace


Besteht im obigen Satz die Folge (Xi )iN aus stochastisch unabhngigen, B(1, p) binomialverteilten Zufallsvariablen, so wird die Gltigkeit des zentralen Grenzwertsatzes fr (Xi )iN
als Satz von de Moivre-Laplace bezeichnet. In diesem Fall ist X1 + . . . + Xn , n N, B(n, p)
binomialverteilt und die fr groe n aufwendig zu berechnende Binomial-Verteilung lsst sich
somit durch die hufig tabellierte N (0, 1) Normalverteilung approximieren.
Abschlieend betrachten wir ein sehr hilfreiches Resultat.
Satz 2.94 Ungleichung von Chebyschev-Markov
Seien (, S, P ) ein Wahrscheinlichkeitsraum und X : R eine numerische Zufallsvariable, dann gilt fr jedes Paar reeller Zahlen > 0, > 0 die folgende Ungleichung von
Chebyschev-Markov

1
P ({ ; |X()| })
|X| dP.

Modellierung eines
Quantencomputers

3.1

Das Quantenbit (Qbit)

Quantenbits sind die kleinsten Informationseinheiten eines Quantencomputers. Da es einen Unterschied zwischen dem Ist-Zustand eines Quantenbits und der Beobachtung dieses Zustandes
gibt (im Gegensatz zum klassischen Bit), erfordert die Definition des Quantenbits einen gewissen Aufwand.

3.1.1

Definition eines Qbits

Zunchst werden Quantenbits bzw. ihre mathematische Reprsentation als Elemente der Einheitssphre eines Hilbertraumes eingefhrt. Die Zuordnung zu klassischen Bits ist hier noch
nicht erkennbar.
Definition 3.1:

Qbit

Es sei H ein zweidimensionaler C-Hilbertraum. Dann heit jeder Vektor v H mit


2

v, v = v = 1
der Zustand eines Qbits oder kurz Qbit (Quantenbit).
H nennt man Zustandsraum eines Qbits und



SH := v H v = 1
die Menge aller Quantenzustnde oder Zustandssphre.
Zeichnet man in H eine spezielle orthonormale Basis aus, so wird natrlich jedes Qbit eindeutig
bezglich dieser Basis ausgezeichnet. Ist ein Qbit Vielfaches eines der beiden Basisvektoren, so
nennt man den Zustand rein. Reine Zustnde lassen sich spter mit klassischen Bits kodieren.
Definition 3.2:

Reine Qbit-Zustnde

Es sei H ein zweidimensionaler C-Hilbertraum mit einer orthonormalen Basis v1 , v2 , d.h.


fr jedes Qbit v SH gilt
v = 1 v1 + 2 v2

mit je

1 , 2 C, |1 |2 + |2 |2 = 1.

66

3 Modellierung eines Quantencomputers


v heit ein reiner Qbit-Zustand bezglich der gegebenen Basis, falls v das Vielfache eines
der Basisvektoren ist, d.h. v = vj fr ein j {1, 2} und C mit ||2 = 1.

Durch Messung bezglich einer Basis, siehe Abschnitt 3.1.2 auf der nchsten Seite, lsst sich
jedem Qbit ein reiner Zustand zuordnen, der mit einem klassischen Bitwert kodiert wird. Zur
Darstellung dieser Kodierung lsst sich die Dirac-Schreibweise von Vektoren sinnvoll einsetzen. Im Weiteren verwenden wir sie symbolisch fr Orthonormalbasen von Hilberrumen, wobei aber ansonsten auf Rechnungen in Dirac-Schreibweise verzichtet wird.
Definition 3.3: Konvention einer ausgezeichneten Basis fr ein Qbit
Es sei H ein zweidimensionaler C-Hilbertraum mit einer orthonormalen Basis, die mit
|0 , |1 H
bezeichnet wird. |0, |1 wird per Konvention als Standardbasis fr den Zustandsraum H
vereinbart. Insbesondere gilt also fr jedes Qbit v SH :
v = 0 |0 + 1 |1 =

1


j |j

mit C2 ,  = 1.

j=0

Durch Messung ordnet man einem Qbit einen der reinen Zustnde |0 oder |1 zu, die wir mit
den entsprechenden klassischen Bits identifizieren.
Ist die Basis festgelegt, so kann man in kanonischer Weise (d.h. durch einen Isomorphismus)
den Hilbertraum H mit C2 identifizieren. Die kanonische Basiszuordnung ist dann
 
 
1
0
|0 =
, |1 =
.
0
1
Eine strker physikalisch orientierte Notation (Polarisationsrichtungen) fr die beiden Basisvektoren ist
|! , | .
Eine alternative Basis kann in dieser Notation wie folgt geschrieben werden

| , | .

3.1 Das Quantenbit (Qbit)

3.1.2

67

Messung eines Qbits bezglich einer Basis

Gem den Postulaten der Quantenmechanik ist der Zustand eines Qbits nicht direkt beobachtbar. Mit Hilfe einer Messanordnung, die eine spezielle Orthonormalbasis des Hilbertraumes H
whlt, lsst sich ein Zufallsexperiment durchfhren, in dessen Verlauf ein Qbit in einen reinen
Zustand wechselt1 . Dabei gilt:
Die Wahrscheinlichkeitsverteilung des Zufallsexperimentes ist abhngig von Zustand des
Qbits vor der Messung.
Nach der Messung befindet sich das Qbit in einem reinen Zustand, d.h. in der Regel
verndert die Messung den Zustand des Qbits.
Die Messung eines Qbits bezglich einer Basis ist der Spezialfall einer allgemeinen Messung,
die wir in Abschnitt 3.2.3 besprechen werden.
Definition 3.4:

Messung eines Qbits bezglich einer Basis

Es sei H ein zweidimensionaler C-Hilbertraum mit einer orthonormalen Basis |0,|1. Unter
der Messung eines fest gewhlten Qbits v SH mit
v = 0 |0 + 1 |1 =

1


j |j

mit C2 ,  = 1

j=0

bezglich der Basis |0,|1 versteht man die Realisierung einer Zufallsvariablen
M v :

mit einem Wahrscheinlichkeitsraum (, A, P ), einem Messraum (


, P(
)) mit

:= {0, 1}
und mit der Verteilung
P ({M v = 0}) := p0 := |0 |2 ,

P ({M v = 1}) := p1 := |1 |2 .

Nach der Messung befindet sich das Qbit mit Wahrscheinlichkeit p0 im reinen Zustand
0
1
|0 | |0 und mit Wahrscheinlichkeit p1 im reinen Zustand |1 | |1.
Das Zufallsexperiment der Messung ergibt also mit Wahrscheinlichkeit p0 den klassischen Bitwert 0 und mit Wahrscheinlichkeit p1 den klassischen Bitwert 1. Die Besonderheit ist, dass
das Zufallsexperiment nur jeweils einmal durchfhrbar ist, da sich der Zustand des Qbits (und
damit die Wahrscheinlichkeitsverteilung) durch die Messung ndert. Ist das Ergebnis also z.B.
1, so wrde jede erneute Messung ebenfalls den Wert 1 ergeben.
Die Messung ist also die stochastische Zuordnung eines Quantenzustands auf ein klassisches
Bit. Sie steht i.d.R. am Ende einer oder mehrerer Operationen auf Quantenbits, die in Abschnitt
3.3 beschrieben werden.
1 Physikalisch geschieht dies

durch Wahl von Polarisationsachsen

68

3 Modellierung eines Quantencomputers

3.2

Multi-Qbits und ihre Darstellung

Der Speicher eines Quantencomputers besteht aus einem Multi-Qbit, also mehreren Qbits. Ein
Multi-Qbit besteht allerdings nicht einfach aus der sortierten Anordnung von einzelnen Qbits,
so dass auch hier eine weitaus kompliziertere Situation im Vergleich zum klassischen Speicher
vorliegt.

3.2.1

Definition von Multi-Qbits

Die Aneinanderreihung mehrere klassischer Bits zu einem Multi-Bit (oder besser verstndlich:
zu einem Speicher) entspricht der Bildung eines kartesischen Produktes, d.h. man betrachtet
klassisch Tupel von Bits.
Hierin liegt der entscheidende Unterschied zwischen Quantenspeichern und klassischen Speichern: Statt aus der kartesischen Tupelbildung von Qbits entsteht ein Multi-Qbit aus der Tensorbildung von Qbits. Daher ist der Zustandsraum eines Multi-Qbits aus n Qbits nicht 2ndimensional, sondern 2n -dimensional.
Definition 3.5: Multi-Qbit
Es sei n N, n > 1, und es sei H ein Zustandsraum, also ein zweidimensionaler CHilbertraum. Der Hilbertraum Hn des n-fachen Tensorproduktes von H mit dem kanonisch induzierten Skalarprodukt heit dann Zustandsraum eines n-Qbits bzw. eines MultiQbits.
Jeder Vektor v Hn mit
2

v, v = v = 1
heit Zustand eines n-Multi-Qbits oder kurz n-Qbit oder Multi-Qbit. Weiter heit



SHn := v Hn v = 1
die Menge aller Quantenzustnde oder Zustandssphre des Multi-Qbits.
Zu Tensorrumen siehe Definition 2.33 auf Seite 31 und Definition 2.36 auf Seite 35; zum
kanonisch induzierten Skalarprodukt siehe Satz 2.39 auf Seite 38.
Die 2n Vektoren einer Orthonormalbasis von Hn wollen wir wieder als reine Zustnde eines
Multi-Qbits bezeichnen. Die Dirac-Schreibweise erlaubt eine kompakte Notation, die direkt mit
klassischen Bits korrespondiert.
Definition 3.6: Schreibkonvention fr Tensorprodukte einer ausgezeichneten Basis
Es sei n N, n > 1, und es sei H ein zweidimensionaler C-Hilbertraum mit einer orthonormalen Basis |0,|1.
Zu jedem x N mit 0 x < 2n mit der Binrzahldarstellung
x = xn1 xn2 . . . x1 x0 =

n1

j=0

2j xj ,

xj {0, 1} , j = 0, . . . , n 1

3.2 Multi-Qbits und ihre Darstellung

69

definiere |xn Hn bzw. |xn1 xn2 . . . x1 x0  Hn durch


|xn := |xn1xn2 . . . x1 x0  := |xn1  |xn2  . . . |x1  |x0 
:= |xn1 |xn2  . . . |x1  |x0  .
Die Tensorprodukte
|0 |0 ,

|0 |1 ,

|1 |0 ,

|1 |1

knnen mittels Definition 3.6 verkrzt als


|0 |0 ,

|0 |1 ,

|1 |0 ,

|1 |1

geschrieben werden oder als


|00 ,

|01 ,

|10 ,

|11

oder mit Hilfe von Dezimalzahlen als


|02 ,

|12 ,

|22 ,

|32 .

Die Angabe der Stellenzahl in der Dezimalschreibweise ist zwingend, da sonst nicht zwischen
|32 = |11 und z.B. |34 = |0011 unterschieden werden kann.
Satz 3.7 Standardbasis fr ein Multi-Qbit
Es sei n N, n > 1, und es sei H ein zweidimensionaler C-Hilbertraum mit einer orthonormalen Basis |0,|1.
Dann ist
|0n , |1n , . . . , |2n 2n , |2n 1n
eine Orthonormalbasis von Hn , genannt die Standardbasis von Hn .
Insbesondere gilt fr jedes Multi-Qbit v SHn :
v=

n
2
1

j |jn

mit C2 ,  = 1.

j=0

Beweis. Mit Satz 2.34 auf Seite 32 und Definition 2.36 auf Seite 35 folgt die Basiseigenschaft von |0n , |1n , . . . , |2n 2n , |2n 1n nach Konstruktion. Zu zeigen ist nur die
Orthonormalitt.
Zu jedem x, y N mit 0 x, y < 2n mit der Binrzahldarstellung
x=

n1

j=0

2j xj ,

y=

n1

j=0

2j yj ,

xj , yj {0, 1} , j = 0, . . . , n 1

70

3 Modellierung eines Quantencomputers

betrachte man mit Satz 2.39 auf Seite 38 das Skalarprodukt2 von |xn und |yn
|xn , |yn  =

n1
6

|xj  , |yj H =

j=0

n1
6

xj ,yj = x,y ,

j=0

wobei x,y das Kronecker-Symbol ist.

Da die Ziffern der Binrzahldarstellung lexikographisch geordnet sind, ist diese Sortierung vertrglich mit dem kanonischen Tensorprodukt auf den kanonisch zugeordeneten Tupelrumen,
siehe Lemma 2.41 auf Seite 40 und Lemma 2.42 auf Seite 40. Daher kann dem Vektor |xn der
n
(x + 1)-te Einheitsvektor von C2 kanonisch zugeordnet werden, so dass folgende Operationen
vertrglich sind:

0
0

0
     

0
0
1
0

.
|63 = |110 = |1 |1 |0
1
1
0
0
0

1
0

3.2.2

Charakterisierung von Multi-Qbit-Zustnden

Analog zu reinen Qbit-Zustnden lassen sich nun reine Multi-Qbit-Zustnde definieren.


Definition 3.8: Reine Multi-Qbit-Zustnde
Es sei n N, n > 1, und es sei H ein zweidimensionaler C-Hilbertraum mit einer orthonormalen Basis |0,|1.
v SHn heit ein reiner Multi-Qbit-Zustand bezglich der Basis |0n , . . . , |2n 1n ,
falls v das Vielfache eines der Basisvektoren ist, d.h. v = |xn fr ein x {0, . . . , 2n 1}
und C mit ||2 = 1.
Die Zuordnung eines Qbit-Zustandes zu einem reinen Qbit-Zustand erfolgt wieder durch eine
Messung, siehe Abschnitt 3.2.3 auf Seite 72.
Bei vielen Anwendungen spielen separable Zustnde eine Rolle, die sich als Tensorprodukt
zweier Teilzustnde schreiben lassen. Als Hilfsdefinition betrachten wir zunchst Tensorpermutationen.
Definition 3.9: Tensorpermutation
Es sei n N, n > 1, und es sei H ein zweidimensionaler C-Hilbertraum. Weiter sei
S({0, . . . , n 1}) eine Permutation aus der symmetrischen Gruppe, d.h. eine bijektive
2 Die

nachfolgende Schreibweise ist unschn, aber korrekt

3.2 Multi-Qbits und ihre Darstellung

71

Abbildung : {0, . . . , n 1} {0, . . . , n 1}. Der lineare Operator Q : Hn Hn ,


der fr xi H eindeutig durch
Q (xn1 xn2 . . . x1 x0 ) := x(n1) x(n2) . . . x(1) x(0)
festgelegt ist, heit Tensorpermutation auf Hn .
Eine Tensorpermutation vertauscht die Rollen von einzelnen Qbits innerhalb eines MultiQbits.
Die Tensorpermutation ist als linearer Operator auf Hn eindeutig festgelegt, da dieser
in der Definition insbesondere auf einer Basis von Hn festgelegt ist.
Als Permutation ist Q ein unitrer3 Operator.
Nicht jede Permutation auf Hn ist eine Tensorpermutation! Es gibt n! Tensorpermutationen, aber zu einer festgelegten Basis von Hn gibt es (2n )! verschiedene Permutationen auf Hn .

Definition 3.10: Separabel, verschrnkt


Es sei n N, n > 1, und es sei H ein zweidimensionaler C-Hilbertraum.
(i) v SHn heit ein (direkt) separabler Multi-Qbit-Zustand, falls es ein p N mit
1 p < n gibt mit
v = xy

fr ein x SHp und ein y SHq mit q = n p.

(ii) v SHn heit ein indirekt separabler Multi-Qbit-Zustand, falls es eine Tensorpermutation Q auf Hn gibt, so dass der Vektor Qv ein direkt separabler Multi-QbitZustand ist.
(iii) v SHn heit ein verschrnkter Multi-Qbit-Zustand, falls v weder direkt noch
indirekt separabel ist.
Beispiel 13
Ein 2-Qbit-Zustand v mit
v = ac |00 + ad |01 + bc |10 + bd |11
ist separabel, da gilt
v = (a |0 + b |1) (c |0 + d |1).
3 siehe Definition

3.18 auf Seite 83

72

3 Modellierung eines Quantencomputers

Beispiel 14
Der 3-Qbit-Zustand v mit
1
1
v = |010 + |111
2
2
ist bedingt separabel, denn ist Q die Tensorpermutation, die die die letzten beiden Tensorkomponenten vertauscht, so gilt


1
1
1
1
Qv = |001 + |111 = |00 + |11 |1 .
2
2
2
2
Beispiel 15
Die folgenden 2-Qbit-Zustnde sind jeweils verschrnkt. Jeden dieser vier Zustnde nennt
man Bell-Zustand oder EPR-Zustand4 oder EPR-Paar:
1
00 := (|00 + |11) ;
2
1
01 := (|01 + |10) ;
2
1
10 := (|00 |11) ;
2
1
11 := (|01 |10) .
2
Man beachte, dass diese vier Vektoren jeweils orthogonal zueinander sind. Sie bilden daher
eine alternative Orthonormalbasis von H2 .

3.2.3

Messung eines Multi-Qbits

Wir beschreiben zunchst die allgemeine Mglichkeit einer Messung, die auf einem Satz von
Messoperatoren beruht.
Definition 3.11: Messoperatoren
Es sei n N und es sei H ein zweidimensionaler C-Hilbertraum. Unter einem Satz von
Messoperatoren auf Hn versteht man eine Menge {M0 , . . . , Mm1 }, m N, von linearen
Operatoren auf Hn
Mj : Hn Hn
mit der Eigenschaft
m1


Mj Mj = I,

j=0
4 Je

nach Bell, Einstein, Podolsky und Rosen

3.2 Multi-Qbits und ihre Darstellung

73

wobei I die identische Abbildung ist und Mj der zu Mj adjungierte Operator.


Ein Satz von Messoperatoren besitzt die folgende zentrale Eigenschaft fr jeden Vektor v
SHn :
m1


Mj v =

j=0

m1


Mj v, Mj v =

j=0

*
=

v,

m1


+
Mj Mj v

m1


v, Mj Mj v

j=0

= v, v = 1.

j=0

Die folgende Definition entspricht Postulat 2 auf Seite 6.


Definition 3.12: Messung eines Multi-Qbits bezglich eines Messoperatorsatzes
Es sei n N und es sei H ein zweidimensionaler C-Hilbertraum. Weiter sei ein Satz
{M0 , . . . , Mm1 }, m N, von Messoperatoren auf Hn gegeben und ein n-Qbit v SHn .
Zu einem Wahrscheinlichkeitsraum (, A, P ) und dem Messraum (
, P(
)) mit

:= {0, . . . , m 1}
betrachte die Zufallsvariable
v
M{M
:

0 ,...,Mm1 }

mit der Verteilung


7
8
2
v
P
M{M
=j
:= pj := Mj v ,
0 ,...,Mm1 }

j = 0, . . . , m 1.

Unter der Messung des n-Qbits v SHn bezglich des gegebenen Messoperatorsatzes
v
versteht man eine Realisierung der Zufallsvariablen M{M
.
0 ,...,Mm1 }
Nach der Messung mit einem Messergebnis j
befindet sich das n-Qbit im Zustand
Mj v
1
= Mj v.
Mj v
pj

74

3 Modellierung eines Quantencomputers

3.2.4

Vollstndige Messung eines Multi-Qbits


bezglich einer Basis

Der wichtigste Spezialfall einer Messung ist die Messung bezglich einer Basis. Durch die
Messung geht das Multi-Qbit in einen reinen Zustand bezglich der verwendeten Basis ber.
Die Messoperatoren fr die Messung bezglich einer Basis lassen sich bersichtlich mit Hilfe
der dualen Basis beschreiben.

Definition 3.13: Duale Basis


Es sei n N, H ein zweidimensionaler C-Hilbertraum und
|0n , |1n , . . . , |2n 2n , |2n 1n
die Standardbasis von Hn .

Zu jedem |jn wird die zugehrige duale Abbildung j|n := (|jn ) festgelegt durch
j|n : Hn C,
j|n linear mit j|n |kn := |jn , |kn  = jk , k = 0, . . . , 2n 1.
0|n , . . . , 2n 1|n heit dann duale Basis und ist eine Basis des Dualraums.

Der Operator
Mj := |jn j|n
ist eine Projektion auf den von |jn aufgespannten Untervektorraum, wie man sofort sieht:

Mj

n
1
2

k=0

k |kn =

n
2
1

k=0

k |jn j|n |kn = j |jn .

3.2 Multi-Qbits und ihre Darstellung

75

Lemma 3.14 Messung eines Multi-Qbits bezglich einer Basis


Es sei n N, H ein zweidimensionaler C-Hilbertraum und
|0n , |1n , . . . , |2n 2n , |2n 1n
die Standardbasis von Hn . Dann ist durch {M0 , . . . , M2n 1 } ein Messoperatorsatz auf
Hn gegeben, wobei
Mj := |jn j|n ,

j = 0, . . . , 2n 1.

Die Messung eines fest gewhlten n-Qbits v =

2n
1
'
k=0

k |kn SHn bezglich dieses

Messoperatorsatzes heit Messung bezglich der gegebenen Basis und ist die Realisierung
der Zufallsvariablen
Mnv :

mit einem Wahrscheinlichkeitsraum (, A, P ), einem Messraum (


, P(
)) mit

:= {0, . . . , 2n 1}
und mit der Verteilung
P ({Mnv = j}) := pj := |j |2 ,

j = 0, . . . , 2n 1.

Nach der Messung mit einem Ergebnis j


befindet sich das n-Qbit im Zustand
j
|j .
|j | n

Beweis. Die Operatoren Mj := |jn j|n sind Projektoren auf den durch |j aufgespannten
Untervektorraum. Es gilt weiter

Mj Mj = (|jn j|n ) |jn j|n = |jn j|n |jn j|n = |jn j|n = Mj
und fr jedes v =

2n
1
'
k=0

k |kn SHn folgt

Mj v = |jn j|n

n
2
1

k |kn =

k=0

n
2
1

k |jn j|n |kn = j |jn .

k=0

Insbesondere folgt
n
2
1

j=0

Mj Mj v =

n
2
1

j=0

Mj v =

n
2
1

j=0

j |jn = v

und damit

n
2
1

j=1

Mj Mj = I.

76

3 Modellierung eines Quantencomputers

Somit ist {M0 , . . . , M2n1 } ein Messoperatorsatz und damit gilt


2

P ({Mnv = j}) := pj := Mj v = j |jn  = |j |2 .


Der Zustand nach der Messung ist
1
1
j
|jn .
j |jn =
Mj v =
2
pj
|
|j |
j|

Die vollstndige Messung bezglich einer Basis bedeutet somit die stochastische Zuordnung
eines Multi-Qbit-Zustandes v auf einen reinen Multi-Qbit-Zustand |jn . Die Binrdarstellung
n
der Zahl j mit n Binrstellen wird als klassisches n-Bit-Tupel aus {0, 1} interpretiert.
Die Messung entspricht also dem Auslesen des Speicherinhaltes eines Quantencomputers. In
Abschnitt 3.3 auf Seite 83 wird erklrt, wie Qbit-Zustnden durch Operationen gezielt verndert
werden knnen.
Wie man sich sofort berlegen kann, wrde eine erneute Messung mit der gegebenen Basis den
Zustand des Multi-Qbits nicht weiter verndern, d.h. durch die Messung wurde es auf einen
bestimmten reinen Zustand festgelegt.
Beispiel 16
Man betrachte ein 2-Qbit v mit
1
1
1
v = |00 |01 + |10 .
2
2
2
Eine Messung bezglich der Standardbasis, d.h. eine Realisierung der Zufallsvariablen M2v ,
hat folgende Ergebnisse:
Ergebnis
0 = 002
1 = 012
2 = 102

Wahrscheinlichkeit
1
2
1
4
1
4

Ergebniszustand
|00
|01
|10

Das systematisch mgliche Ergebnis 3 = 112 besitzt die Wahrscheinlichkeit 0 und ist nicht
dargestellt.

3.2.5

Partielle Messung eines Multi-Qbits bezglich einer Basis

Nun betrachten wir die partielle Messung eines Multi-Qbits bezglich einer Basis. Das soll bedeuten, dass einige, aber nicht alle Qbits eines Multi-Qbits auf einen reinen Zustand festgelegt
werden.
Ohne Einschrnkung der Allgemeinheit betrachten wir die Messung der ersten p Qbits eines
n-Qbits. Um irgendeine Auswahl von p Qbits zu messen, wende man eine Tensorpermutation
auf den betrachteten Zustand an, die diese Qbits an den Anfang tauscht.

3.2 Multi-Qbits und ihre Darstellung

77

Lemma 3.15 Partielle Messung eines Multi-Qbits bezglich einer Basis


Es sei n N, H ein zweidimensionaler C-Hilbertraum und
|0n , |1n , . . . , |2n 2n , |2n 1n
die Standardbasis von Hn . Ist p N mit 1 p < n und q := n p, dann ist durch
{M0 , . . . , M2p 1 } ein Messoperatorsatz auf Hn gegeben, wobei
Mj :=

q
2
1 

|jp |rq



|jp |rq

j = 0, . . . , 2p 1.

r=0

Die Messung eines fest gewhlten n-Qbits v =

2n
1
'
k=0

k |kn SHn bezglich dieses Mess-

operatorsatzes heit partielle Messung der ersten p Qbits bezglich der gegebenen Basis und
ist die Realisierung der Zufallsvariablen
Mpv :

mit einem Wahrscheinlichkeitsraum (, A, P ), einem Messraum (


, P(
)) mit

:= {0, . . . , 2p 1}
und mit der Verteilung
q

2
1
2
1 v
|j2q +r |2 ,
P Mp = j := pj :=

j = 0, . . . , 2p 1.

r=0

Nach der Messung mit einem Ergebnis j


befindet sich das n-Qbit im Zustand
|jp

q
2
1

r=0

j2q +r
|rq .

pj

Beweis. Analog zum Beweis von Lemma 3.14 auf Seite 75 zeigt man, dass {M0 , . . . , M2p1 }
ein Messoperatorsatz ist (die betrachteten Operatoren sind Summen der Operatoren aus Lemma 3.14 auf Seite 75). Auerdem folgt ebenso
Mj Mj = Mj
und fr jedes v =

2n
1
'
k=0

Mj v =

k |kn SHn folgt

q
2
1 

r=0

|jp |rq



|jp |rq

n
1
 2

k=0

k |kn

78

3 Modellierung eines Quantencomputers

q
n
2
1 2
1




k |jp |rq |jp |rq |kn

r=0 k=0

q
2
1

j2q +r |jp |rq = |jp

r=0

q
2
1

j2q +r |rq .

r=0

Damit gilt
#
#2 # q
#2
q
2
1
1
#
#2
#
#
#
#
#
#
j2q +r |rq # = #
j2q +r |rq #
pj := Mj v = #|jp
#
#
#
#
2

r=0

q
2
1

r=0

|j2q +r |2 .

r=0

Der Zustand nach der Messung ist


q

2
1
1
j2q +r
|rq .
Mj v = |jp

pj
pj
r=0


Nach der Messung der ersten p Qbits spielen diese bei vielen berlegungen keine Rolle mehr.
r := j2q +r , so ist der Zustand nach der
Betrachtet man nur die letzten q Qbits und setzt
Messung
q
2
1

r=0

|rq .
pj

Beispiel 17
Die Messung von einem Bit eines Bell-Zustandes, vergleiche Beispiel 15 auf Seite 72, legt
auch das zweite Bit eindeutig fest. Man betrachte etwa
1
00 = (|00 + |11) .
2
Die Messung des ersten Bits bezglich der Standardbasis, d.h. eine Realisierung der Zufallsvariablen M1v , ergibt folgende Mglichkeiten:
Ergebnis
0
1

Wahrscheinlichkeit
1
2
1
2

Ergebniszustand
|0 |0
|1 |1

3.2 Multi-Qbits und ihre Darstellung

79

Beispiel 18
Man betrachte ein 2-Qbit v mit
1
1
1
v = |00 |01 + |10 .
2
2
2
Die Messung des ersten Bits bezglich der Standardbasis, d.h. eine Realisierung der Zufallsvariablen M1v , ergibt folgende Mglichkeiten:
Ergebnis

Wahrscheinlichkeit

3
4
1
4

Ergebniszustand
"
"

2
1
|0
|0

|1
3
3
|1 |0

Da nachfolgende einfache Korollar ist eine Umformulierung von Lemma 3.15 auf Seite 77 fr
den Fall einer speziellen Darstellung eines n-Qbits, die einigen Quantenalgorithmen vorkommt.

80

3 Modellierung eines Quantencomputers

Korollar 3.16 Partielle Messung eines Multi-Qbits (alternative Darstellung)


Es sei n N, H ein zweidimensionaler C-Hilbertraum und
|0n , |1n , . . . , |2n 2n , |2n 1n
die Standardbasis von Hn . Ist p N mit 1 p < n und q := n p, dann ist durch
{M0 , . . . , M2p 1 } ein Messoperatorsatz auf Hn gegeben, wobei
q
2
1 

Mj :=

|jp |rq



|jp |rq

j = 0, . . . , 2p 1.

r=0

Die Messung eines fest gewhlten n-Qbits v =

p
q1
2'
1 2'

j=0 r=0

j,r |jp |rq SHn bezglich

dieses Messoperatorsatzes heit partielle Messung der ersten p Qbits bezglich der gegebenen Basis und ist die Realisierung der Zufallsvariablen
Mpv :

mit einem Wahrscheinlichkeitsraum (, A, P ), einem Messraum (


, P(
)) mit

:= {0, . . . , 2p 1}
und mit der Verteilung
q

2
1
1
2
P Mpv = j := pj :=
|j,r |2 ,

j = 0, . . . , 2p 1.

r=0

Nach der Messung mit einem Ergebnis j


befindet sich das n-Qbit im Zustand
|jp

q
2
1

r=0

Beweis.

j,r
|rq .
pj

Es gilt
v=

p
q1
2
1 2

j,r |jp |rq =

j=0 r=0

wobei

n
2
1

k |kn ,

k=0

|jn |rq = |j 2q + rn

und aus der Eindeutigkeit der Basisdarstellung folgt damit


j2q +r = j,r

fr alle

j = 0, . . . , 2p 1, k = 0, . . . , 2n 1.

Mit Lemma 3.15 auf Seite 77 ergibt sich dann die Aussage.

3.2 Multi-Qbits und ihre Darstellung

81

Nun soll noch die Besonderheit separabler Zustnde festgehalten werden. Das nachfolgende
Lemma besagt, dass die partielle Messung eines Teilzustandes in einem separablen Zustand
den anderen Teilzustand nicht verndert und dieser auch keinen Einfluss auf das Messergebnis
hat. Bezglich der Messung knnen daher separable Zustnde wie getrennte Systeme behandelt
werden.

Lemma 3.17 Partielle Messung eines separablen Zustands


Es sei n N, H ein zweidimensionaler C-Hilbertraum und
|0n , |1n , . . . , |2n 2n , |2n 1n
die Standardbasis von Hn . Weiter sei v SHn ein separabler Multi-Qbit-Zustand mit
einem p N mit 1 < p < n, q := n p und
v = xy

mit x =

p
2
1

k |kp SHp und y =

q
2
1

r |rq SHq .

r=0

k=0

Dann ist die partielle Messung der ersten p Qbits bezglich der gegebenen Basis die Realisierung der Zufallsvariablen
Mpv :

mit einem Wahrscheinlichkeitsraum (, A, P ), einem Messraum (


, P(
)) mit

:= {0, . . . , 2p 1}
und mit der Verteilung
1
2
P Mpv = j := pj := |j |2 ,

j = 0, . . . , 2p 1.

Nach der Messung mit einem Ergebnis j


befindet sich das n-Qbit im Zustand


j
|jp y.
|j |

Beweis.

Es gilt
v =xy =

p
2
1

k |kp

k=0 r=0

r |rq =

r=0

k=0
p
q
2
1 2
1

q
2
1

k r |k 2 + rn =

p
q
2
1 2
1

k r |kp |rq

k=0 r=0
n
2
1

j=0

j |jn

mit k2q+r = k r .

82

3 Modellierung eines Quantencomputers

Mit Lemma 3.15 auf Seite 77 folgt dann fr j = 0, . . . , 2p 1:


q

2
1
2
1
2
1
|j2q+r |2 =
|j r |2
P Mpv = j = pj =
r=0

= |j |2

q
1
2

r=0

|r |2 = |j |2 .

r=0

Der Ergebniszustand lautet nach Lemma 3.15 auf Seite 77:


|jp

q
2
1

r=0

2
1
j2q +r
j r
|rq
|rq = |jp

pj
|j |
r=0
q
 2



1
j
j
|j
|j y.
=
r |rq =
|j | p
|j | p
r=0


Beispiel 19
Man betrachte ein 2-Qbit v mit
1
1
1
1
v = |00 |01 + |10 |11 .
6
6
3
3
Durch Umformung erkennt man, dass es sich um einen separablen Zustand handelt mit
(
) 
9

1
2
1
1
v = |0 +
|1 |0 |1 .
3
3
2
2
Die Messung des ersten Bits bezglich der Standardbasis, d.h. eine Realisierung der Zufallsvariablen M1v , ergibt folgende Mglichkeiten:
Ergebnis

Wahrscheinlichkeit

1
3

2
3

Ergebniszustand


|0 12 |0 12 |1


|1 12 |0 12 |1

Hier sieht man noch einmal deutlich, dass die Ergebniswahrscheinlichkeiten nur von den
Koeffizienten des ersten Qbits abhngen und zweite Qbit durch die Messung unverndert
bleibt.

3.3 Unitre Operationen auf Quantenbits (Zeitentwicklung)

3.3

83

Unitre Operationen auf Quantenbits


(Zeitentwicklung)

Operationen auf Quantenbits entsprechen den Operationen auf Bits eines klassischen Speichers.
In deterministischer Weise wird der Speicherinhalt, d.h. der Zustand des Mulit-Qbits, durch
eine Operation in einen anderen Zustand bergefhrt. In der Quantenmechanik spricht man von
Zeitentwicklung.

3.3.1

Definition von Gates (Unitre Operatoren)

Die Anwendung eines unitren Operators auf ein Multi-Qbit wird auch Anwendung eines Gates
auf das Multi-Qbit genannt.
Definition 3.18: Unitrer Operator
Ist V ein C-Hilbertraum, so heit ein linearer Operator U : V V , ein unitrer Operator,
falls
U U = I
gilt, wobei I : V V die identische Abbildung ist.
2

Damit hat man U 1 = U und fr ein v V mit v = 1 gilt


U v2 = U v, U v = U U v, v = v, v = 1.
Daran sieht man, dass die Einheitssphre auf die Einheitssphre abgebildet wird.
Die Tensorpermutationen aus Definition 3.9 auf Seite 70 sind Beispiele fr unitre Operatoren
auf Hn , die wir auch als Gates bezeichnen wollen.
Definition 3.19: Operationen auf Multi-Qbits, Gate
Es sei n N und H ein zweidimensionaler C-Hilbertraum. Ein unitrer Operator
U : Hn Hn
wird Gate genannt und seine Anwendung auf einen n-Qbit-Zustand v SHn , also die
Durchfhrung von U v SHn , nennt man Operation auf dem n-Qbit v.
Eine Operation auf einem Multi-Qbit ist also deterministisch (im Gegensatz zu einer Messung)
und ist reversibel (durch Anwendung von U 1 = U ).
Bei Vorgabe einer Basis, insbesondere der Standardbasis, lsst sich jeder lineare Operator U
auf Hn mit Hilfe einer Matrix beschreiben. Oft wird fr die Matrix derselbe Bezeichner wie
fr den Operator verwendet, um die Notation kompakt zu halten.

84

3 Modellierung eines Quantencomputers

Beispiel 20
Man betrachte H2 und die Tensorpermutation P , die die beiden Tensorkomponenten vertauscht. Somit gilt
P |00 = |00 ,

P |01 = |10 ,

P |10 = |01 ,

P |11 = |11 .

Eine Matrixdarstellung fr P lautet damit

1
0
0
0

3.3.2

0
0
1
0

0
1
0
0

0
0
.
0
1

Tensorprodukt von Operatoren

Die Konkatenierung von unitren Operatoren ergibt bekanntermaen selbst wieder einen unitren Operator, d.h. sind A und B zwei unitre Operatoren auf einem Hilbertraum, so ist AB
(genauer A B) wieder ein unitrer Operator auf diesem Hilbertraum.
Es lsst sich auch ein Tensorprodukt von unitren Operatoren auf Hilbertrumen angeben, welches wieder einen unitren Operator auf dem Produktraum ergibt. Wir formulieren dies gleich
fr die Anwendung auf Quanten-Zustandsrume.

Definition 3.20: Tensorprodukt von Operatoren


Es sei H ein zweidimensionaler C-Hilbertraum und es seien n1 , . . . , nm , m N. Weiter
sei fr alle k = 1, . . . , m jeweils ein linearer Operator Ak : Hnk Hnk gegeben. Das
Tensorprodukt dieser Operatoren sei ein linearer Operator
A1 . . . Am : H(n1 +...+nm ) H(n1 +...+nm )
mit der definierenden Eigenschaft
(A1 . . . Am )(x1 . . . xm ) := (A1 x1 ) . . . (Am xm )
fr alle xk Hnk , k = 1, . . . , m.

Wieder gilt, dass der lineare Operator A1 . . . Am durch seine definierende Eigenschaft
eindeutig festgelegt ist, da er damit insbesondere auf einer Basis von H(n1 +...+nm ) festgelegt
ist.

3.3 Unitre Operationen auf Quantenbits (Zeitentwicklung)

85

Lemma 3.21 Adjungiertes Tensorprodukt und unitres Tensorprodukt


Es sei H ein zweidimensionaler C-Hilbertraum und es seien n1 , . . . , nm , m N. Weiter sei
fr alle k = 1, . . . , m jeweils ein linearer Operator Ak : Hnk Hnk gegeben.
(i) Es gilt

(A1 . . . Am ) = A1 . . . Am .
(ii) Sind A1 , . . . , Am jeweils unitre Operatoren, so ist auch A1 . . . Am ein unitrer
Operator.

Beweis.

Man betrachte xk , yk Hnk , k = 1, . . . , m. Dann gilt:


%

(A1 . . . Am ) (x1 . . . xm ), y1 . . . ym

&

= x1 . . . xm , (A1 . . . Am ) (y1 . . . ym )


= x1 . . . xm , (A1 y1 ) . . . (Am ym )
= x1 , A1 y1  . . . xm , Am ym  = A1 x1 , y1  . . . Am xm , ym 
= (A1 x1 ) . . . (Am )xm , y1 . . . ym 
= (A1 . . . Am ) (x1 . . . xm ), y1 . . . ym 
Da die Beziehung somit insbesondere fr eine Basis von H(n1 +...+nm ) nachgewiesen wurde,
gilt sie fr alle Elemente von H(n1 +...+nm ) . Aufgrund der Eindeutigkeit des adjungierten
Operators folgt damit

(A1 . . . Am ) = A1 . . . Am .
Sind A1 , . . . , Am jeweils unitre Operatoren, so gilt fr alle xk Hnk , k = 1, . . . , m,:

(A1 . . . Am ) (A1 . . . Am ) (x1 . . . xm )


= (A1 . . . Am ) ((A1 x1 ) . . . (Am xm ))
= (A1 A1 x1 ) . . . (Am Am xm )
= x1 . . . xm .

Somit ist (A1 . . . Am ) (A1 . . . Am ) auch auf einer Basis von H(n1 +...+nm ) die
Identitt, d.h. als lineare Abbildung damit auch auf ganz H(n1 +...+nm ) .

Ist A : H H ein Operator, so erhlt man die Matrixdarstellung MA bezglich der Standardbasis wie folgt:
A |0 = a11 |0 + a21 |1
A |1 = a12 |0 + a22 |1

MA =



a11 a12
.
a21 a22

86

3 Modellierung eines Quantencomputers

Lemma 3.22 Matrixdarstellung fr ein Tensorprodukt von Operatoren


Es sei H ein zweidimensionaler C-Hilbertraum und es seien A : H H und B : H H
zwei Operatoren mit den Matrixdarstellungen




a11 a12
b b
MA :=
und MB := 11 12
a21 a22
b21 b22
bezglich der Standardbasis. Dann gilt fr die Matrixdarstellung von A B:

MAB =

Beweis.

a11 MB a12 MB
a21 MB a22 MB

a11 b11
a11 b21
=
a21 b11
a21 b21

a11 b12
a11 b22
a21 b12
a21 b22

a12 b11
a12 b21
a22 b11
a22 b21

a12 b12
a12 b22
.
a22 b12
a22 b22

Der Nachweis erfolgt durch einfaches Nachrechnen:


A B |00 = (a11 |0 + a21 |1) (b11 |0 + b21 |1)
= a11 b11 |00 + a11 b21 |01 + a21 b11 |10 + a21 b21 |11 .

Analog fr die drei anderen Basisvektoren.

Lemma 3.22 lsst sich in offensichtlicher Weise auf allgemeine Operatoren bzw. mehrfache
Tensorproduktbildung verallgemeinern.

3.3.3

Elementare Gates fr ein Qbit

Hier betrachten wir den zweidimensionalen C-Hilbertraum H mit der Standardbasis |0 und
|1. Bereits auf einem einzelnen Qbit lassen sich zahlreiche Gates betrachten, die jeweils unitre Operatoren auf H sind. Im Folgenden werden wichtige Beispiele fr solche Gates betrachtet. Es wird jeweils auch eine Matrix-Darstellung der Operatoren bezglich der Standardbasis
angegeben.
Das X-Gate vertauscht die beiden Basisvektoren, d.h. es gilt:
Definition 3.23: X-Gate (Not-Gate)
Ist H der zweidimensionale Zustandsraum eines Qbits, so heit der unitre Operator
X : H H mit der Matrixdarstellung MX das X-Gate oder Not-Gate, wenn gilt
X |0 = |1 ,
X |1 = |0 ,

MX =

 
0 1
.
1 0

Die Anwendung auf einen reinen Zustand bewirkt den Wechsel des Zustandes, d.h. bei Messung
hat sich dann der Bitwert gendert.

3.3 Unitre Operationen auf Quantenbits (Zeitentwicklung)

87

Definition 3.24: Y-Gate


Ist H der zweidimensionale Zustandsraum eines Qbits, so heit der unitre Operator
Y : H H mit der Matrixdarstellung MY das Y-Gate, wenn gilt
Y |0 = i |1 ,
Y |1 = i |0 ,


MY =


0 i
.
i 0

Auch beim Y-Gate werden die Zustnde getauscht. Bei Messung ergibt sich hier (zunchst)
kein Unterschied zum X-Gate.
Definition 3.25: Z-Gate
Ist H der zweidimensionale Zustandsraum eines Qbits, so heit der unitre Operator
Z : H H mit der Matrixdarstellung MZ das Z-Gate, wenn gilt
Z |0 = |0 ,
Z |1 = |1 ,



1 0
MZ =
.
0 1

Das X-, Y-, Z-Gate bzw. die Matrixdarstellung wird auch Pauli-Matrix genannt.
Definition 3.26: H-Gate (Hadamard-Gate)
Ist H der zweidimensionale Zustandsraum eines Qbits, so heit der unitre Operator
H : H H mit der Matrixdarstellung MH das H-Gate oder Hadamard-Gate, wenn gilt
1
H |0 = (|0 + |1) ,
2
1
H |1 = (|0 |1) ,
2

1
MH =
2


1 1
.
1 1

Das Hadamard-Gate erzeugt aus einem reinen Zustand einen Zustand, der mit Wahrscheinlichkeit 12 jeweils zu 0 oder zu 1 gemessen wird, d.h. es wird eine Gleichverteilung erzeugt.
Definition 3.27: P-Gate (Phasen-Gate)
Ist H der zweidimensionale Zustandsraum eines Qbits, so heit der unitre Operator
P : H H mit der Matrixdarstellung MP das P-Gate oder Phasen-Gate, wenn gilt
P |0 = |0 ,
P |1 = i |1 ,

MP =

 
1 0
.
0 i

88

3 Modellierung eines Quantencomputers

Definition 3.28: T-Gate


Ist H der zweidimensionale Zustandsraum eines Qbits, so heit der unitre Operator
T : H H mit der Matrixdarstellung MT das T-Gate, wenn gilt


T |0 = |0 ,

T |1 = exp(i ) |1 ,


4

MT =


1
0
.
0 exp(i 4 )

Das I-Gate ist die Identitt und wird der Vollstndigkeit halber aufgefhrt.
Definition 3.29: I-Gate
Ist H der zweidimensionale Zustandsraum eines Qbits, so heit der unitre Operator
I : H H mit der Matrixdarstellung MI das I-Gate oder die identische Abbildung auf
H, wenn gilt
 
I |0 = |0 ,
10
MI =
.
01
I |1 = |1 ,
Anwendung von Ein-Qbit-Gates auf ein Multi-Qbit
Mit Hilfe des Tensorproduktes fr Operatoren lassen sich Ein-Qbit-Gates auch sinngem fr
Multi-Qbits erweitern.
Betrachtet man ein n-Qbit und mchte man z.B. das Hadamard-Gate auf das k-te Qbit anwenden, wobei in der Produktdarstellung von rechts nach links beginnend mit 0 gezhlt werde, so
ist der folgende Operator anzuwenden:
Hk := I .
. . I H I .
. . I
(n k 1)-fach

k-fach

Bei der Komplexittsbetrachtung fr Quantenalgorithmen werden solche Gates nur mit einer
bzw. einer konstanten Zahl von Operationen gerechnet.
Beispiel 21
Beispielsweise gilt fr xk {0, 1}:
H1 (|x3  |x2  |x1  |x0 ) = |x3  |x2  (H |x1 ) |x0  .
Man erhlt damit z.B.
(9
)
9
1
2
H1
|0000 +
|1111
3
3
9
9
9
9
1
1
1
1
|0000 +
|0010 +
|1101
|1111 .
=
6
6
3
3

3.3 Unitre Operationen auf Quantenbits (Zeitentwicklung)

89

Beispiel 22
Betrachtet wird ein 2-Qbit und die Anwendung des Hadamard-Gates auf das 0-te oder das
1-te Qbit, also H0 = I H und H1 = H I. Fr die Matrixdarstellung gilt dann mit
Lemma 3.22 auf Seite 86 jeweils:

1 1 0 0


1 1 1 0 0
MH 0
MH0 =
=
,
0 MH
2 0 0 1 1
0 0 1 1

10 1 0


1 0 1 0 1
1 MI MI
MH1 =
=
.
2 MI MI
2 1 0 1 0
0 1 0 1
Es lassen sich natrlich mit Hilfe des Tensorproduktes auch mehrere Ein-Qbit-Gates parallel
auf verschiedene Qbits eines Multi-Qbits anwenden. Hufig verwendet wird das mehrfache
Hadamard-Gate:
Hn = H . . . H



n-fach

Beispiel 23
Betrachtet werde ein n-Qbit. Dann gilt:
H

|0n =

n

i=1

=2


n 
n


n
1
(|0 + |1) = 2 2
(H |0) =
(|0 + |1)
2
i=1
i=1

n
2

n
2
1

|jn .

j=0

Beispiel 24
Betrachtet werde ein 2-Qbit und das H2 -Gate. Fr die Matrixdarstellung gilt dann mit
Lemma 3.22 auf Seite 86:

1 1 1 1


1 1 1 1 1
1 MH MH
MH2 =
=
.
2 1 1 1 1
2 MH MH
1 1 1 1

3.3.4

Elementare Gates fr zwei Qbits

Gates fr zwei oder mehr Qbits wurden auch bereits im vorangegangenen Abschnitt betrachtet. Diese waren aber stets als Tensorprodukt von Operatoren fr je ein Qbit formuliert und
wirkten daher nur auf je ein Qbit. Es fehlen noch Operatoren fr die Interaktion von Qbits.

90

3 Modellierung eines Quantencomputers

Bei zwei Qbits sieht man eines als das kontrollierende Qbit an, dessen Zustand die Operation
auf dem anderen Qbit steuert. Daher wird auch von einer kontrollierten Operation gesprochen.
Die einfachste Operation dieser Art ist durch die kontrollierte Not-Operation gegeben:
Definition 3.30: C-Gate
Ist Hn fr n 2 der Zustandsraum eines n-Qbits, so heit der unitre Operator
Cpq : Hn Hn mit n 1 p > q 0 das C-Gate oder CNOT-Gate oder ControlledNote-Gate, wenn fr alle x, y B und 0 a < 2n1p, 0 b < 2pq1 , 0 c < 2q
gilt
Cpq |an1p |x |bpq1 |y |cq = |an1p |x |bpq1 |y x |cq .
Analog sei Cqp definiert.
Fr n = 2 gilt fr alle x, y B:
C10 |x |y = |x |y x ,

MC10

1
0
=
0
0

0
1
0
0

0
0
0
1

0
0
.
1
0

Definition 3.31: S-Gate


Ist Hn fr n 2 der Zustandsraum eines n-Qbits, so heit der unitre Operator
Spq : Hn Hn mit n 1 p > q 0 das S-Gate oder Swap-Gate, wenn fr
alle x, y B und 0 a < 2n1p, 0 b < 2pq1 , 0 c < 2q gilt
Spq |an1p |x |bpq1 |y |cq = |an1p |y |bpq1 |x |cq .
Analog sei Sqp definiert.
Fr n = 2 gilt fr alle x, y B:

S10 |x |y = |y |x ,

3.3.5

MS10

1
0
=
0
0

0
0
1
0

0
1
0
0

0
0
.
0
1

Gates fr Boolesche Funktionen

Fr B = {0, 1} ist eine klassische bitwertige Boolesche Funktion in n Stellen eine Abbildung
Bn B.
Verwendet man die die Elemente von Bn zur Binrdarstellung einer Zahl (bijektive Abbildung),
so lsst sich die Boolesche Funktion kompakt als Abbildung
f : {0, 1, 2, . . ., 2n 1} B

3.3 Unitre Operationen auf Quantenbits (Zeitentwicklung)

91

schreiben. Identifiziert man die Elemente der Definitionsmenge mit den Basisvektoren eines
Zustandsraumes Hn , so lsst sich ein quantenmechanisches Gate Uf definieren, welches der
Abbildung zugeordnet werden kann. Um Uf als unitren Operator schreiben zu knnen, definiert man Uf ber:
Definition 3.32: Uf -Gate
Ist H(n+1) der Zustandsraum eines (n + 1)-Qbits und ist
f : {0, 1, 2, . . . , 2n 1} B
eine n-stellige Boolesche Funktion, so heit der unitre Operator
Uf : H(n+1) H(n+1) das Uf -Gate, wenn gilt
Uf |xn |y1 = |xn |y f(x)1 ,

fr alle x {0, 1, 2, . . . , 2n 1} , y B.

Dabei bedeutet die binre Addition, siehe Beispiel 2 auf Seite 13. Es gilt dann
Uf Uf (|xn |y1 ) = Uf (|xn |y f(x)1 )
= |xn |y f(x) f(x)1 ) = |xn |y1 .
Insbesondere ist U1
f = Uf und Uf somit ein Automorphismus. Uf permutiert die Basisvektoren von H(n+1) und ist als Permutation unitr.
Beispiel 25
Man betrachte eine n-stellige Boolsche Funktion f : {0, 1, 2, . . . , 2n 1} B und die
Anwendung von Uf auf H0 |xn |1, d.h. die Anwendung auf
1
|0 |1
H0 |xn |1 = (|xn |0 |xn |1) = |xn
2
2
Damit folgt
|f(x) |1 f(x)
(1)f(x) (|0 |1)

= |xn
2
2
|0 |1
f(x)
= (1)
.
|xn
2

Uf H0 |xn |1 = |xn

92

3 Modellierung eines Quantencomputers

3.3.6

Quanten-Fouriertransformation

Die Fouriertransformation lsst sich in naheliegender Weise fr Quantenbits formulieren.

Definition 3.33: Fn -Gate (Fouriertransformation)


Ist Hn) der Zustandsraum eines n-Qbits, so heit der unitre Operator
Fn : Hn Hn das Fn -Gate (Fouriertransformation), wenn gilt
n

|xn = 2

n
2

n
2
1

y=0


xy 
exp 2i n |yn ,
2

fr alle x {0, . . . , 2n 1} .

Die Schreibweise Fn wurde der Lesbarkeit halber gewhlt. Die mgliche Unterstellung, dass
dieses Gate das Tensorprodukt von Gates fr ein Qbit ist, ist nicht richtig, auch wenn man dies
bisweilen in der Literatur liest. Allerdings gibt es eine handliche Produktdarstellung, wie gleich
zu sehen sein wird.
Die Unitaritt des Operators Fn wird in folgendem Satz nachgewiesen, in dem die inverse
Fouriertransformation behandelt wird.

Satz 3.34 Inverse Fouriertransformation


Ist Hn) der Zustandsraum eines n-Qbits und Fn : Hn Hn sei das Fn -Gate. Dann
ist die inverse Fouriertransformation gegeben durch
1 n 21 1 n 2
F
= F
Es gilt fr alle x {0, . . . , 2n 1}:
2
1

1 n 21
n
xy 
|xn = 2 2
exp 2i n |yn .
F
2
y=0
n

Beweis.

Sei U : Hn Hn mit
n

U |zn = 2 2

n
2
1

y=0


zy 
exp 2i n |yn ,
2

fr alle z {0, . . . , 2n 1} .

3.3 Unitre Operationen auf Quantenbits (Zeitentwicklung)

93

Dann gilt:
*
U |zn , |xn  =

n
2

n
2
1

y=0
n

= 2 2

n
2
1

y=0


zy 
exp 2i n |yn , |xn
2


zy 
exp 2i n |yn , |xn 
2

n
2
1


n
n
zx 
yx 
exp 2i n |zn , |yn 
= 2 2 exp 2i n = 2 2
2
2
y=0
+
*
n
2
1

%
&
yx 
n
2
exp 2i n |yn = |zn , Fn |xn
= |zn , 2
2
y=0

1
2
Somit ist Fn = U. Weiter gilt
2
1
1 n 2 n
F |xn = Fn
F

(
2

n
2

n
2
1

y=0
n

= 2 2

n
2
1


exp 2i

y=0

=2

n
2

n
2
1

y=0

xy 
exp 2i n |yn
2


xy  1 n 2
F
|yn
2n

2 1

xy  n 
yz 
exp 2i n 2 2
exp 2i n |zn
2
2
z=0



y(x z)
|zn
exp 2i
2n
y=0 z=0
( n 1
n
y )

1 2
2
xz
n
|zn = |xn .
=2
exp 2i n
2
z=0
y=0
= 2n

n
n
1 2
1
2

Die letzte Umformung ergibt sich daraus, dass fr z = x die innere Summe 2n ergibt, und fr
z = x die geometrische Summenformel gilt:
n
2
1

y=0

1
22n
y

1 exp 2i xz
1 exp (2i(x z))
xz
n
2
2 =
2
1
1
exp 2i n
=
2
1 exp 2i xz
1 exp 2i xz
n
2
2n
=

11
2 = 0.
1
1 exp 2i xz
2n


94

3 Modellierung eines Quantencomputers

Satz 3.35 Produktdarstellung der Fouriertransformation


Ist Hn der Zustandsraum eines n-Qbits und Fn : Hn Hn sei das Fn -Gate. Fr
n1
'
xj 2j {0, . . . , 2n 1} mit xj B, j = 0, . . . , n 1, gilt:
x=
j=0

Fn |xn = Fn |xn1 xn2 . . . x1 x0 


n 


x  
n
|0 + exp 2i m |1
= 2 2
2
m=1


n
m1

 xj
n
|0 + exp 2i
|1 .
= 2 2
mj
2
m=1
j=0

Beweis.

Die erste Produktdarstellung ergibt sich aus der Beobachtung fr y = 2nm , dass



xy 
x2nm :: nm&
exp 2i n |yn = exp 2i
2
n
2
2n


x
= exp 2i m |0m1 |1 |0nm .
2

Die zweite Produktdarstellung folgt aus

n1

 xj 2j
x 

exp 2i m = exp 2i
2
2m
j=0

m1
n1
 xj

+ 2i
xj 2jm
= exp 2i
2mj
j=0
j=m

m1
n1
 xj
6
2
1

exp 2ixj 2jm


= exp 2i
2mj
j=0
j=m

m1
 xj
.
= exp 2i
2mj
j=0

Quantenalgorithmen fr
Quantencomputer

4.1

Das Grundprinzip der Quantenalgorithmen

Quantenalgorithmen auf Quantencomputern verfolgen das gleiche Ziel wie klassische Algorithmen auf klassischen Computern: Zu einer gegebenen Problemstellung mit gewissen gegebenen
Eingangsdaten, die sich in einen endlichen Speicher ablegen lassen, werden Ausgangsdaten
berechnet, die ebenfalls einen nur endlich groen Speicher befllen.
In Kapitel 3 wurde die mathematische Modellierung eines Quantencomputers formuliert, dessen Speicher ein Multi-Qbit ist. Die Besonderheit gegenber klassischen Computern besteht
darin, dass der Speicherinhalt aus einem drastisch greren Zustandsraum stammt. Dies wird
aber dadurch kompensiert, dass die Speicherzustnde nicht beobachtet werden knnen, sondern
durch Messung wieder auf eine Zustandsmenge zurckgefhrt werden, die dem klassischen
Computer entspricht.
Ein Quantenalgorithmus besteht typischerweise aus folgenden Teilschritten:
1. Einspeisung von Eingangsdaten (einem klassischen Bittupel), die als reiner Multi-QbitZustand umgesetzt werden.
2. Durchfhrung von deterministischen quantenmechanischen Operationen auf dem Speicher, d.h. Anwendung von einem oder mehreren unitren Operatoren auf das Multi-Qbit.
3. Messung des Multi-Qbits, d.h. Durchfhrung eines Zufallsexperimentes. Als Ergebnis
erhlt man die Ausgangsdaten (ein klassisches Bittupel).

4.2

Der Deutsch-Algorithmus

4.2.1

Zielsetzung

Der dem Prinzip nach auf David Deutsch [6, 14] zurckgehende Algorithmus ist ein besonders einfaches Beispiel, um die Besonderheit von Quantenalgorithmen zu demonstrieren. Man
betrachtet dazu eine Boolesche Funktion
f : B B,

(4.1)

deren Funktionsvorschrift unbekannt sei. Die Funktion wird als ausgeglichen bezeichnet, falls
sie die beiden mglichen Funktionswerte 0 und 1 jeweils annimmt, und sie wird als konstant
bezeichnet, falls f(x) = f(y) fr alle x, y B gilt.

96

4 Quantenalgorithmen fr Quantencomputer

Mit einem Algorithmus soll entschieden werden, ob die Funktion f ausgeglichen oder konstant
ist.
Die naheliegende klassische Lsung besteht darin, dass man die Funktionswerte f(0) und f(1)
bestimmt und miteinander vergleicht, d.h. zur Lsung sind zwei Funktionsauswertungen notwendig.

4.2.2

Formulierung des Verfahrens

Die Entscheidung, ob die Funktion f ausgeglichen ist oder nicht, wird mit Hilfe eines Uf -Gates
getroffen. Als Speicher wird ein 2-Qbit verwendet, und die formale Darstellung des Verfahrens
lautet:

0 := |01 ;
1 := H2 0 ;
2 := Uf 1 ;
3 := H1 2 ;
Y := M13 .
Y = M13 ist die Zufallsvariable zur partiellen Messung des ersten Qbits, siehe Lemma 3.15
auf Seite 77. Ist f konstant, so ist die Zufallsvariable Y P -fast sicher 0, und ist f ausgeglichen,
so ist die Zufallsvariable Y P -fast sicher 1.
Die Einzelschritte des Verfahrens werden nun erlutert.
1 := H2 0 = H2 |01 = (H |0) (H |1) =

|0 + |1 |0 |1


2
2

|0 |1
1 
.
|x
=
2 x=0
2

(4.2)

In Beispiel 25 auf Seite 91 wurde bereits allgemein gezeigt


H0 |xn |1 = |xn

|0 |1

,
2

Uf H0 |xn |1 = (1)f(x) |xn

|0 |1

.
2

Damit folgt
1

1 
|0 |1
2 := Uf 1 =
(1)f(x) |x
2 x=0
2


|0 |1
1
.
= (1)f(0) |0 + (1)f(1) |1
2
2

(4.3)

4.3 Der Deutsch-Jozsa-Algorithmus

97

Weiter gilt

3 := H1 2
 |0 |1
1
(1)f(0) |0 + (1)f(0) |1 + (1)f(1) |0 (1)f(1) |1
=
2
2


(1)f(0) + (1)f(1)
(1)f(0) (1)f(1)
|0 |1
=
|0 +
|1
2
2
2
|0 |1
= |f(0) f(1)
2
$
|0|1

, fr f(0) = f(1),
|0
2
(4.4)
=
|0|1

, fr f(0) = f(1).
|1
2
Die partielle Messung des ersten Qbits durch Realisierung von Y = M13 ergibt somit P -fast
sicher 0, falls f konstant ist, und P -fast sicher 1, falls f ausgeglichen ist.

4.3

Der Deutsch-Jozsa-Algorithmus

4.3.1

Zielsetzung

Die Verallgemeinerung des Algorithmus von Deutsch geht auf David Deutsch und Richard
Jozsa [7, 14] zurck. Man betrachtet eine n-stellige Boolesche Funktion
f : {0, 1, 2, . . . , 2n 1} B,

(4.5)

deren Funktionsvorschrift unbekannt sei, von der aber bekannt sein soll, dass sie entweder
ausgeglichen oder konstant ist. Die Funktion wird als ausgeglichen bezeichnet, falls sie die
beiden mglichen Funktionswerte 0 und 1 jeweils fr die Hlfte der Argumente annimmt, und
sie wird als konstant bezeichnet, falls f(x) = f(y) fr alle x, y {0, 1, 2, . . ., 2n 1} gilt.
Mit einem Algorithmus soll entschieden werden, ob die Funktion f ausgeglichen oder konstant
ist.
Ein klassisches Verfahren bentigt 2n1 + 1 Funktionsauswertungen, um die Fragestellung
sicher zu beantworten. Stochastisch lsst sich mit deutlich weniger Funktionsauswertungen die
Frage mit einer gewissen Fehlerwahrscheinlichkeit entscheiden.

98

4 Quantenalgorithmen fr Quantencomputer

4.3.2

Formulierung des Verfahrens

Definition 4.1: Hadamard-Funktion


Die Hadamard-Funktion h sei definiert ber
h : N20 B,
m
;
xj  yj ,
(x, y) 

mit xj , yj B,

x=

j=0

m


xj 2j ,

y=

j=0

m


yj 2j ,

j=0

d.h. h(x, y) = 1 genau dann, wenn in der Binrdarstellung von x und y beide Zahlen eine
ungeradzahlige Anzahl von Ziffern 1 an gleichen Positionen besitzen.
Lemma 4.2
n

Es sei H

Vielfaches Hadamard-Gate mit Standardbasis


fr ein n N der Zustandsraum eines n-Qbits mit der Standardbasis. Dann gilt
H

|x = 2

n
2

n
2
1

(1)h(x,y) |yn

fr alle

x {0, . . . , 2n 1} .

y=0

Die Matrixdarstellung von Hn bezglich der Standardbasis lautet




MHn = (1)h(i,j)
.
i=0,...,2n 1, j=0,...,2n1

Beweis.

Es sei im Weiteren jeweils


x=

n1


xj 2j ,

n1


y=

j=0

yj 2j ,

mit xj , yj B.

j=0

Es gilt
Hn |x =

n1

H |xn1j  = 2 2

j=0

(|0 + (1)xn1j |1)

j=0

n
2
1

n
2
1

= 2 2

n1

(1)xn1 yn1 ...x0y0 |yn

y=0

= 2 2

(1)h(x,y) |yn .

y=0

4.3 Der Deutsch-Jozsa-Algorithmus

99

Die Entscheidung, ob die Funktion f ausgeglichen ist oder konstant, wird erneut mit Hilfe eines
Uf -Gates getroffen. Als Speicher wird ein (n+1)-Qbit verwendet, und die formale Darstellung
des Verfahrens lautet:

0 := |0n |1 ;
1 := H(n+1)0 ;
2 := Uf 1 ;
1
2
3 := Hn I 2 ;
Y := Mn3 .

Y = Mn3 ist die Zufallsvariable zur partiellen Messung der ersten n Qbits, siehe Lemma 3.15
auf Seite 77, mit Ergebniswerten aus {0, . . . , 2n 1}. Ist f konstant, so ist die Zufallsvariable
Y P -fast sicher 0, und ist f ausgeglichen, so ist die Zufallsvariable Y P -fast sicher grer als
0.
Die Einzelschritte des Verfahrens werden nun erlutert.
Mit Beispiel 23 auf Seite 89 gilt:
1
2
1 := H(n+1)0 = Hn H (|0n |1) = Hn |0n (H |1)
n

= 2 2

n
2
1

|xn

x=0

|0 |1

.
2

(4.6)

In Beispiel 25 auf Seite 91 wurde bereits allgemein gezeigt

H0 |xn |1 = |xn

|0 |1

,
2

Uf H0 |xn |1 = (1)f(x) |xn

|0 |1

.
2

Damit folgt

2 := Uf 1 = 2

n
2

n
2
1

x=0

(1)f(x) |xn

|0 |1

.
2

(4.7)

100

4 Quantenalgorithmen fr Quantencomputer

Weiter gilt
1

3 := H
=2

n
2

1
1
2 n 2
|0 |1
I 2 = Hn I 2 2
(1)f(x) |xn
2
x=0

n
2
1

(1)f(x) Hn |xn

x=0

1
= n
2
=

1
2n

n
1
2

f(x)

(1)

x=0
n
1
2

y=0

n
2
1

|0 |1

(1)h(x,y) |yn

y=0

|0 |1

(2n 1
)

|0 |1
h(x,y)+f(x)
|yn
(1)
2
x=0

)
( n 1
)
n

(2n 1
1 2
2


1
1
f(x)
h(x,y)+f(x)

|y
(1)

|0
+
(1)
=
n
n
2n
n
2 y=1 x=0

x=0



a0 :=

|0 |1

.
2

(4.8)

Ist f konstant, so ist a0 = 1 oder a0 = 1. Da 3 auf 1 normiert ist, folgt in diesem Fall
3 = |0n

|0 |1

,
2

(4.9)

d.h. bei partieller Messung der ersten n Qbits erhlt man 0 mit Wahrscheinlichkeit 1.
Ist f ausgeglichen, so ist a0 = 0, d.h. bei Messung erhlt man das Ergebnis 0 mit Wahrscheinlichkeit 1 nicht.

4.4

Der Grover-Algorithmus

4.4.1

Zielsetzung

Der nach Lov Grover benannte Quanten-Suchalgorithmus [8, 14] sucht aus N gegebenen Elementen einer Menge eines heraus, welches eine vorgegebene Eigenschaft besitzt. Die Elemente
knnen beispielsweise Eintrge einer Datenbank sein, z.B. ein Telefonbuch, und die vorgegebene Eigenschaft ein Teil eines Datensatzes, z.B. eine Telefonnummer. Die konsekutive Suche
nach einem gewnschten Element bentigt im Schnitt N2 Zugriffe auf die Datenbank, falls es
nur eine Lsung gibt. Gibt es M > 1 mgliche Lsungen, so fhrt die konsekutive oder zufllige Suche natrlich im Schnitt mit weniger Zugriffen zum Ziel, z.B. bei der Suche nach
Telefonbucheintrgen mit Rufnummern, die die Zahlenfolge 123 enthalten.

4.4 Der Grover-Algorithmus

101

Der Einfachheit halber werden N = 2n Elemente betrachtet, die eindeutig durch einen Index
aus {0, . . . , 2n 1} identifizierbar seien. Die Funktionsvorschrift einer n-stelligen Booleschen
Funktion
f : {0, 1, 2, . . . , 2n 1} B,

(4.10)

sei derart, dass f(x) = 1 fr gesuchte Indizes x sei, und f(x) = 0 sonst. Dann ist
:
:
M := | {x|f(x) = 1} | = :f 1 ({1}): .

(4.11)

Der Algorithmus hat nun die Aufgabe, mindestens ein x {0, 1, 2, . . ., 2n 1} zu finden mit
der Eigenschaft
f(x) = 1.
Man kann dies als Invertierung der Abbildung f bezeichnen (genauer: Urbildsuche).

4.4.2

Formulierung des Verfahrens

Die Entscheidungsfindung, ob ein zu untersuchendes x {0, 1, 2, . . ., 2n 1} eine Lsung


darstellt, wird oft als Befragung eines Orakels bezeichnet. Hier betrachten wir ein Uf -Gate,
obwohl die Entscheidung auch oft effizient von einem klassischenBAlgorithmus
gefllt werden
" C
kann. Als Speicher wird ein (n + 1)-Qbit verwendet. Mit R :=
Darstellung des Verfahrens:

M
N

lautet die formale

0 := |0n |1 ;
1 := H(n+1) 0 ;
Schleife fr r = 1, . . . , R :
r+1 := Uf r ;
2
2
11
r+1 := Hn (2 |0n 0|n In )Hn I r+1 ;
Schleifenende
Y := MnR+1 .

Y = Mn R+1 ist die Zufallsvariable zur partiellen Messung der ersten n Qbits, siehe Lemma 3.15 auf Seite 77, mit Ergebniswerten aus {0, . . . , 2n 1}. Mit hoher Wahrscheinlichkeit
ist das Ergebnis eine Lsung der Problemstellung.
Die Einzelschritte des Verfahrens werden nun erlutert.
Mit Beispiel 23 auf Seite 89 gilt:

2
1
1 := H(n+1)0 = Hn H (|0n |1) = Hn |0n (H |1)
=

n
2
1

x=0

2 2 |xn

|0 |1

.
2

(4.12)

102

4 Quantenalgorithmen fr Quantencomputer

In einer rekursiven Vorgehensweise werden nun Folgen (r,0 )rN und (r,1 )rN definiert, wobei der Rekursionsstart wie folgt festgelegt wird:
n

1,0 := 2 2

und 1,1 := 2 2 .

(4.13)

Induktiv wird gezeigt, dass gilt

r =

n
2
1

r,f(x) |xn

x=0

|0 |1

,
2

fr r 1.

(4.14)

Der Induktionsanfang fr r = 1 ist bereits nachgewiesen durch (4.12) und (4.13).


In Beispiel 25 auf Seite 91 wurde bereits allgemein gezeigt

Uf

|0 |1
|xn
2


= (1)f(x) |xn

|0 |1

.
2

(4.15)

Damit folgt
r+1 := Uf r =

n
2
1

(1)f(x) r,f(x) |xn

x=0

|0 |1

.
2

(4.16)

2 |0n 0|n In ist eine Householder-Spiegelung, die den Basisvektor |0n unverndert lsst
und alle anderen Basisvektoren jeweils spiegelt, d.h.
1
2
2 |0n 0|n In |xn =

fr x = 0,
|0n ,
|xn , fr x > 0.

Es gilt dann
1
2
:= Hn 2 |0 0| In Hn
G
n
n
21
2
1
= 2 Hn |0n 0|n Hn Hn In Hn
)(
)
(
n
n
2
1
2
1
n
n

2 2
=2 2 2
|zn
y|n In
z=0

= 21n

n
n
1 2
1
2

z=0 y=0

y=0

|zn y| n In .

(4.17)

4.4 Der Grover-Algorithmus

103

Weiter gilt mit zunchst beliebigen Koeffizienten ax C, dass

n
2
1

ax |xn =

x=0

n
2
1

|x
ax G
n

x=0

n
2
1

n
2
1

x=0

n
2
1

x=0

n
2
1

ax

x=0

1n

1n

n
1
2

|zn y|n |xn I

(
1n

( (
2

x=0

n
1
2

)
)

a z ax

z=0
n

|xn

|zn |xn

z=0

)
n

z=0 y=0

(
ax

n
n
1 2
1
2

2 1
1 
az
2n z=0

|xn

)
ax

|xn .

(4.18)

Ist nun speziell ax = (1)f(x) r,f(x) aus (4.16), so gilt insbesondere


n

2 1
2 1
1 
1 
a
=
(1)f(z) r,f(z)
z
2n z=0
2n z=0

1
1
M (1)1 r,1 + n (2n M ) (1)0 r,0
n
2
2
M
M
= n r,1 + (1 n ) r,0 .
2
2
=

Mit (4.16) und (4.18) folgt die Darstellung


I)r+1 =
r+1 = (G

n
2
1

r+1,f(x) |xn

x=0

|0 |1

,
2

(4.19)

wenn die Folgenglieder r+1,0 und r+1,1 wie folgt gesetzt werden:
(
r+1,0 = 2

2 1
1 
az
2n z=0

)
(1)0 r,0



M
M
= 2 n r,1 + (1 n ) r,0 r,0
2
2
M
M
= (1 n1 ) r,0 n1 r,1
2
2
M
= r,0 n1 (r,0 + r,1 ).
2

(4.20)

104

4 Quantenalgorithmen fr Quantencomputer
(
r+1,1 = 2

2 1
1 
az
2n z=0

)
(1)1 r,1



M
M
= 2 n r,1 + (1 n ) r,0 + r,1
2
2
M
M
= (2 n1 ) r,0 + (1 n1 ) r,1 .
2
2
M
= 2r,0 + r,1 n1 (r,0 + r,1 ).
2

(4.21)

Die Koeffizientenfolgen (r,0 )rN und (r,1 )rN sind somit ber (4.13), (4.20) und (4.21) eindeutig rekursiv festgelegt und durch den Induktionsschritt von r auf r + 1 in (4.19) ist die
Formel (4.14) nun allgemein nachgewiesen.
Im nchsten Schritt wird eine explizite Darstellung der Koeffizienten hergeleitet. Aufgrund der
rekursiven Definition sind die Koeffizientenfolgen (r,0 )rN und (r,1 )rN rein reelle Folgen
und es gilt mit der Normierung von r jeweils
(2n M )2r,0 + M 2r,1 = 1 fr alle r N.

(4.22)

Insbesondere folgt mit dem Ansatz

1
1,0 =
cos
2
2n M

und 1,1 = sin


2
M

(4.23)

aus (4.13), dass


1

cos =
n
2
2 M
2n

cos =
2

2n M
,
2n

sin =
2

M
.
2n

Somit hat man


9
= arcsin

M
.
2n

(4.24)

Allgemein betrachtet man


1
cos r
r,0 = n
2 M

1
und r,1 = sin r ,
M

(4.25)

4.4 Der Grover-Algorithmus


so dass folgt

105

2n M r+1,0



M
M
n
= 2 M (1 n1 ) r,0 n1 r,1
2
2

M
M
= (1 n1 ) cos r 2n M n1 sin r
2
2
9
9
M
2n M
M
= (1 2 n ) cos r 2

sin r
n
2
2
2n

= (1 2 sin2 ) cos r 2 cos sin sin r


2
2
2
= cos cos r sin sin r = cos(r + ).

cos r+1 =

Man erhlt somit


2r 1
.
(4.26)
2
Insgesamt ist also nun eine explizite Darstellung der Koeffizientenfolgen und damit der Zustnde r gefunden.
r =

Als letzten Schritt ermitteln wir die optimale Iterationszahl fr den Algorithmus. Dazu betrachtet man die Wahrscheinlichkeit dafr, dass die Messung eine Lsung y der Aufgabenstellung
ergibt, also ein y mit f(y) = 1. Mit (4.14), (4.25) und (4.26) betrgt diese Wahrscheinlichkeit:
2
 
2R + 1
P ({f(Y ) = 1}) = M 2R+1,1 = sin2 R+1 = sin

.
(4.27)
2
Die optimale Iteraionszahl R ist daher wie folgt zu whlen:
2R + 1

2
2

2R + 1

2 2

1
1
1

1
" .
=
4 2
2
4 arcsin M
2
2n

Unter Verwendung der Reihenentwicklung des arcsin fr M $ 2n erhlt man


9
1
2n
1

"


.

R
4 arcsin M
2
4 M

(4.28)

2n

Beispiel 26
Fr n = 30 etwa sind ber eine Milliarde Elemente zu durchsuchen, wobei beispielsweise
nur ein Element eine Lsung darstellen soll, also M = 1. Dann ist
R 25736.
Die Wahrscheinlichkeit, dass eine Messung mit dieser Iterationszahl die gesuchte Lsung
ausgibt, ist mit (4.27) nahezu 1.

106

4 Quantenalgorithmen fr Quantencomputer

4.5

Der Shor-Algorithmus

4.5.1

Anwendungshintergrund:
Das RSA-Verschlsselungsverfahren

Der Auslser fr das breite Interesse an Quantencomputern und Quantenalgorithmen auch jenseits der Fachwelt war sicher das Verfahren von Peter Shor [21] zur Faktorisierung von Zahlen.
Der Grund dafr ist nicht eine neu entdeckte Liebe zu Grundlagen der Zahlentheorie, sondern
die mglichen Konsequenzen fr die aktuellen Verschlsselungsverfahren, deren Sicherheit auf
der De-facto-Unzerlegbarkeit der Produkte groer Primzahlen beruht.
Vor der Diskussion des Faktorisierungsverfahrens soll daher kurz das Grundprinzip des RSAVerschlsselungsverfahrens vorgestellt werden, um die Bedeutung der Faktorisierung zu unterstreichen und die Anwendung zu beleuchten. Das Verfahren trgt seinen Namen nach Rivest,
Shamir und Adleman, die es 1978 verffentlichten [16]. Es handelt sich um ein sogenanntes Public-Key-Verfahren [3]. Ein ffentlicher Schlssel wird von einem Nachrichten-Absender
zur Verschlsselung einer Nachricht verwendet. Nur ein privater Schlssel kann die verschlsselte Nachricht wieder entschlsseln (so die Absicht), so dass nur der richtige NachrichtenEmpfnger den unverschlsselten Inhalt der Nachricht lesen kann.
Beim RSA-Verfahren werden diese beiden Schlssel wie folgt erzeugt:
1. Bestimmung von zwei unterschiedlichen (und groen) Primzahlen p und q. In der Praxis
werden solche Primzahlen stochastisch erzeugt und mit Primzahltests auf ihre Primzahleigenschaft hin validiert.
2. Berechnung von n = p q und (n) = (p 1)(q 1). Bei (n) handelt es sich um die
Eulersche -Funktion, die die Anzahl der zu n teilerfremden Zahlen kleiner als n angibt.
3. Wahl einer Zahl e mit 1 < e < (n) und ggT(e, (n)) = 1.
Der ffentliche Schlssel ist (e, n).
4. Berechnung der Zahl d = e1 (mod (n)), d.h. e d = 1 (mod (n)).
Der private Schlssel ist (d, n).
Nun wird die Verschlsselung einer Nachricht m betrachtet, wobei hier 0 m < n angenommen wird (sonst erfolgt eine blockweise Zerlegung). Die verschlsselte Nachricht c wird mit
Hilfe des ffentlichen Schlssels (e, n) berechnet wie folgt
c = me

(mod n).

(4.29)

Die verschlsselte Nachricht c wird zum Empfnger bertragen, der mit Hilfe des privaten
Schlssels (d, n) die ursprngliche Nachricht erhlt ber
m = cd

(mod n).

Das Funktionieren der Entschlsselung ist durch das nachfolgende Lemma abgesichert.

(4.30)

4.5 Der Shor-Algorithmus

107

Lemma 4.3 RSA-Kongruenz


Es seien p, q zwei Primzahlen mit p =
 q und n := p q. Weiter seien e und d zwei Zahlen
mit ggT(e, (n)) = 1 und e d = 1 (mod (n)). Dann gilt
med m

Beweis.

(mod n)

fr alle

0 m < n.

Aus e d = 1 (mod (n)) folgt die Existenz von r N0 mit


r (n) = e d 1.

Ist m = 0, so ist nichts zu zeigen, d.h. sei im Weiteren 1 < m < n. Dann gilt also
ggT(m, n) {1, p, q} .
Im Fall ggT(m, n) = 1 folgt
r

med = mr(n)+1 = m(n) m m

(mod n),

da nach dem Satz von Euler-Fermat gilt


m(n) 1

(mod n).

Im Fall ggT(m, n) = p teilt p die Zahl m, so dass


med m

(mod p)

gilt. Der kleine fermatsche Satz mq1 1 mod q liefert zudem


2r(p1)
1
med = mr(n)+1 = mr(p1)(q1)+1 = mq1
mm

(mod q),

so dass der chinesische Restsatz schlielich ergibt


med m

(mod pq)

Analog verluft der Fall ggT(m, n) = q.

med m

(mod n).


Die Sicherheit des RSA-Verfahrens ergibt sich aus der Schwierigkeit, den privaten Schlssel
nachzubilden, wenn man die Faktorisierung n = p q nicht kennt. Tatschlich kann man auch
mit weniger Wissen die Nachricht entschlsseln [14], aber eine erfolgreiche Faktorisierung
wrde die Verschlsselung brechen. Es sei betont, dass die Faktorisierung natrlich keineswegs
unmglich ist, sondern lediglich aufwendig. Nach allen bekannten Algorithmen ist die Komplexitt exponentiell gro, aber es gibt auch dafr keinen allgemeinen Nachweis. Nachfolgend
betrachten wir nun einen Faktorisierungsalgorithmus mit Hilfe eines Quantenverfahrens.

108

4.5.2

4 Quantenalgorithmen fr Quantencomputer

Primfaktorzerlegung durch Ordnungsbestimmung

Die Verallgemeinerung des Anwendungsproblems aus dem vorhergehenden Abschnitt ist die
Primfaktorzerlegung einer beliebigen Zahl n N mit n > 2, d.h. die Auffindung der Darstellung
m
1
n = p
1 . . . pm ,

(4.31)

wobei p1 , . . . , pm paarweise verschiedene Primzahlen sind und 1 , . . . , m N, m N.


Fr die Binrdarstellung der Zahl n werden
L := %log2 (n + 1)& = 'log2 n( + 1

(4.32)

Binrstellen verwendet, da
2L1 n 2L 1.


L
Alle bekannten klassischen Algorithmen bentigen mindestens O L 2 2 Operationen zur
Ermittlung eines Primfaktors, falls m > 1. Bezogen auf die Stellenzahl von n ist die Komplexitt also exponentiell gro.
Jetzt betrachten wir ein klassisches Verfahren, welches ein Unterprogramm zur sogenannten
Ordnungsbestimmung verwendet. Ohne die Komplexitt
des Unterprogramms einzubeziehen,
1 2
bentigt das jetzt vorgestellte Verfahren nur O L3 Operationen zur Ermittlung eines Primfaktors, hat also nur eine polynomiale Komplexitt. Das Unterprogramm hat mit den bekannten klassischen Verfahren zur Ordnungsbestimmung exponentielle Komplexitt, aber auf einem Quantencomputer ist die Ordnungsbestimmung mit polynomialer Komplexitt mglich.
In Abschnitt 4.5.3 wird der quantenmechanische Anteil des Unterprogramms beschrieben. Das
Ergebnis wird dann aber noch durch ein in Abschnitt 4.5.4 beschriebenes Verfahren nachbearbeitet.
Definition 4.4: Ordnung von a modulo n
Es seien a, n N mit a < n und ggT(a, n) = 1. Dann heit die kleinste Zahl r N mit
ar 1

(mod n)

die Ordnung von a modulo n.


Beispiel 27
Ist n = 13 und a = 5, so ist r = 4 die Ordnung von 5 modulo 13, da
54 1

(mod 13),

aber die Gleichung fr kleinere Exponenten nicht erfllt ist.


Die Ordnung ist stets kleiner oder gleich n, wie das folgende einfache Lemma zeigt.

4.5 Der Shor-Algorithmus

109

Lemma 4.5 Gre der Ordnung


Es seien a, n N mit a < n und ggT(a, n) = 1. Dann gibt es eine Ordnung r von a modulo
n, und es gilt:
1 r n.

Beweis. Man betrachte as (modn) fr s = 1, 2, . . .. Da es nur n Zahlen modulo n gibt, muss


somit 1 s1 < s2 existieren mit
a s 2 = as 1

(mod n)

as2 s1 = 1 (mod n).

Wir nehmen nun an, dass r > n ist. Nun betrachte man wie eben as (modn) fr s = 1, 2, . . .
Da es nur n Zahlen modulo n gibt, muss somit 1 r1 < r2 < r existieren mit
ar2 = ar1

(mod n)

ar2 r1 = 1 (mod n).

Da 1 r2 r1 < r gilt, ist r > n widerlegt.

Satz 4.6 Faktorbestimmung ber die Ordnung


Es seien a, n N mit a < n und ggT(a, n) = 1. r sei die Ordnung von a modulo n.
r
Falls r gerade ist und falls a 2 + 1  0 (mod n), dann sind
r

1 < ggT(a 2 + 1, n) < n und 1 < ggT(a 2 1, n) < n


zwei nichttriviale Faktoren von n.
Beweis.

Unter der Voraussetzung, dass r gerade ist, gilt


1 r
21 r
2
a 2 + 1 a 2 1 = ar 1 0 (mod n).
r

Da n die Zahl ar 1 teilt, besitzt somit n mit a 2 + 1 oder mit a 2 1 einen gemeinsamen
Faktor, d.h.
r

ggT(a 2 + 1, n) > 1 oder

ggT(a 2 1, n) > 1.

Da aufgrund der Voraussetzung a 2 + 1  0 (mod n) und aufgrund der Ordnungsdefinition


r
r
a 2  1 (mod n), also a 2 1  0 (mod n), kann n kein Teiler der einzelnen Faktoren sein,
also
r

ggT(a 2 + 1, n) < n und


r

ggT(a 2 1, n) < n.
r

Also besitzt n mit ggT(a 2 + 1, n) oder mit ggT(a 2 1, n) einen nichttrivialen Faktor, aber
damit auch mit dem jeweils anderen.


110

4 Quantenalgorithmen fr Quantencomputer

Beispiel 28
Ist n = 12 und a = 5, so ist r = 2 die Ordnung von 5 modulo 12, da
52 1

(mod 12),

aber die Gleichung fr kleinere Exponenten nicht erfllt ist. Die Ordnung ist gerade und
51 + 1 = 6  0 (mod 12). Als Faktoren von 12 erhlt man
ggT(51 + 1, 12) = ggT(6, 12) = 6,

ggT(51 1, 12) = ggT(4, 12) = 4.

Beispiel 29
In der Situation von Beispiel 27 auf Seite 108 ist Satz 4.6 auf der vorherigen Seite nicht
anwendbar, da
4

5 2 + 1 = 26 0

(mod 13).

Im Umkehrschluss gilt natrlich allgemein, dass fr Primzahlen n die Voraussetzungen von


Satz 4.6 auf der vorherigen Seite niemals erfllt sein knnen. Fr die allgemeine Anwendung
ist es daher wichtig zu wissen, wie wahrscheinlich es ist, dass die Voraussetzungen des Satzes
erfllt sind.

Satz 4.7

Voraussetzungen zur Faktorbestimmung

Es seien n N ungerade und


m
1
n = p
1 . . . pm ,

wobei p1 , . . . , pm paarweise verschiedene Primzahlen sind und 1 , . . . , m N, m N.


Wird a N mit a < n und ggT(a, n) = 1 gleichverteilt in einem Zufallsexperiment
ermittelt und ist r die Ordnung von a modulo n, so gilt
P

Beweis.

1
2
r
r ist gerade und a 2 + 1  0(modn) 1

1
.
2m1

[14]

Besitzt also ein ungerades n mindestens zwei unterschiedliche Primfaktoren, so ist die Wahrscheinlichkeit der Anwendbarkeit von Satz 4.6 auf der vorherigen Seite mindestens 12 .
Damit lsst sich nun folgendes Verfahren (benannt nach G. L. Miller) zur Bestimmung eines
nichttrivialen Faktors fr n angeben:
Schritt 1: Falls n gerade ist, ist 2 ein nichttrivialer Faktor von n (Stop).

4.5 Der Shor-Algorithmus

111

Schritt 2: Prfung, ob n = ab fr eine Zahl a 3 und b 2 gilt. In diesem Fall wrde gelten:
b = loga n =

log2 n
< %log2 (n + 1)& = L.
log2 a

Daher berechne man fr alle1 2 b L die Zahlen a1 , a2 N mit


2

log 2 n
b

1 < a1 2

log 2 n
b

a2 < 2

log2 n
b

+1

und prfe ab1 = n und ab2 = n. Bei erfolgreicher Prfung ist a1 bzw. a2 ein nichttrivialer
Faktor von n (Stop).
Schritt 3: Man bestimme gleichverteilt ein a {2, . . . , n 1}. Falls ggT(a, n) > 1, so ist
ggT(a, n) ein nichttrivialer Faktor von n (Stop).
Schritt 4: Man berechne die Ordnung r von a modulo n.
r

Schritt 5: Falls r gerade ist und falls a 2 + 1  0 (mod n), dann sind
r

1 < ggT(a 2 + 1, n) < n und 1 < ggT(a 2 1, n) < n


zwei nichttriviale Faktoren von n (Stop).
Schritt 6: Gehe zu Schritt 3.
1 2
Das Verfahren bentigt ohne Bercksichtigung des vierten Schrittes O L3 Operationen (Komplexitt des Euklidischen Algorithmus) fr einen Durchlauf. Das Verfahren terminiert nicht,
wenn n eine Primzahl ist. Da anderenfalls die Erfolgswahrscheinlichkeit von Schritt 5 mindestens gleich 12 ist, terminiert der Algorithmus sptestens nach k Durchlufen mit der Wahrscheinlichkeit 1 ( 12 )k .
Wei man, dass n = p q fr zwei Primzahlen p > 2 und q > 2 gilt, so kann direkt mit Schritt
3 begonnen werden.
Offen geblieben ist die Ordnungsberechnung in Schritt 4. Diese wird in den beiden nachfolgenden Abschnitten behandelt.

4.5.3

Quantenalgorithmus zur Ordnungsbestimmung


durch Phasenschtzung

Der nun folgende Algorithmus berechnet in der Vorgehensweise von [14, 21] nicht direkt die
Ordnung r von a modulo n, sondern ergibt mit einer whlbar hohen Wahrscheinlichkeit eine
gute Approximation fr einen Bruch
s
r

mit 0 s r.

(4.33)

Unter geeigneten Voraussetzungen lsst sich daraus die Zahl r ermitteln, wie im nchsten Abschnitt 4.5.4 gezeigt wird.
1 Dieses Vorgehen lsst

sich offensichtlich noch optimieren.

112

4 Quantenalgorithmen fr Quantencomputer

Definition 4.8: Exponentialgate Ea -Gate


Sind m, n, a, L N mit 1 < n < 2L und a < n und ist H(m+L) der Zustandsraum eines
(m + L)-Qbits, so heit der unitre Operator Ea : H(m+L) H(m+L) das Ea -Gate
(Exponentialgate), wenn fr alle x {0, . . . , 2m 1} gilt:
$
|xm |ax y(modn)L , fr y {0, . . . , n 1} ,


Ea |xm |yL =
|xm |yL ,
fr y n, . . . , 2L 1 .
Zum Nachweis der Unitaritt von Ea muss nur die Umkehrbarkeit gezeigt werden. Fr y n
ist nichts zu zeigen und fr y < n gilt mit der Ordnung r von a:
Era |xm |yL = |xm |arx y(modn)L = |xm |y(modn)L = |xm |yL ,
r1
also ist E1
a = Ea .

Das Quantenverfahren arbeitet mit einem (m + L)-Qbit, wobei die Gre von m spter behandelt wird. Das Verfahren lsst sich nun wie folgt formal beschreiben:

0 := |0m |1L ;


1 := Hm IL 0 ;
2 := Ea 1 ;


3 := Fm IL 2 ;
3
Y := Mm
.

3
Y = Mm
ist die Zufallsvariable zur partiellen Messung der ersten m Qbits, siehe Lemma 3.15
auf Seite 77, mit Ergebniswerten aus {0, . . . , 2m 1}. Das Messergebnis wird als Bruchzahl
s
r bzw. als eine Approximation dafr interpretiert, wie weiter unten zu sehen sein wird.

Nun werden die Einzelschritte diskutiert:






1 := Hm IL 0 = Hm IL (|0m |1L )
=

m
2
1

2 2 |xm |1L .

(4.34)

x=0

Mit Definition 4.8 folgt daraus als Nchstes


2 := Ea 1 =

m
2
1

2 2 Ea |xm |1L

x=0
m

= 2 2

m
2
1

x=0

|xm |ax (modn)L .

(4.35)

4.5 Der Shor-Algorithmus

113

Dann wird die Fouriertransformation gem Definition 3.33 auf Seite 92 angewandt:


3 := F
=2

m
2

m
2
1


2 = 2

1
2m

m
2

m
2
1

y=0

m
m
1 2
1
2

y=0

m
2
1

2
Fm |xm |ax (modn)L

x=0

x=0

m
2

x=0

xy 
exp 2i m |ym
2


)
|ax (modn)L


xy 
exp 2i m |ym |ax (modn)L .
2

(4.36)

Da |ar (modn)L =:|1&L , wird durch |ax (modn)L periodisch fr viele 0 < x < 2m 1 der
gleiche Basisvektor :ak L beschrieben, nmlich
: &
(4.37)
|ax (modn)L = :ak L
E
D m
2 1k
.
fr alle x = k + r j mit 0 j
r
Mit der Abkrzung

bk :=

E
2m 1 k
+1
r

(4.38)

folgt damit
m

2 1k
(


r
2m 1 r1 '
: k
&
1   
(k + r j)y
:a (modn)
|y
3 = m
exp 2i
m
L
2 y=0
2m

k=0

m
2
1

y=0

|ym

j=0

(4.39)






b
r1 exp 2i ky
k 1

m
: k
&
2
r

:a (modn) .
exp 2i m

L
2m
2
j=0

k=0

Die abschlieende partielle Messung der ersten m Qbits von 3 , also die Realisierung der Zu3
fallsvariablen Y = Mm
, liefert nach Korollar 3.16 auf Seite 80 das Ergebnis y {0, . . . , 2m 1}
mit der Wahrscheinlichkeit


:
:2
ky
:
 :

b
r1
k 1
 : exp 2i 2m
r j y ::
:

P ({Y = y}) = py =
exp 2i m
:
:
m
2
2
:
j=0
k=0 :
:
:2
:
r1 :bk 1

r y j ::
1  ::  
exp 2i m
= 2m
(4.40)
:
: .
2
2
:
k=0 : j=0

114

4 Quantenalgorithmen fr Quantencomputer

Von den mglichen Messergebnissen sind diejenigen erwnscht, die


s
r

mit 0 s r

gut approximieren. Als die erwnschte Ergebnismenge definiert man

:
F :: y

1
s
:
E := y {0, . . . , 2m 1}
: m : 2 .

2
r
2r

(4.41)

s{0,...,r}

Ist y  E, so gilt folglich


: y
1
s ::
:
: m : > 2 fr alle s {0, . . . , r}
2
r
2r
:
: ry
1
:
:
fr alle s {0, . . . , r}
: m s: >
2
2r
ry
1
1

< |y| .
= s + y fr ein s {0, . . . , r} und
2m
2r
2

(4.42)

Somit erhlt man fr y  E die Wahrscheinlichkeiten (4.40) mit der geometrischen Summe
:
:2
:
r1 :bk 1
:
1  :: 
j:
py = 2m
(exp
(2i(s
+
y)))
:
:
2
:
k=0 : j=0
:
:2
:
r1 :bk 1
1  :: 
j ::
= 2m
(exp (i2y)) :
:
2
: j=0
:
k=0

:2
r1 :
1  :: 1 exp (i2bk y) ::
= 2m
: 1 exp (i2y) : .
2

(4.43)

k=0

Nun gilt aber


|1 exp(i)|2 = |1 cos i sin |2 = (1 cos )2 + sin2

= 2 2 cos = 4 sin2
2

(4.44)

und fr gilt weiter


|1 exp(i)|2 = 4 sin2

 2

4
= 2 2 .
4
2

(4.45)

Unter Beachtung von |2y| folgt damit


py

r1
1 

22m

4
(2y)2
k=0 2

r
1
.
22m 4(y)2

(4.46)

4.5 Der Shor-Algorithmus

115

Zur Abkrzung betrachte man


A :=

2m
2r 2

(4.47)

und erhlt
r
r
1
1
r
= 2m 1
22 = 4 2 1 y
22
2
ry
4(y)
2 4 m s
4r A 4
2
2rA s
1
=
2 .
4r (y 2srA)

py

22m

(4.48)

Ist y  E, so gibt es also ein s {0, . . . , r}, so dass


: ry
: 1
1
1
1
:
:
< |y|

< : m s:
2r
2:
2r
2
2
:
m:
m
:
2
2
2m
:
A < |y 2srA| rA.
< ::y s

2r 2
r :
2r
Damit folgt
2srA rA y < 2srA A oder

2srA + A < y 2srA + rA.

(4.49)

Unter Beachtung, dass y {0, . . . , 2m 1}, ergibt sich

P ({Y  E})

1 
4r


1
+
2
y
s=1

A<yrA

r1

2m rAy<2m A

1
2

(y 2srA)
A<|y2srA|rA

(y 2m )

rA

rA
rA
r1

1
1
1
1
dy +
2
dy +
dy

4r
y2
y2
y2
s=1
A1

A1

G
HrA
1
1
1
1

dy
=
2r
4r
y2
2
y A1
A1


1
1
1
1

.
2 A 1 rA
2(A 1)

A1

rA

(4.50)

Ist 0 < < 1 eine vorgegebene Wahrscheinlichkeit dafr, dass das Messergebnis y mit hchstens dieser Wahrscheinlichkeit nicht in der gewnschten Ergebnismenge E liegt, so ist m wie

116

4 Quantenalgorithmen fr Quantencomputer

folgt zu whlen:
P ({Y  E})

!
1

2(A 1)


m 1 2 log2 r log2 1 +

m 2 log2 r + 1 + log2 1 +

1
A1+
2

1
2

1
2

1
2m
1+
2
2r
2

Wird m derart gewhlt, dass


J

I
1
,
m 2L + 1 + log2 1 +
2

(4.51)

so gibt es also zu einem Messergebnis y mit einer Wahrscheinlichkeit von mindestens 1 ein
s {0, . . . , r}, so dass
: y
1
s ::
:
(4.52)
: m : 2.
2
r
2r
Beispiel 30
Um ein Messergebnis y aus der gewnschten Menge E mit einer Wahrscheinlichkeit von
99, 9999% zu erzeugen, ist = 106 zu betrachten. Man whlt dann

J
I
1
= 2L + 20.
m = 2L + 1 + log2 1 +
2 106
Im Vergleich zu einer vielleicht sehr groen Binrstellenzahl L spielt der Aufwand zur
Erzielung einer hohen Sicherheitswahrscheinlichkeit fr ein gewnschtes Ergebnis kaum
eine Rolle.
1 2
Um den Quantenalgorithmus durchzufhren, werden nach [14] O L3 elementare Quantengatter bentigt, siehe auch Abschnitt 3.3.3. Zhlt man diese wie Operationen auf einem klassischen
Computer, so besitzt der Quantenalgorithmus also nur polynomialen Aufwand im Vergleich
zum exponentiellen Aufwand eines klassischen Verfahrens auf einem klassischen Computer.

4.5.4

Ordnungsbestimmung durch Kettenbruchzerlegung

Das Ergebnis des Quantenverfahrens ist also nun eine Zahl 2ym , die eine Approximation eines
Verhltnisses sr ist, wobei sowohl s als auch r unbekannt sind. Fr das Verhltnis gilt mit hoher
Wahrscheinlichkeit 1 , dass
: y
1
s ::
:
: m : 2.
2
r
2r
Um daraus r zu bestimmen, wird nun ein klassischer Algorithmus verwendet.

4.5 Der Shor-Algorithmus


Definition 4.9:

117

Endlicher Kettenbruch

Sind a0 Z und a1 , . . . , aK N mit K N0 gegeben, so heit


1

[a0 , . . . , aK ] := a0 +

a1 +

a2 +
a3 +

1
..

.+

1
aK

ein endlicher Kettenbruch.


Ein endlicher Kettenbruch heit eindeutig, falls K = 0 oder aK > 1 gilt.
Die k-te Konvergente eines eindeutigen endlichen Kettenbruchs [a0 , . . . , aK ] Q ist fr
k {0, . . . , K} definiert durch den Kettenbruch [a0 , . . . , bk ].
Satz 4.10 Kettenbruchdarstellung rationaler Zahlen
Jede rationale Zahl pq Q mit p Z und q N lsst sich durch genau einen eindeutigen endlichen Kettenbruch [a0 , . . . , aK ] = pq darstellen. Mit r1 , . . . , rK N gibt es die
Darstellung (Euklidischer Algorithmus):
p = a0 q + r 1
q = a1 r 1 + r 2
r 1 = a2 r 2 + r 3
..
.
rK2 = aK1 rK1 + rK
rK1 = aK rK + 0.

(0 < r1 < q),


(0 < r2 < r1 ),
(0 < r3 < r2 ),

(0 < rK < rK1 ),

Beweis. Als Folge (rk )k fallender natrlicher Zahlen muss rK+1 = 0 gelten fr einen Index
K. Daher terminiert der euklidische Algorithmus. Fr die erzeugten Zahlen gilt rekursiv:
r1
1
1
1
p
= a0 +
= a0 +
= a0 +
= a0 +
r2
1
q
q
q
a1 +
a1 +
r1
r1
r1
r2
1
1
= a0 +
= . . . = a0 +
.
1
1
a1 +
a1 +
r3
1
a2 +
a2 +
r2
1
a3 +
1
..
.+
aK

118

4 Quantenalgorithmen fr Quantencomputer

Falls K > 0 ist, so ist auch aK > 1, denn anderenfalls wre aK = 1 und damit rK1 = rK . In
diesem Fall wrde aber
rK2 = aK1 rK1 + rK = aK1 rK1 + rK1 = (aK1 + 1)rK1 + 0
gelten und der Algorithmus wre frher beendet gewesen.
Die Eindeutigkeit ergibt sich ohne Einschrnkung der Allgemeinheit aus folgender Beobachtung. Angenommen, es wre
a1 , . . . ,
aK ],
[a0 , a1 , . . . , aK ] = [a0 ,

wobei o.E.d.A.

a1 < a1 .

Dann gbe es x, y Q mit 0 x, y < 1 und


a0 +

1
1
= a0 +
a1 + x
a
1 + y

a1 +x = a
1 +y

xy = a
1 a1 1,

aber es ist x y < 1 und somit ist die Annahme widerlegt.

Beispiel 31
Es gilt
15
1
1
1
67
=1+
=1+
=1+
=1+
7
1
52
52
52
3+
3+
15
15
15
7
1
=1+
= [1, 3, 2, 7].
1
3+
1
2+
7
In Formulierung mit dem euklidischen Algorithmus lautet die Umformung
67 = 1 52 + 15,
52 = 3 15 + 7,
15 = 2 7 + 1,
7 = 7 1 + 0.
Satz 4.11 Konvergenteneigenschaft
Es seien x, pq Q mit p Z und q N, so dass
:
:
:x
:
so ist

p
q

Beweis.

:
1
p ::

,
q : 2q 2

eine Konvergente in der eindeutigen endlichen Kettenbruchdarstellung von x.


[14]

4.5 Der Shor-Algorithmus

119

Korollar 4.12 Konvergenteneigenschaft fr den Shor-Algorithmus


Es seien m, r N und es sei r 2 2m . Weiter sei y {0, . . . , 2m 1} und s {0, . . . , r}.
Falls
: y
1
s ::
:
: m : 2,
2
r
2r
so ist

s
r

Beweis.

eine Konvergente in der eindeutigen endlichen Kettenbruchdarstellung von

y
2m .

Folgt sofort mit Satz 4.11 auf der vorherigen Seite.

Die Vorgehensweise zur Auffindung der Ordnung lautet damit wie folgt:
Man bestimme zu

y
2m

= [a0 , . . . , aK ] die Konvergenten. Die Bruchdarstellung

sk
:= [a0 , . . . , ak ],
rk

fr k = 0, . . . , K

ergibt dann Kandidaten rk fr die Ordnung.


Man prfe jeweils, ob rk die Ordnung von a modulo n ist und beendet gegebenenfalls
die Suche.
Das Verfahren zur Auffindung von r kann scheitern,
falls

y
2m

aus dem Verfahrensteil 4.5.3 keine gute Approximation war

oder falls s und r nicht teilerfremd sind, da das Kettenbruchverfahren sonst einen um den
gemeinsamen Faktor gekrzten Bruch ermittelt.
Im Falle des Scheiterns, muss der Algorithmus mit einer neuen Wahl fr a erneut durchgefhrt
werden.

4.5.5

Gesamtalgorithmus

Nun werden noch einmal alle Schritte des Verfahrens von Shor zur Faktorisierung von n zusammengefasst dargestellt.
Schritt 1: Falls n gerade ist, ist 2 ein nichttrivialer Faktor von n (Stop).
Schritt 2: Prfung, ob n = ab fr eine Zahl a 3 und b 2 gilt. In diesem Fall wrde gelten:
b = loga n =

log2 n
< %log2 (n + 1)& = L.
log2 a

Daher berechne man fr alle 2 b L die Zahlen a1 , a2 N mit


2

log 2 n
b

1 < a1 2

log 2 n
b

a2 < 2

log2 n
b

+1

und prfe ab1 = n und ab2 = n. Bei erfolgreicher Prfung ist a1 bzw. a2 ein nichttrivialer
Faktor von n (Stop).

120

4 Quantenalgorithmen fr Quantencomputer

Schritt 3: Man bestimme gleichverteilt ein a {2, . . . , n 1}.


Falls ggT(a, n) > 1, so ist ggT(a, n) ein nichttrivialer Faktor von n (Stop).
Schritt 4: Man fhre fr m > 2L+1 den folgenden Quantenalgorithmus fr ein (m+L)-Qbit
durch:
0 := |0m |1L ;


1 := Hm IL 0 ;
2 := Ea 1 ;


3 := Fm IL 2 ;
3
Y := Mm
.

y sei eine Realisierung der Zufallsvariablen Y .


Man bestimme zu 2ym = [a0 , . . . , aK ] die Konvergenten und berechne fr k = 0, . . . , K
jeweils die Bruchdarstellung
s
:= [a0 , . . . , ak ]
r
und prfe, ob r die Ordnung von a modulo n ist.
Bei erfolgreicher Prfung, gehe zu Schritt 5.
Scheitert jede Prfung, gehe zu Schritt 3.
r

Schritt 5: Falls r gerade ist und falls a 2 + 1  0 (mod n), dann sind
r

und 1 < ggT(a 2 1, n) < n

1 < ggT(a 2 + 1, n) < n


zwei nichttriviale Faktoren von n (Stop).
Schritt 6: Gehe zu Schritt 3.

1 2
Ein Durchlauf des Verfahrens bentigt O L3 Operationen, wobei aber das Verfahren gegebenenfalls mehrfach durchgefhrt werden muss. Da dies mit einer Wahrscheinlichkeit (deutlich)
kleiner als 1 geschieht, steigt die Grenordnung2 der Aufwandes nicht.
Beispiel 32
Die Durchfhrung des Verfahrens wird am Beispiel n = 33 erlutert. Es ist dann L = 6. Im
Beispiel sei m = 2L + 4 = 16 gewhlt.
Da 2 kein Faktor von n ist, fhrt Schritt 1 nicht zum Stop.
2 Ist cL3 der Gesamtaufwand und  die Wiederholwahrscheinlichkeit, so ist der Erwartungswert des Gesamtaufwandes folglich

cL3 + cL3 + 2 cL3 + . . . = cL3


k=0

k =

c
L3 .
1

4.5 Der Shor-Algorithmus

121

In Schritt 2 werden fr 2 b 6 je zwei Zahlen a1 und a2 mit


2

log 2 n
b

1 < a1 2

log 2 n
b

a2 < 2

log2 n
b

+1

berechnet, also
a1 {1, 2, 3, 5} ,

a2 {2, 3, 4, 6}

Damit gilt
abj {25, 36, 27, 64, 16, 81, 32, 243, 1, 64}
und da n = 33 nicht in dieser Menge enthalten ist, fhrt Schritt 2 nicht zum Stop.
Zufllig werde im Beispiel im dritten Schritt a = 5 gewhlt. Da ggT(33, 5) = 1,
fhrt Schritt 3 nicht zum Stop.
Bei der Beispielswahl von m = 2L + 1 + 3 ist


1
1
log2 1 +
=3 1+
=8
2
2

1
.
14

Mit einer Wahrscheinlichkeit von mindestens 92% erzeugt der Quantenalgorithmus


ein Ergebnis y mit
: y
1
s ::
:
: m : 2.
2
r
2r
Im vorliegenden Fall ist r = 10 (noch unbekannterweise), so dass also mit mindestens
92% Wahrscheinlichkeit ein Ergebnis y mit
: y
1
s ::
:
:
= 0, 005.
:
65536 10
200
erzeugt wird. Die Menge E dieser gewnschten Ergebniswerte ist
E = {0, . . . , 327, 6226, . . . , 6881, 12780, . . ., 13434, 19334, . . ., 19988, . . .} .
Im Beispiel sei das Ergebnis des Quantenverfahrens die Zahl y = 19412. Es folgt die
Kettenbruchzerlegung von 19412
mit dem euklidischen Algorithmus, also
65536
19412 = 0 65536 + 19412,
65536 = 3 19412 + 7300,
19412 = 2 7300 + 4812,
7300 = 1 4812 + 2488,
4812 = 1 2488 + 2324,
2488 = 1 2324 + 164,
2324 = 14 164 + 28,
164 = 5 28 + 24,
28 = 1 24 + 4,
24 = 6 4 + 0.

122

4 Quantenalgorithmen fr Quantencomputer
Damit ist die Kettenbruchdarstellung gefunden:
19412
= [0, 3, 2, 1, 1, 1, 14, 5, 1, 6].
65536
Nun bestimmt man die Bruchdarstellungen der Konvergenten:
[0, 3] =
[0, 3, 2] =

[0, 3, 2, 1] =

1
,
3
1
1
3+
2
1
3+

2
,
7
=

1
2+

3
.
10

1
1

Bei der Prfung des dritten Nenners ergibt sich r = 10 als Ordnung von 5 modulo
33.
Die Ordnung r = 10 ist gerade und 55 +1 = 3126 24  0 (mod 33). Nichttriviale
Faktoren von 33 sind somit
r

ggT(a 2 + 1, n) = ggT(55 + 1, 33) = ggT(3126, 33) = 3


und

ggT(a 2 1, n) = ggT(3124, 33) = 11.

Quantenalgorithmen fr
klassische Computer

5.1

Vorberlegungen

Quantencomputer und die auf ihnen laufenden Quantenalgorithmen erweitern das klassisch bekannte Spektrum an Informationsverarbeitungsmechanismen. Trotz groer Fortschritte auf dem
Gebiet der physischen Realisierung, ist ein Qantencomputer mit realistisch groer Anzahl an
Qbits noch nicht in Sicht. Da Quantenalgorithmen aufgrund ihrer Struktur einen neuen Zugang
zur Informationsverarbeitung erffnen, stellt sich die Frage, ob die Algorithmen nicht auch
fr klassische Computer einsetzbar wren. Neben der rein akademischen Frage steckt dahinter
natrlich insbesondere die Frage, ob sich die polynomiale Komplexitt des Shor-Algorithmus
nicht auch irgendwie auf eine klassische Informationsverarbeitung bertragen liee.
Es gibt zunchst kein grundstzliches Problem damit, Quantenalgorithmen nicht auf Quantencomputern, sondern auf klassischen Computern zu implementieren. Wie in den vorangegangenen Kapitel ausgefhrt wurde, kann ein Quantenalgorithmus in Kurzform wie folgt beschrieben
werden:
1. Man betrachtet einen Startzustand v SHn eines n-Qbits. Dieser Zustand lsst sich in
einem klassischen Computer als Tupel darstellen, so dass wir
v C2

(5.1)

verwenden knnen.
2. Der Startzustand wird zeitentwickelt, was einer Abfolge von Anwendungen unitrer Operatoren entspricht. Diese lassen sich zu einem unitren Operator
U : Hn Hn

(5.2)

zusammenfassen. Fr die Matrizendarstellung in einem klassischen Computer gilt dann


entsprechend
MU C2

,2n

(5.3)

3. Der Endzustand w SHn ergibt sich aus der Zeitentwicklung des Anfangszustandes.
In der Tupeldarstellung erhlt man ihn auf einem klassischen Computer durch die Multiplikation einer Matrix mit einem Vektor, also hier
n

w = MU u C2 .

(5.4)

124

5 Quantenalgorithmen fr klassische Computer

4. Mit dem Endzustand wird eine Messung vorgenommen. Der Einfachheit halber betrachten wir hier eine vollstndige1 Messung bezglich einer Basis. Dabei handelt es sich um
die Realisierung der Zufallsvariablen
X := Mnw ,

(5.5)

wobei in der Tupeldarstellung fr die Wahrscheinlichkeitsverteilung gilt:


P ({X = j 1}) = |wj |2 ,

j = 1, . . . , 2n .

(5.6)

Auf einem klassischen Computer betrachte man die Zahlen


0 := 0,

k :=

k


|wj |2 ,

k = 1, . . . , 2n ,

(5.7)

j=1

und bestimme ein x [0, 1[ gleichverteilt mit einem Zufallszahlengenerator. Die simulierte Messung hat das Ergebnis j, wenn gilt:
x [j , j+1 [.

(5.8)

In der beschriebenen Allgemeinheit besitzt ein Quantenalgorithmus auf einem klassischen Computer die exponentielle numerische Komplexitt
1 2
(5.9)
O 22n .
Im besten Falle kann man vielleicht fr spezielle Matrizen das Produkt w = MU u mit Komplexitt O (2n ) bestimmen, so dass der Quantenalgorithmus auf einem klassischen Computer
dennoch exponentielle Komplexitt besitzt.
In den folgenden Abschnitten werden Lsungsanstze diskutiert zur Reduktion der Komplexitt
im dargestellten Ablauf. Die Hauptfrage dabei ist, ob sich die exponentielle Komplexitt auf
polynomiale Komplexitt reduzieren lsst.

5.2

Speicherplatz

Um einen beliebigen n-Qbit-Zustand v zu speichern, wird Speicherplatz in der Grenordnung O (2n ) bentigt. Das gilt unabhngig von der gewhlten Tupeldarstellung (5.1), also
n

v C2 ,
sondern folgt allgemein aus der 2n -Dimensionalitt des Hn . Damit ist nicht nur der Speicherplatz exponentiell gro, sondern jeder Algorithmus, der tatschlich alle Komponenten von v
bentigt und somit mindestens einmal verarbeitet, hat ebenso exponentielle Komplexitt. Gnstiger ist die Situation, wenn nur bestimmte Zustnde zur Speicherung bentigt werden.
1 bei einer partiellen Messung sind entsprechend Wahrscheinlichkeiten zu aggregieren, wie in Lemma 3.15 auf
Seite 77 dargestellt.

5.3 Algorithmen fr ausgewhlte Gates

125

Ein reiner n-Qbit-Zustand


x {0, . . . , 2n 1} , C, ||2 = 1

v = |xn ,

(5.10)
KnL

bentigt nur Speicherplatz in der Grenordnung O (n), da die Zahl x mit 8 Bytes gespeichert werden kann. Hinzu kommen noch, je nach gewnschter Genauigkeit, ca. konstante 16
Bytes fr die Phase .
Ebenfalls gnstig in der Darstellung ist ein voll separabler Zustand, der sich als n-faches Tensorprodukt von einzelnen Qbit-Zustnden schreiben lsst, also
v=

(m |0 + m |1) ,

m , m C, |m|2 +|m |2 = 1, m = 1, . . . , n.

m=1

(5.11)
Auch fr (5.11) wird nur Speicherplatz in der Grenordnung O (n) bentigt, nmlich n-mal
der Speicherplatz fr zwei komplexe Zahlen. Jeder reine n-Qbit-Zustand (5.10) ist ein Spezialfall eines voll separablen Zustandes, indem die Phasen m , m je Werte 0 oder 1 annehmen
und beispielsweise zum ersten solchen Phasenpaar multipliziert wird. Fr = 1 gilt etwa:
|xn =

((1 xnm) |0 + xnm |1)

(5.12)

m=1

fr alle x =

n1


xj 2j ,

xj B, j = 0, . . . , n 1.

j=0

Eine Zielsetzung fr die Umsetzung eines Quantenalgorithmus auf einem klassischen Computer
ist daher die Formulierung mit reinen oder voll separablen Zustnden, falls dies denn mglich
ist.
Nicht betrachtet wurde Speicherplatz fr die Gates. Fr ein vllig beliebiges Gate in Matrizendarstellung (5.3), also
MU C2

,2n

1 2
wrde Speicherplatz in der Grenordnung O 22n bentigt. Entsprechend aufwendig wre
eine Multiplikation (5.4) mit einem Vektor. Da aber, wie in Kapitel 4 ausfhrlich dargestellt
wurde, in Quantenalgorithmen keine vllig beliebigen Gates verwendet werden, sondern einige
spezifische Gates, die je eine ganz spezielle Struktur haben, sollten diese Gates als je spezielle
algorithmische Vorschrift umgesetzt werden und nicht allgemein in linearer Algebra formuliert
werden. Daher wird fr sie auch kein Speicherplatz bentigt.

5.3

Algorithmen fr ausgewhlte Gates

Zur Darstellung der Komplexitt eines Gates auf einem Quantencomputer werden Gates blicherweise [14] in eine Abfolge elementarer Gates zerlegt, siehe die Abschnitte 3.3.3 und 3.3.4,

126

5 Quantenalgorithmen fr klassische Computer

da sich diese quantenmechanisch realisieren lassen und damit deren Anzahl die Komplexitt
des Quantenalgorithmus bestimmt.
Ein klassischer Computer verfgt zwar nicht ber die speziellen Merkmale eines Quantencomputers, aber dafr sind die auf ihm implementierbaren Algorithmen flexibler. Bei der Betrachtung wichtiger Gates wird daher im Folgenden nicht die Zerlegung in quantenmechanisch elementare Gates vorgenommen, sondern eine mglichst optimale Darstellung zur Verarbeitung
von reinen oder voll separablen Zustnden gesucht.

5.3.1

Hadamard-Gate

Das n-fache Hadamard-Gate Hn ist ein mehrfaches Tensorprodukt und kann daher algorithmisch leicht auf voll separable Zustnde angewandt werden.

Lemma 5.1

Hadamard-Gate und voll separable Zustnde

Es sei H , n N, der Zustandsraum eines n-Qbits und Hn sei das Hadamard-Gate. Dann
gilt fr alle m , m C, m = 1, . . . , n:
n

Hn

(m |0 + m |1) =

m=1

n 


m |0 + m |1 ,
m=1

wobei

m =

m + m

,
2

m m

m =
2

fr alle m = 1, . . . , n.

Beweis. Der Beweis folgt schnell mit Definition 3.20 auf Seite 84 und Definition 3.26 auf
Seite 87:
Hn

(m |0 + m |1) =

m=1

=
=
=

n

m=1
n

(H (m |0 + m |1))
(m H |0 + m H |1)

m=1
n 

m=1
n 

m=1

|0 + |1
|0 |1

+ m
2
2


m + m
m m

|0 +
|1 .
2
2


Die Komplexitt zur Berechnung der


m , m betrgt nur O (n).

5.3 Algorithmen fr ausgewhlte Gates

127

Das Hadamard-Gate wird oft in der Initialisierungsphase von Quantenalgorithmen verwendet.


Fr die Anwendung auf Standard-Startzustnde lsst sich der Ergebniszustand natrlich sofort
angeben und muss nicht mit Computerhilfe berechnet werden:

n 

1
1
|0 + |1 ,
Hn |0n =
2
2
m=1
( n1 
) 


1
1
1
1
n
|0 + |1
|0 |1 .
H |1n =
2
2
2
2
m=1

5.3.2

Fouriertransformation

Die Anwendung des Fn -Gates auf einen reinen Zustand |xn wurde bereits in Satz 3.35 auf
n1
'
Seite 94 betrachtet. Fr x =
xj 2j {0, . . . , 2n 1} mit xj B, j = 0, . . . , n 1, gilt:
j=0



1
1
x 
|0 + exp 2i m |1
2
2
2
m=1


n
m1

 xj
1
1
|0 + exp 2i
|1 .
=
2mj
2
2
m=1
j=0

Fn |xn =

(5.13)

(5.14)

Ein mglicher Phasenfaktor C beim reinen Zustand kann beliebig auf die Koeffizienten
des Ergebnisses verteilt werden.
Ein reiner Zustand wird also auf einen voll separablen Zustand abgebildet. Der Einfluss der
Komponenten der Ausgangszustandes auf die (separablen) Qbits des Endzustandes ist in Abbildung 5.1 auf der nchsten Seite dargestellt.
Die Erstellung von

m1
'
j=0

xj
2mj

in (5.14) kann statt durch Division und Summation als Schiebere-

gisteroperation mit O (n) Operationen durchgefhrt


werden. Ingesamt betrgt die Komplexitt
1 2
der Berechnung des Endzustandes also O n2 .
Lemma 5.2 Fouriertransformation und voll separable Zustnde
Es sei Hn , n N, der Zustandsraum eines n-Qbits und Fn sei die Fouriertransformation.
Dann gilt fr alle m , m C, m = 1, . . . , n:
n 

m (1 xnm ) + m xnm

|0
(m |0 + m |1) =
F
2
m=1
x=0 m=1


m1
 xj
m (1 xnm) + m xnm
|1 .

exp 2i
+
(5.15)
mj
2
2
j=0
n

n
2
1

128

5 Quantenalgorithmen fr klassische Computer


|xn

xn1 xn2 xn3 xn4

x3

x2

x1

x0

Fn |xn
m

n3 n2 n1

Abbildung 5.1: Einfluss der einzelnen Qbit-Zustnde eines reinen Ausgangszustands auf die Qbits des
voll separablen Ergebniszustandes unter der Fouriertransformation

Beweis.
Fn

(m |0 + m |1)

m=1

=F

n
2
1

x=0

n
2
1

x=0

n
2
1

(
(

x=0

n
6
m=1
n
6

n
6

m=1

)
(m (1 xnm ) + m xnm ) |xn
)

(m (1 xnm ) + m xnm) Fn |xn


)
(m (1 xnm ) + m xnm)

m=1


m1
 xj
1
1
|0 + exp 2i
|1
mj
2
2
2
m=1
j=0
n

n 

m (1 xnm ) + m xnm

|0
2
x=0 m=1


m1
 xj
m (1 xnm) + m xnm
|1 .

exp 2i
+
2mj
2
j=0

n
2
1


Offen bleibt die Frage, ob die Anwendung der Fouriertransformation auf einen voll separablen

5.3 Algorithmen fr ausgewhlte Gates

129

Zustand mit polynomialer Komplexitt beschrieben werden kann, denn in der Darstellung von
Lemma 5.2 auf Seite 127 verbleibt eine Summation mit exponentieller Ordnung. Aus der Formel (5.15) ist ersichtlich, dass jeder Einzel-Qbit-Zustand der summierten separablen Zustnde
nicht nur die Abhngigkeiten von Abbildung 5.1 auf der vorherigen Seite enthlt, sondern zustzlich die Phasenfaktoren m und m , so dass neben der Summation in Abbildung 5.1 auf der
vorherigen Seite auch noch vertikale Abhngigkeiten zu ergnzen wren. Die Mglichkeit der
Umformulierung auf eine Summation mit polynomialer Komplexitt erscheint daher fraglich.

5.3.3

Exponentialgate

Lemma 5.3 Exponentialgate und reine Zustnde


Es sei Hn , n N, der Zustandsraum eines n-Qbits. Weiter seien n1 , n2 N mit n1 +n2 =
n und a, N N mit a < N und 1 < N < 2n2 . Ist Ea das Exponentialgate fr n1 , n2 , a und
sind C und z {0, . . . , 2n 1}, so gilt mit z = x 2n2 + y fr x {0, . . . , 2n1 1}
und y {0, . . . , 2n2 1}:
Ea |zn = Ea |xn1 |yn2
$
|xn1 |ax y(modN )n2 , fr y {0, . . . , N 1} ,
=
|xn1 |yn2 ,
fr y {N, . . . , 2n2 1} .

Beweis.

Der Beweis folgt sofort aus Definition 4.8 auf Seite 112.

Ein reiner Zustand wird also wieder auf einen reinen Zustand abgebildet.
Der Algorithmus besitzt die Komplexitt der Berechnung von
y = ax y(modN ).

(5.16)

Betrachtet man x in Binrdarstellung, also


x=

n
1 1

xj 2j ,

xj B, j = 0, . . . , n1 1,

j=0

so lsst sich (5.16) wie folgt aufspalten:






n1 1
0
y = axn1 1 2
(modN ) . . . ax0 2 (modN ) y(modN ).
1 2
Jede Multiplikation (auch modulo N ) von Binrzahlen mit n2 Bits ist mit O n22 Operationen
durchfhrbar. Die Zahlen
a2 (modN ),

a4 (modN ),

a8 (modN ), . . .

sind als aufeinanderfolgende Quadraturen


1
2durchfhrbar,
1 2 so dass der Gesamtaufwand zur Berechnung von (5.16) insgesamt O n1 n22 = O n3 betrgt, also polynomial ist. Mit Hilfe
tieferliegender algebraischer Betrachtungen ist der tatschlich notwendige Aufwand noch etwas
reduzierbar [14].

130

5 Quantenalgorithmen fr klassische Computer

Lemma 5.4

Exponentialgate und voll separable Zustnde

Es sei Hn , n N, der Zustandsraum eines n-Qbits. Weiter seien n1 , n2 N mit n1 +n2 =


n und a, N N mit a < N und 1 < N < 2n2 . Es sei Ea das Exponentialgate fr n1 , n2 , a.
Dann gilt fr alle m , m C, m = 1, . . . , n:
n

Ea

(m |0 + m |1)

m=1

1 1
2n


M(

x=0

N1


n2
6

(n1 +m (1 yn2 m ) + n1 +m yn2 m ) |a y(modN )n2


x

m=1

n1

(m (1 xn1m ) + m xn1m ) |xn1

m=1

y=0

n1
6

(m |0 + m |1)

m=1

2 1
2n


n2
6

(n1 +m (1 yn2 m ) + n1 +m yn2 m ) |yn2 .

m=1

y=N

Beweis.

Ea

(m |0 + m |1)

m=1

= Ea

1 1
2n


x=0

y=0

n2
6

n1
6

(N1 ( n
2
 6

2 1
2n


y=N

(m (1 xn1m ) + m xn1m ) |xn1

)
)

(n1+m (1 yn2 m ) + n1 +m yn2 m ) Ea |xn1 |yn2

m=1

(m (1 xn1 m ) + m xn1m )

m=1

y=0

(n1 +m (1 yn2 m ) + n1 +m yn2 m ) |yn2

m=1

x=0

n1
6
m=1

2 1
2n


1 1
2n


n2
6
m=1

(n1 +m (1 yn2 m ) + n1 +m yn2 m ) Ea |xn1 |yn2

5.4 Implementierung von Messungen

1 1
2n


x=0

n1
6

y=0

1 1
2n


M(

x=0

n1
6

(n1+m (1 yn2 m ) + n1 +m yn2 m ) |xn1 |yn2

x=0
N1


(m (1 xn1m ) + m xn1m ) |xn1

n1

)
(n1+m (1 yn2 m ) + n1 +m yn2 m ) |ax y(modN )n2

n2
6

n1
6

n2
6

(n1+m (1 yn2 m ) + n1 +m yn2 m ) |yn2


)

(m (1 xn1m ) + m xn1m ) |xn1

m=1

y=0

m=1

M(

m=1

y=N
1 1
2n


n2
6

(N1 ( n
2
 6
y=0

(n1+m (1 yn2 m ) + n1 +m yn2 m ) |xn1 |axy(modN )n2

m=1

2n2 1

m=1

y=N

(m (1 xn1m ) + m xn1m )

m=1

2n2 1

m=1

(N1 ( n
2
 6

131

(n1+m (1 yn2 m ) + n1 +m yn2 m ) |a y(modN )n2


x

m=1

(m |0 + m |1)

m=1

2 1
2n


y=N

n2
6

(n1 +m (1 yn2 m ) + n1 +m yn2 m ) |yn2 .

m=1


Offen bleibt auch hier die Frage, ob die Anwendung des Exponentialgates auf einen voll separablen Zustand mit polynomialer Komplexitt beschrieben werden kann, da die Summation in
Lemma 5.4 auf der vorherigen Seite von exponentieller Komplexitt ist, und eine polynomiale
Umformung nicht offensichtlich ist.

5.4

Implementierung von Messungen

Die Messung eines beliebigen n-Qbit-Zustandes v bentigt nach Abschnitt 5.1 O (2n ) Operationen, wie bereits in (5.7) zu sehen.

132

5 Quantenalgorithmen fr klassische Computer

Betrachtet man einen voll separablen Zustand


v=

(m |0 + m |1) ,

m , m C, |m |2 +|m |2 = 1, m = 1, . . . , n,

m=1

so kann mit Lemma 3.17 auf Seite 81 jede Qbit-Komponente einzeln gemessen werden.
Man betrachte nun die m-te Tensorkomponente in obiger Darstellung, also vm = m |0 +
m |1. Bei der Messung dieser Komponente handelt es sich um die Realisierung der Zufallsvariablen
Xm := M1vm ,

(5.17)

wobei in der Tupeldarstellung fr die Wahrscheinlichkeitsverteilung gilt:


P ({Xm = 0}) = |m |2 ,

P ({Xm = 1}) = |m |2 .

(5.18)

Zur Implementierung auf einem klassischen Computer bestimme man ein xm [0, 1[ gleichverteilt mit einem Zufallszahlengenerator. Die simulierte Messung hat
Ergebnis 0, wenn gilt xm [0, |m|2 [,
2

Ergebnis 1, wenn gilt xm [|m| , 1[.

(5.19)
(5.20)

Hierfr ist konstanter Aufwand notwendig. Mit einer Komplexitt von O (n) erhlt man somit
das Gesamtergebnis als
n


2nm Xm .

m=1

5.5

Kaskadierte Messungen

Aufgrund der abschlieenden Messung ist jeder Quantenalgorithmus ein stochastischer Algorithmus. Da sich die Anwendung wichtiger Gates auf reine Zustnde mit polynomialer Komplexitt auf einem klassischen Computer implementieren lsst, besteht eine Idee darin, dass man
nach jedem Gate eine Messung durchfhrt, um wieder einen reinen Zustand zu erhalten. Die
Vorstellung ist, dass das wiederholte Anwenden dieser Vorgehensweise im empirischen Mittel
das eigentliche Gesamtergebnis erzeugt. Wendet man die Messung an mehreren Stellen an, so
verfolgt ein Durchlauf des Verfahrens einen Pfad durch einen Baum von mglichen Ablufen.
Zur Untersuchung der Idee betrachten wir einen Quantenalgorithmus:
v := U u,

v
X := M{M
.
0 ,...,Mm1 }

(5.21)

Dabei sind u, v Hn zwei Zustnde und U ist ein auf u angewandtes Gate. Die abschlieende
Messung ist die Realisierung der Zufallsvariablen X als Messung bezglich eines Messoperatorsatzes {M0 , . . . , Mm1 }, m N. Inbesondere gilt damit fr j = 0, . . . , m 1:
2

P ({X = j}) = Mj v = Mj U u .

(5.22)

5.5 Kaskadierte Messungen

133
Messung

Zustand 1

Zustand 2

Zustand 3

Gate

Gate

Gate

Messung

Zustand 4

Messung

Zustand 5

Zustand 6

Messung

Zustand 7

Zustand 8

Zustand 9

Abbildung 5.2: Formale Darstellung eines Ablaufbaumes bei kaskadierten Messungen. Jede Messung erzeugt einen (Zwischen-)Ergebniszustand mit einer gewissen Wahrscheinlichkeit. Davon ausgehend erfolgt
ein weiterer Verfahrensschritt mit einem oder mehreren Gates, woraufhin eine weitere Messung erfolgt.

Nach Definition 3.12 auf Seite 73 ist der Zustand nach der Messung
MX v
.
MX v
Nun wird der Algorithmus dahingehend abgewandelt, dass der Zustand u zunchst bezglich
eines Messoperatorsatzes {Q0 , . . . , Qq1 }, q N, gemessen wird und erst danach das Gate
angewandt wird, also
u
Y := M{Q
,
0 ,...,Qq1 }

v := U

QY u
,
QY u

:= M v
X
{M0 ,...,Mm1 } .

(5.23)

um sie mit der von X aus dem


Jetzt berechnen wir die Wahrscheinlichkeitsverteilung von X,
Originalalgorithmus (5.21) zu vergleichen. Man erhlt sie mit der Formel von der totalen
Wahrscheinlichkeit aus Satz 2.70 auf Seite 53:
q1
7
8 
7
8
=j
= j|Y = k
P
X
=
P ({Y = k}) P
X
(5.24)
k=0

q1

k=0
q1

k=0

#2
#
#
Qk u #
#
#
Qk u #Mj U
Qk u #
2

Mj U Qk u .

(5.25)

(5.26)

134

5 Quantenalgorithmen fr klassische Computer

Folgend aus Definition 3.11 auf Seite 72 gilt bekanntlich



q1

Qk u = u = 1,

k=0

aber leider hebt sich in (5.26) die Summe der Qk nicht hinweg, d.h. im Allgemeinen hat man
P

q1
7
8 
2
2
=j
Mj U Qk u = Mj U u = P ({X = j}) .
X
=

(5.27)

k=0

Zur Belegung dient die Angabe eines einfachen Gegenbeispiels, das hier in Tupelnotation und
mit Matrizen beschrieben wird. Zur Vereinfachung der Darstellung werden den Matrizen die
Bezeichnungen der Operatoren gegeben:
 


1 1
1 1 1
u :=
, U :=
,
5 2
2 1 1
 
 
 
 
10
00
10
00
Q0 :=
, Q1 :=
, M0 :=
, M1 :=
.
00
01
00
01
Originalalgorithmus 5.21:

3
,
1
#
 #2
# 1
9
3 #
2
#

P ({X = 0}) = M0 v = #


# 10 0 # = 10 ,
#
 #2
# 1
0 #
2
# = 1.
#
P ({X = 1}) = M1 v = #
#
1
10
10
1
v = Uu =
10

Modifizierter Algorithmus 5.23 mit kaskadierten Messungen:


 
 
1
1 1
1
=
,
U Q0 u = U
5 0
10 1
 
 
1
1 0
2
U Q1 u = U
=
,
5 2
10 2
7
8
2
2
=0
P
X
= M0 U Q0 u + M0 U Q1 u
#
 #2 #
 #2
# 1
#
1
1 #
2 #
# + # 1
#

=#
# 10 0 #
# 10 0 # = 2 ,
7
8
2
2
=1
P
X
= M1 U Q0 u + M1 U Q1 u
#
 #2 #
 #2
# 1
#
1
0 #
0 #
# + # 1
#

=#
# 10 1 #
# 10 2 # = 2 .

5.6 Zusammenfassung

135

Bereits in diesem einfachen Fall fhrt die zustzliche Messung innerhalb des Quantenalgorithmus zu einer totalen Verflschung der Ergebnisverteilung. Daher muss die Idee verworfen werden, dass durch geschickte Zwischenmessungen einfachere Zustnde erzeugt werden knnten
bei Erhalt des Gesamtergebnisses im globalen Mittel.

5.6

Zusammenfassung

Die polynomiale Komplexitt des Shor-Algorithmus und die neue Herangehensweise an die Informationsverarbeitung durch Quantenalgorithmen beflgelt die Vorstellung, diese neuen Ideen
bereits heute auf klassischen Computern sinnvoll nutzen zu knnen. Zu diesem Zweck wird eine
Methodik bentigt, die die exponentielle Komplexitt von Speicher und Operationen vermeidet,
die eine direkte Simulation eines Quantencomputers zwangslufig mit sich bringen wrde.
Die Untersuchung der Gates des Shor-Algorithmus in den vorangegangenen Abschnitten zeigt,
dass eine Reduktion des Zustandsraumes auf voll separable Zustnde oder gewissen Kombinationen von voll separablen Zustnden nicht gelingt. Wre eine solche Reduktion mglich, so
wre zumindest der Speicherbedarf nur polynomial. Beim Hadamard-Gate, welches ja das Tensorprodukt von Ein-Qbit-Gates ist, gelingt die Reduktion natrlicherweise, aber die Struktur
der Fouriertransformation und des Exponentialgates verschliet sich einer solchen Darstellung.
Da ein kompletter Quantenalgorithmus aufgrund der Messung insgesamt ein stochastischer Algorithmus ist, ist es eine interessante Idee, die stochastischen Anteile auf alle algorithmischen
Teile auszudehnen. Statt nur einer abschlieenden Messung knnte man nach ausgewhlten
Teilschritten messen, was zu einer Zustandsreduktion fhrt. Dadurch entsteht insgesamt ein
stochastischer Prozess. Wie in Abschnitt 5.5 gezeigt wurde, wird die Wahrscheinlichkeitsverteilung der Schlussmessung aber durch Zwischenmessungen im Allgemeinen so verflscht,
dass das Verfahren nicht durchfhrbar ist. Denkbar bleibt es aber, dass es bestimmte Ablufe
von speziellen Gates und speziellen Messungen geben knnte, die Wahrscheinlichkeitsverteilung der Schlussmessung nicht verflschen. Ein Ansatz dazu mit einem Branch-and-BoundAlgorithmus auf einer Random-Walk-Darstellung von Quantenalgorithmen wird in [20] untersucht.
Auch wenn eine konkrete Nutzanwendung von Quantenalgorithmen fr klassische Computer
zum gegenwrtigen Zeitpunkt noch nicht gelungen ist und vielleicht aufgrund der massiven
Verschrnkung der Zustnde niemals gelingen kann, wird die neue Denkweise der Quantenalgorithmen in Zukunft sicher auch Algorithmen fr klassische Computer befruchten.

Literaturverzeichnis
[1] Heinz Bauer. Ma- und Integrationstheorie. de Gruyter Verlag, Berlin, New York, zweite
Auflage, 1992.
[2] Heinz Bauer. Wahrscheinlichkeitstheorie. de Gruyter Verlag, Berlin, New York, fnfte
Auflage, 2002.
[3] Albrecht Beutelspacher. Kryptologie. Vieweg Verlag, Braunschweig, Wiesbaden, 6.
Auflage, 2002.
[4] Dirk Bouwmeester, Artur Ekert und Anton Zeilinger. The Physics of Quantum Information. Springer Verlag, Berlin, Heidelberg, New York, 2000.
[5] Dagmar Bru. Quanteninformation. Fischer, Frankfurt am Main, 2003.
[6] David Deutsch. Quantum theory, the Church-Turing Principle and the universal quantum
computer. In Proceedings Royal Society of London A, Band 400, Seiten 97117. London,
1985.
[7] David Deutsch und Richard Jozsa. Rapid solution of problems by quantum computation.
In Proceedings Royal Society of London A, Band 439, Seiten 553558. London, 1992.
[8] Lov K. Grover. A fast quantum mechanical algorithm for database search. In Proceedings
28th Annual ACM Symposium on the Theory of Computing (STOC), Seiten 212219. Mai
1996.
[9] Friedrich Hirzebruch und Winfried Scharlau. Einfhrung in die Funktionalanalysis. Bibliographisches Institut (B.I.), Mannheim, Leipzig, Wien, Zrich, 1991.
[10] Klaus Jnich. Lineare Algebra. Springer-Lehrbuch. Springer Verlag, Berlin, Heidelberg,
New York, 10. Auflage, 2004.
[11] David Meintrup und Stefan Schffler. Stochastik. Springer Verlag, Berlin, Heidelberg,
New York, 2004.
[12] Kurt Meyberg. Algebra Teil 1. Carl Hanser Verlag, Mnchen, Wien, zweite Auflage,
1980.
[13] Herbert Mther. Quantenmechanik. Vorlesungs-Skriptum, Universitt Tbingen, 1999.
[14] Michael A. Nielsen und Isaac L. Chuang. Quantum Computation and Quantum Information. Cambridge University Press, Cambridge, 2000.
[15] Fritz Reinhardt und Heinrich Soeder. dtv-Atlas zur Mathematik Band 1. dtv-Atlas. Deutscher Taschenbuch Verlag, Mnchen, 12. Auflage, 2001.

138

Literaturverzeichnis

[16] Ronald L. Rivest, Adi Shamir und Leonard A. Adleman. A method for obtaining digital
signatures and public-key cryptosystems. Communications of the ACM, 21(2): Seiten
120126, 1978.
[17] Stefan Schffler. Decodierung binrer linearer Blockcodes durch globale Optimierung.
Nummer 485 in Theorie und Forschung. Roderer Verlag, Regensburg, 1997.
[18] Stefan Schffler und Thomas F. Sturm. Wahrscheinlichkeitstheorie und Statistik I fr Mathematiker. Vorlesungs-Skriptum IAMS Nr. 5, Technische Universitt Mnchen, Mnchen, Oktober 1994.
[19] Stefan Schffler und Thomas F. Sturm. Wahrscheinlichkeitstheorie und Statistik II fr
Mathematiker. Vorlesungs-Skriptum IAMS Nr. 6, Technische Universitt Mnchen, Mnchen, Mrz 1995.
[20] Robert Schmied. Stochastische Analyse von Quantenalgorithmen. Vdm Verlag Dr. Mller,
Saarbrcken, 2008.
[21] Peter W. Shor. Algorithms for quantum computation: discrete logarithms and factoring. In
Proceedings 35th Annual Symposium on Fundamentals of Comp. Science (FOCS), Seiten
124134. 1994.
[22] Thomas F. Sturm. Stochastische Analysen und Algorithmen zur Soft Decodierung binrer
linearer Blockcodes. Dissertation, Universitt der Bundeswehr Mnchen, Neubiberg, Juli
2003.
[23] Thomas F. Sturm. Ma- und Integrationstheorie. Vorlesungs-Skriptum, Universitt der
Bundeswehr Mnchen, 2005.
[24] Wolfgang Walter. Analysis 2. Springer-Lehrbuch. Springer Verlag, Berlin, Heidelberg,
New York, fnfte Auflage, 2002.

Index
Abbildung
messbare, 44
abelsche Gruppe, 10
absolute Stetigkeit, 54
absolutes Moment k-ter Ordnung, 51
absolutstetige Zufallsvariable, 56
Additivitt, 29
adjungierter Operator, 29
assoziatives Gesetz, 9, 1113, 33
Aufenthaltswahrscheinlichkeitsdichtenamplitude,
2
ausgeglichen, 95, 97
Automorphismus, 29
Basis, 20
Basismenge, 41
Basisvektor, 20
Bayes
Satz von, 53
bedingte Wahrscheinlichkeit, 52
Bell-Zustand, 72
Bernoulli-Experiment, 55
Bildma, 45, 50
binre Krper, 13
Binomial-Verteilung, 55, 63
Bit, 3, 4
Boolsche Funktion, 90
Borelsche -Algebra, 43
C-Gate, 90
Cauchy-Folge, 28
Cauchy-Schwarzsche Ungleichung, 28
Chebyschev
-Markov, Ungleichung von, 63
CNOT-Gate, 90
Controlled-Note-Gate, 90
Covarianz, 58
Covarianzmatrix, 59
Dichte, 53, 58

Dichtefunktion, 58
Dimension, 22
Dirac-Konstante, 1
diskrete Zufallsvariable, 54
diskretes Wahrscheinlichkeitsma, 54
Dispersionsrelation, 2
distributives Gesetz, 11, 12
Dreiecksungleichung, 24
duale Basis, 74
Dualitt, 1
Durchschnittsstabilitt, 43
Ea -Gate, 112
eindeutig, 117
Einselement, 11, 12
endlichdimensionaler Vektorraum, 22
endlicher Kettenbruch, 117
EPR-Paar, 72
EPR-Zustand, 72
Ereignis, 49
stochastisch unabhngige, 60
Ergebnis, 49
Erwartungswert, 50
Erwarungswert
einer n-dim. reellen Zufallsvariablen,
50
Erweiterung von R, 41
erzeugte -Algebra, 43
von einer Zufallsvariablen, 60
euklidische Norm, 24
Euklidischer Algorithmus, 117
Eulersche -Funktion, 106
Exponentialgate, 112
Fn -Gate, 92, 94
Faktorisierung, 106
fast sichere Konvergenz, 62
Formel von der totalen Wahrscheinlichkeit,
53
Fouriertransformation, 92

140
Fundamentalidentitt, 32
Funktion
maerzeugende, 44
Galoisfelder, 13
Galoiskrper, 13
Gate, 83
C, 90
Ea , 112
Fn , 92, 94
H, 87
I, 88
P, 87
S, 90
T, 88
Uf , 91
X, 86
Y, 87
Z, 87
Gates, 83
Gleichverteilung, 55
Grenzwertsatz, zentraler, 62
Gruppe, 9
Gruppentheorie, 11
H-Gate, 87
Hadamard-Funktion, 98
Hadamard-Gate, 87
Hamilton-Operator, 2
hermitesch, 30
Hilbertbasis, 28
Hilbertraum, 35, 2830
Homogenitt, 29
Householder, 102
I-Gate, 88
Indikatorfunktion, 45
inneren Verknpfung, 9
Integral, 4648
Lebesgue, 48
Lebesgue-Stieltjes, 48
integrierbar, 48
Lebesgue, 48
inverses Element, 10, 12
K-Vektorraum, 13
kanonische Abbildung, 35, 36

Index
kanonische Basis, 20
kanonische Tensorprodukt, 39
Kettenbruch, 117
Krper, 12
kollineare Vektoren, 18
kommutative Gruppe, 10
kommutativer Ring, 11
kommutatives Gesetz, 1012, 14, 33
komplanare Vektoren, 18
Komponentenzerlegung, 21
Konjugation, 26
konstant, 95, 97
Konvergente, 117
Konvergenz
(P -)fast sicher, 62
im r-ten Mittel, 61
in Verteilung, 61
mit Wahrscheinlichkeit 1, 61
schwache, 62
stochastisch, 61
Kopenhagener Deutung, 2, 3
Korrelationskoffizient, 58
Kronecker-Symbol, 28
Kryptologie, 13
krzeste Normaldarstellung, 46
Laplace, Satz von de Moivre-, 63
Laplace-Experiment, 55
Lebesgue-Borel-Stieltjes-Ma, 44
Lebesgue, Zerlegungssatz von, 57
Lebesgue-Borel-Ma, 43
Lebesgue-Integral, 48
Lebesgue-integrierbar, 48
Lebesgue-Ma, 43
Lebesgue-messbare Mengen, 43
Lebesgue-Stieltjes-Integral, 48
Lebesgue-Stieltjes-Ma, 44
Lebesgue-Stieltjes-messbare Mengen, 44
linear abhngig, 19
linear unabhngig, 19
lineare Abbildung, 29
lineare Hlle, 17
linearer Operator, 83
Linearitt, 24, 26
Linearkombination, 17

Index
Markov
Ungleichung von Chebyschev-, 63
Ma
-endliches, 42
Lebesgue-, 43
Lebesgue-Borel, 43
Lebesgue-Borel-Stieljes, 44
Lebesgue-Stieltjes, 44
vollstndiges, 43
Ma (-endliches), 42
maerzeugende Funktion, 44
Maraum, 44
Materiewelle, 1
Menge
geordnet, 42
Lebesgue-messbar, 43
Lebesgue-Stieltjes-messbar, 44
Lebesguesche Nullmenge, 43
Nullmenge, 43
Mengensystem
stochastische Unabhngigkeit von, 60
ber , 41
messbare Abbildung, 44
Messbarkeit, 44
Messoperator, 72
Messraum, 44, 67, 73, 75, 77, 80, 81
Messung, 67, 73, 75, 77, 80
Moivre, de -Laplace, Satz von, 63
Moment
absolutes k-ter Ordnung, 51
zentriertes k-ter Ordnung, 51
zentriertes absolutes k-ter Ordnung, 51
Multi-Qbit, 68
negativer Tensor, 33
negativer Vektor, 14
Negativteil, 48
neutrales Element, 10
Norm, 24
Normaldarstellung, 46
krzeste, 46
Normalverteilung, 58
normierter Raum, 24
Not-Gate, 86
Nullelement, 11, 12
Nullmenge, 43
Lebesguesche, 43

141
Nulltensor, 33
Nullvektor, 13
numerische Funktion, 47
Observable, 6
Observablen, 6
ffentlicher Schlssel, 106
ffnungswinkel, 27
Operator, 29
Ordnung, 108110
orthogonal, 27
Orthonormalbasis, 28
P-Gate, 87
Pauli-Matrix, 87
Phasen-Gate, 87
Photon, 1
Plancksches Wirkungsquantum, 1
Poisson-Verteilung, 55
Positive Definitheit, 26
Positivitt, 24
Positivteil, 48
Postulat, 4
Potenzmenge, 41, 42
Prhilbertraum, 26, 28
privater Schlssel, 106
Produktraum, 30
Public-Key-Verfahren, 106
Qbit, 65, 124, 131
Quantenbit, 65
Quanteninformationstheorie, 3
quasiintegrierbar, 48
Radon-Nikodym
Satz von, 54
Reed-Solomon-Codes, 13
reiner Multi-Qbit-Zustand, 70
reiner Qbit-Zustand, 66
Ring, 11
Ring mit Einselement, 11
RSA-Verschlsselungsverfahren, 106
S-Gate, 90
Satz
von de Moivre-Laplace, 63
Satz von Bayes, 53
Satz von Messoperatoren, 72

142
Satz von Pythagoras, 27
Schlssel, 13
Schrdinger-Gleichung, 2, 7
schwache Konvergenz, 62
selbstadjungiert, 30
senkrecht, 27
separabler Multi-Qbit-Zustand, 71, 81
-Additivitt, 42
-Algebra, 42
Borelsche, 43
-endlich, 42
singulres Wahrscheinlichkeitsma, 57
Skalar, 13
Skalarprodukt, 25, 26
Speicher, 68
Spin, 3
Spin-down, 4
Spin-up, 3
Spinor-Wellenfunktion, 4
Standard-Skalarprodukt, 25, 26
Standardabweichung, 51
Standardbasis, 69, 74, 75, 77, 80, 81
Standardisierung, 52
stetige Zufallsvariable, 56
stetiges Wahrscheinlichkeitsma, 56
stochastisch unabhngige Ereignisse, 60
stochastische Konvergenz, 61
stochastische Unabhngigkeit
einer Menge von Ereignissen, 60
von Ereignissen, 60
von Mengensystemen, 60
von Zufallsvariablen, 61
Streuung, 51
Summennorm, 24
Swap-Gate, 90
Symmetrie, 26
T-Gate, 88
Teilchen-Spin, 3
Tensor, 31, 33
Tensorpermutation, 71
Tensorprodukt, 5, 31, 84
Tensorraum, 31
Transponierungszeichen, 15
triviale Linearkombination, 19
Tupel, 30

Index
Uf -Gate, 91
unendlichdimensionaler Vektorraum, 22
Ungleichung von Chebyschev-Markov, 63
unitr, 7
unitrer Operator, 83
unkorreliert, 58
Untervektorraum, 16, 17
Varianz
einer reellen Zufallsvariablen, 51
Vektor, 13, 14
Vektorkomponenten, 21
Vektorraum, 13
Verknpfung, 9
Verschlsselung, 106
verschrnkter Multi-Qbit-Zustand, 71
Verteilung
Binomial, 55, 63
diskrete, 54
Gleich-, 55
Normal-, 58
Poisson-, 55
Verteilung einer Zufallsvariablen, 50
Verteilungsfunktion, 56
Vervollstndigung, 43
vollstndig, 28
vollstndiges Ma, 43
Wahrscheinlichkeit, 49
bedingte, 52
Formel von der totalen, 53
Wahrscheinlichkeitsma, 49
absolute Stetigkeit, 54
Dichte, 53
diskretes, 54
singulres, 57
stetiges, 56
Wahrscheinlichkeitsraum, 49, 67, 73, 75, 77,
80, 81
Welle-Teilchen-Dualismus, 1
Wirkungsquantum, Plancksches, 1
X-Gate, 86
Y-Gate, 87
Z-Gate, 87
Zhlma, 54

Index
Zahlentheorie, 106
Zeitentwicklung, 83
Zeitentwicklungsoperator, 7
zentraler Grenzwertsatz, 62
zentriertes absolutes Moment k-ter Ordnung,
51
zentriertes Moment k-ter Ordnung, 51
zerlegbarer Tensor, 31
Zerlegungssatz von Lebesgue, 57
Zufallsexperiment, 49
Bernoulli, 55
Laplace, 55
Zufallsvariable
absolutstetige, 56
Covarianz, 58
diskrete, 54
Erwartungswert, 50
numerische, 50
reelle, 50
Standardabweichung, 51
Standardisierung, 52
stetige, 56
stochastische Unabhngigkeit von, 61
Streuung, 51
unkorreliert, 58
Varianz einer reellen, 51
Verteilung, 50
Zustand, 3
Zustand eines n-Multi-Qbits, 68
Zustand eines Qbits, 65
Zustandsraum, 4, 5, 65, 68
Zustandsreduktion, 6
Zustandssphre, 65, 68

143