Wir haben nun drei verschiedene Möglichkeiten kennengelernt, Kanäle mathematisch darzustellen: Stinespring-Darstellungen, Kraus-Darstellungen und Choi-Darstellungen.
Außerdem haben wir die Definition eines Kanals, die besagt, dass ein Kanal eine lineare Abbildung ist, die Dichtematrizen stets in Dichtematrizen umwandelt — auch wenn der Kanal nur auf einen Teil eines zusammengesetzten Systems angewendet wird.
Der Rest dieser Lektion ist einem mathematischen Beweis gewidmet, der zeigt, dass die drei Darstellungen äquivalent sind und die Definition genau erfassen.
Unser Ziel ist es, die Äquivalenz einer Sammlung von vier Aussagen zu zeigen. Wir beginnen damit, sie präzise aufzuschreiben.
Alle vier Aussagen folgen denselben Konventionen, die in der gesamten Lektion verwendet wurden: Φ ist eine lineare Abbildung von quadratischen Matrizen auf quadratische Matrizen, die Zeilen und Spalten der Eingabematrizen sind den klassischen Zuständen eines Systems X (dem Eingabesystem) zugeordnet, und die Zeilen und Spalten der Ausgabematrizen sind den klassischen Zuständen eines Systems Y (dem Ausgabesystem) zugeordnet.
Φ ist ein Kanal von X nach Y. Das heißt, Φ wandelt Dichtematrizen stets in Dichtematrizen um, auch wenn es auf einen Teil eines größeren zusammengesetzten Systems wirkt.
Die Choi-Matrix J(Φ) ist positiv semidefinit und erfüllt die Bedingung TrY(J(Φ))=IX.
Es gibt eine Kraus-Darstellung für Φ. Das heißt, es existieren Matrizen A0,…,AN−1, für die die Gleichung Φ(ρ)=∑k=0N−1AkρAk† für jede Eingabe ρ gilt, und die die Bedingung ∑k=0N−1Ak†Ak=IX erfüllen.
Es gibt eine Stinespring-Darstellung für Φ. Das heißt, es existieren Systeme W und G, so dass die Paare (W,X) und (G,Y) dieselbe Anzahl klassischer Zustände haben, zusammen mit einer unitären Matrix U, die eine unitäre Operation von (W,X) nach (G,Y) darstellt, sodass Φ(ρ)=TrG(U(∣0⟩⟨0∣⊗ρ)U†).
Der Beweis funktioniert, indem eine Kette von Implikationen gezeigt wird:
Die erste Aussage impliziert die zweite, die zweite impliziert die dritte, die dritte impliziert die vierte, und die vierte Aussage impliziert die erste.
Damit ist die Äquivalenz aller vier Aussagen bewiesen — das heißt, sie sind für eine gegebene Wahl von Φ entweder alle wahr oder alle falsch — denn die Implikationen können transitiv von jeder Aussage zu jeder anderen verfolgt werden.
Das ist eine übliche Strategie beim Beweis der Äquivalenz einer Sammlung von Aussagen. Ein nützlicher Trick dabei ist, die Implikationen so zu wählen, dass sie möglichst einfach zu beweisen sind.
Das ist hier der Fall — und tatsächlich sind zwei der vier Implikationen schon bekannt.
Die erste zu beweisende Implikation (mit Bezug auf die nummerierten Aussagen) ist 1 ⇒ 2.
Diese Implikation wurde bereits im Zusammenhang mit dem Choi-Zustand eines Kanals besprochen.
Hier fassen wir die mathematischen Details zusammen.
Sei die klassische Zustandsmenge des Eingabesystems X gleich Σ und sei n=∣Σ∣.
Betrachte die Situation, in der Φ auf die zweite von zwei Kopien von X angewendet wird, die sich gemeinsam im Zustand
und unter der Annahme, dass Φ ein Kanal ist, muss dies eine Dichtematrix sein.
Wie alle Dichtematrizen ist sie positiv semidefinit, und die Multiplikation einer positiv semidefiniten Matrix mit einer positiven reellen Zahl ergibt erneut eine positiv semidefinite Matrix; daher gilt J(Φ)≥0.
Darüber hinaus muss Φ als Kanal die Spur erhalten, weshalb gilt:
Die zweite Implikation (wiederum bezogen auf die nummerierten Aussagen) ist 2 ⇒ 3.
Dabei ignorieren wir die anderen Aussagen — insbesondere dürfen wir nicht annehmen, dass Φ ein Kanal ist.
Alles, womit wir arbeiten, ist, dass Φ eine lineare Abbildung ist, deren Choi-Darstellung J(Φ)≥0 und
TrY(J(Φ))=IX erfüllt.
Das reicht jedoch aus, um zu schließen, dass Φ eine Kraus-Darstellung
Φ(ρ)=k=0∑N−1AkρAk†
besitzt, für die die Bedingung
k=0∑N−1Ak†Ak=IX
erfüllt ist.
Wir beginnen mit der entscheidenden Annahme, dass J(Φ) positiv semidefinit ist. Das bedeutet, dass es möglich ist, J(Φ) in der Form
J(Φ)=k=0∑N−1∣ψk⟩⟨ψk∣(1)
für eine geeignete Wahl der Vektoren ∣ψ0⟩,…,∣ψN−1⟩ auszudrücken.
Im Allgemeinen gibt es mehrere solcher Darstellungen — was direkt der Freiheit entspricht, die man bei der Wahl einer Kraus-Darstellung für Φ hat.
Eine Möglichkeit, eine solche Darstellung zu erhalten, ist die Verwendung des Spektralsatzes:
J(Φ)=k=0∑N−1λk∣γk⟩⟨γk∣,
wobei λ0,…,λN−1 die Eigenwerte von J(Φ) sind (die wegen der positiven Semidefinitheit von J(Φ) notwendigerweise nichtnegative reelle Zahlen sind) und ∣γ0⟩,…,∣γN−1⟩ normierte Eigenvektoren zu den Eigenwerten λ0,…,λN−1 sind.
Zu beachten ist, dass die Eigenwerte (abgesehen von der Reihenfolge) keine Freiheit lassen, während bei der Wahl der Eigenvektoren Freiheit besteht — insbesondere wenn Eigenwerte mit Vielfachheit größer als eins auftreten.
Diese Darstellung von J(Φ) ist also nicht eindeutig — wir setzen lediglich voraus, dass wir eine solche haben.
Da die Eigenwerte nichtnegative reelle Zahlen sind, haben sie nichtnegative Quadratwurzeln, und wir können
∣ψk⟩=λk∣γk⟩
für jedes k=0,…,N−1 wählen, um eine Darstellung der Form (1) zu erhalten.
Es ist jedoch nicht erforderlich, dass die Darstellung (1) auf diese Weise aus einer Spektralzerlegung stammt. Insbesondere müssen die Vektoren ∣ψ0⟩,…,∣ψN−1⟩ im Allgemeinen nicht orthogonal sein.
Es ist jedoch bemerkenswert, dass wir diese Vektoren bei Bedarf orthogonal wählen können — und wir brauchen N nie größer als nm zu nehmen
(wobei n und m die Anzahl der klassischen Zustände von X bzw. Y bezeichnen).
Als Nächstes lässt sich jeder der Vektoren ∣ψ0⟩,…,∣ψN−1⟩ weiter zerlegen als
∣ψk⟩=a∈Σ∑∣a⟩⊗∣ϕk,a⟩,
wobei die Vektoren {∣ϕk,a⟩} Einträge haben, die den klassischen Zuständen von Y entsprechen, und explizit durch die Gleichung
∣ϕk,a⟩=(⟨a∣⊗IY)∣ψk⟩
für jedes a∈Σ und k=0,…,N−1 bestimmt werden können.
Obwohl ∣ψ0⟩,…,∣ψN−1⟩ nicht notwendigerweise normierte Vektoren sind, ist dies derselbe Prozess, den wir verwenden würden, um zu analysieren, was bei einer Standardbasismessung des Systems X bei einem gegebenen Quantenzustandsvektor des Paares (X,Y) passiert.
Nun kommen wir zu dem Trick, der diesen Teil des Beweises zum Funktionieren bringt.
Wir definieren unsere Kraus-Matrizen A0,…,AN−1 gemäß folgender Gleichung:
Ak=a∈Σ∑∣ϕk,a⟩⟨a∣
Wir können diese Formel rein symbolisch betrachten: ∣a⟩ wird gewissermaßen umgedreht zu ⟨a∣ und auf die rechte Seite verschoben, wodurch eine Matrix entsteht.
Für die Verifizierung des Beweises ist die Formel alles, was wir brauchen.
Es gibt jedoch eine einfache und anschauliche Beziehung zwischen dem Vektor ∣ψk⟩ und der Matrix Ak: durch Vektorisierung von Ak erhält man ∣ψk⟩.
Unter der Vektorisierung von Ak versteht man das Stapeln der Spalten übereinander (von der linksten Spalte oben bis zur rechtsten unten), um einen Vektor zu bilden.
Wenn X und Y beispielsweise beide Qubits sind und für eine bestimmte Wahl von k gilt
(Achtung: Manchmal wird die Vektorisierung einer Matrix leicht abweichend definiert, nämlich so, dass die Zeilen der Matrix transponiert und übereinander gestapelt werden, um einen Spaltenvektor zu bilden.)
Zunächst überprüfen wir, dass diese Wahl von Kraus-Matrizen die Abbildung Φ korrekt beschreibt; danach überprüfen wir die andere erforderliche Bedingung.
Um die Übersicht zu behalten, definieren wir eine neue Abbildung Ψ wie folgt:
Ψ(ρ)=k=0∑N−1AkρAk†
Unser Ziel ist also zu zeigen, dass Ψ=Φ.
Dazu vergleichen wir die Choi-Darstellungen dieser Abbildungen.
Choi-Darstellungen sind treu, also gilt Ψ=Φ genau dann, wenn J(Φ)=J(Ψ).
Wir berechnen J(Ψ) mithilfe der Ausdrücke
∣ψk⟩=a∈Σ∑∣a⟩⊗∣ϕk,a⟩undAk=a∈Σ∑∣ϕk,a⟩⟨a∣
zusammen mit der Bilinearität von Tensorprodukten zur Vereinfachung:
Es bleibt zu überprüfen, dass die erforderliche Bedingung an A0,…,AN−1 erfüllt ist. Es stellt sich heraus, dass diese äquivalent zur Annahme TrY(J(Φ))=IX ist (die wir bisher noch nicht verwendet haben).
Was wir zeigen werden, ist diese Beziehung:
(k=0∑N−1Ak†Ak)T=TrY(J(Φ))(2)
(wobei links die Matrixtransposition gemeint ist).
Wir beginnen auf der linken Seite und beobachten zunächst:
Angenommen, wir haben eine Kraus-Darstellung einer Abbildung
Φ(ρ)=k=0∑N−1AkρAk†
für die gilt
k=0∑N−1Ak†Ak=IX.
Unser Ziel ist es, eine Stinespring-Darstellung für Φ zu finden.
Als erstes möchten wir das Müllsystem G so wählen, dass seine klassische Zustandsmenge {0,…,N−1} ist.
Damit (W,X) und (G,Y) dieselbe Größe haben, muss jedoch n ein Teiler von mN sein, sodass wir W mit klassischen Zuständen {0,…,d−1} für d=mN/n wählen können.
Für eine beliebige Wahl von n, m und N muss mN/n keine ganze Zahl sein, also sind wir nicht ohne Weiteres frei, G mit der klassischen Zustandsmenge {0,…,N−1} zu wählen.
Aber wir können N in der Kraus-Darstellung beliebig vergrößern, indem wir Ak=0 für beliebig viele zusätzliche Werte von k setzen.
Wenn wir stillschweigend annehmen, dass mN/n eine ganze Zahl ist — was äquivalent dazu ist, dass N ein Vielfaches von n/gcd(n,m) ist — sind wir frei, G mit der klassischen Zustandsmenge {0,…,N−1} zu wählen.
Insbesondere können wir für den Fall N=nm das System W mit m2 klassischen Zuständen wählen.
Es bleibt, U zu wählen, was wir anhand des folgenden Musters tun:
U=A0A1⋮AN−1??⋮?⋯⋯⋱⋯??⋮?
Zur Klarstellung: Dieses Muster soll eine Blockmatrix darstellen, bei der jeder Block (einschließlich A0,…,AN−1 sowie der mit Fragezeichen markierten Blöcke) m Zeilen und n Spalten hat.
Es gibt N Blockzeilen, was d=mN/n Blockspalten ergibt.
In einer formelbasierten Darstellung definieren wir U als
wobei jede Matrix Mk,jm Zeilen und n Spalten hat, und insbesondere setzen wir Mk,0=Ak für k=0,…,N−1.
Diese Matrix muss unitär sein, und die mit Fragezeichen markierten Blöcke — also Mk,j für j>0 — müssen so gewählt werden, dass U unitär wird. Abgesehen davon, dass sie die Unitarität von U ermöglichen, spielen die mit Fragezeichen markierten Blöcke für den Beweis keine Rolle.
Lassen wir vorübergehend die Frage der Unitarität von U beiseite und konzentrieren uns auf den Ausdruck
TrG(U(∣0⟩⟨0∣W⊗ρ)U†),
der den Ausgabezustand von Y bei Eingabezustand ρ von X in unserer Stinespring-Darstellung beschreibt.
Alternativ können wir schreiben
Wir haben also eine korrekte Darstellung der Abbildung Φ, und es bleibt zu zeigen, dass U unitär gewählt werden kann.
Betrachte die ersten n Spalten von U gemäß dem obigen Muster.
Allein diese Spalten bilden eine Blockmatrix
A0A1⋮AN−1.
Es gibt n Spalten, eine für jeden klassischen Zustand von X, und als Vektoren nennen wir sie ∣γa⟩ für jedes a∈Σ.
Hier ist eine Formel für diese Vektoren, die mit der Blockmatrixdarstellung übereinstimmt:
∣γa⟩=k=0∑N−1∣k⟩⊗Ak∣a⟩
Berechnen wir nun das Skalarprodukt zweier beliebiger dieser Vektoren, also für eine beliebige Wahl von a,b∈Σ:
schließen wir, dass die n Spaltenvektoren {∣γa⟩:a∈Σ} eine Orthonormalbasis bilden:
⟨γa∣γb⟩={10a=ba=b
für alle a,b∈Σ.
Das bedeutet, dass die restlichen Spalten von U so ergänzt werden können, dass U eine unitäre Matrix wird.
Konkret kann das Gram-Schmidt-Orthogonalisierungsverfahren verwendet werden, um die restlichen Spalten zu wählen.
Etwas Ähnliches wurde in der Lektion Quantenschaltkreise des Kurses „Grundlagen der Quanteninformation" im Zusammenhang mit dem Zustandsunterscheidungsproblem gemacht.
Von Stinespring-Darstellungen zurück zur Definition
Die letzte Implikation ist 4 ⇒ 1.
Das heißt, wir nehmen an, dass eine unitäre Operation existiert, die ein Systempaar (W,X) in ein Paar
(G,Y) transformiert, und unser Ziel ist zu zeigen, dass die Abbildung
Φ(ρ)=TrG(U(∣0⟩⟨0∣W⊗ρ)U†)
ein gültiger Kanal ist.
Aus ihrer Form ist ersichtlich, dass Φ linear ist, und es bleibt zu zeigen, dass sie Dichtematrizen stets in Dichtematrizen umwandelt.
Das ist recht straightforward und die wesentlichen Punkte haben wir bereits besprochen.
Konkret: Wenn wir mit einer Dichtematrix σ eines zusammengesetzten Systems (Z,X) beginnen und ein zusätzliches Arbeitssystem W hinzufügen, erhalten wir wieder eine Dichtematrix.
Nach Neuanordnung der Systeme (W,Z,X) zur Vereinfachung können wir diesen Zustand als
∣0⟩⟨0∣W⊗σ
schreiben.
Anschließend wenden wir die unitäre Operation U an, die — wie bereits besprochen — ein gültiger Kanal ist und daher Dichtematrizen auf Dichtematrizen abbildet.
Schließlich ist die partielle Spur einer Dichtematrix erneut eine Dichtematrix.
Eine andere Sichtweise ist, folgende Beobachtung zu machen: Jede der folgenden Operationen ist ein gültiger Kanal:
Einführung eines initialisierten Arbeitssystems.
Durchführung einer unitären Operation.
Spurbildung über ein System.
Und jede Komposition von Kanälen ist wieder ein Kanal — was unmittelbar aus der Definition folgt, aber auch für sich genommen eine wichtige Beobachtung ist.
Damit ist der Beweis der letzten Implikation abgeschlossen, und wir haben die Äquivalenz der vier zu Beginn des Abschnitts aufgelisteten Aussagen bewiesen.