Zum Hauptinhalt springen

Naimarks Theorem

Das Naimark-Theorem ist eine grundlegende Aussage über Messungen. Es besagt, dass jede allgemeine Messung auf eine einfache Weise implementiert werden kann, die an die Stinespring-Darstellungen von Kanälen erinnert:

  1. Das zu messende System wird zunächst mit einem initialisierten Hilfssystem kombiniert, wodurch ein zusammengesetztes System entsteht.
  2. Dann wird eine unitäre Operation auf das zusammengesetzte System angewandt.
  3. Schließlich wird das Hilfssystem bezüglich einer Standardbasismessung gemessen, was das Ergebnis der ursprünglichen allgemeinen Messung liefert.

Theoremaussage und Beweis

Sei X\mathsf{X} ein System und {P0,,Pm1}\{P_0,\ldots,P_{m-1}\} eine Sammlung positiv-semidefiniter Matrizen, die

P0++Pm1=IX,P_0 + \cdots + P_{m-1} = \mathbb{I}_{\mathsf{X}},

erfüllen, was besagt, dass sie eine Messung von X\mathsf{X} beschreiben. Sei außerdem Y\mathsf{Y} ein System, dessen klassische Zustandsmenge {0,,m1}\{0,\ldots,m-1\} ist, also die Menge der möglichen Messergebnisse.

Das Naimark-Theorem besagt, dass eine unitäre Operation UU auf dem zusammengesetzten System (Y,X)(\mathsf{Y},\mathsf{X}) existiert, sodass die Implementierung, die die folgende Abbildung vorschlägt, Messergebnisse liefert, die mit der gegebenen Messung {P0,,Pm1}\{P_0,\ldots,P_{m-1}\} übereinstimmen – das heißt, die Wahrscheinlichkeiten für die verschiedenen möglichen Messergebnisse stimmen genau überein.

Eine Implementierung einer allgemeinen Messung gemäß Naimarks Theorem

Zur Klarstellung: Das System X\mathsf{X} beginnt in einem beliebigen Zustand ρ,\rho, während Y\mathsf{Y} im Zustand 0\vert 0\rangle initialisiert wird. Die unitäre Operation UU wird auf (Y,X)(\mathsf{Y},\mathsf{X}) angewandt, und anschließend wird das System Y\mathsf{Y} mit einer Standardbasismessung gemessen, was ein Ergebnis a{0,,m1}a\in\{0,\ldots,m-1\} liefert.

Das System X\mathsf{X} ist als Teil der Ausgabe des Circuits dargestellt, aber vorerst kümmern wir uns nicht um den Zustand von X\mathsf{X} nach der Ausführung von UU, und können uns vorstellen, dass es herausgespurt wird. Wir werden uns jedoch später in der Lektion für den Zustand von X\mathsf{X} nach der Ausführung von UU interessieren.

Eine solche Implementierung einer Messung erinnert offensichtlich an eine Stinespring-Darstellung eines Kanals, und die mathematischen Grundlagen sind ähnlich. Der Unterschied besteht darin, dass das Hilfssystem hier gemessen wird, anstatt wie im Fall einer Stinespring-Darstellung herausgespurt zu werden.

Die Tatsache, dass jede Messung auf diese Weise implementiert werden kann, ist recht einfach zu beweisen, aber zunächst benötigen wir eine Aussage über positiv-semidefinite Matrizen.

Tatsache

Sei PP eine positiv-semidefinite n×nn \times n-Matrix. Es existiert eine eindeutige positiv-semidefinite n×nn\times n-Matrix QQ für die Q2=PQ^2 = P gilt. Diese eindeutige positiv-semidefinite Matrix wird die Quadratwurzel von PP genannt und mit P\sqrt{P} bezeichnet.

Eine Möglichkeit, die Quadratwurzel einer positiv-semidefiniten Matrix zu finden, ist, zunächst eine Spektralzerlegung zu berechnen.

P=k=0n1λkψkψkP = \sum_{k=0}^{n-1} \lambda_k \vert \psi_k \rangle \langle \psi_k \vert

Da PP positiv-semidefinit ist, müssen ihre Eigenwerte nichtnegative reelle Zahlen sein, und indem wir sie durch ihre Quadratwurzeln ersetzen, erhalten wir einen Ausdruck für die Quadratwurzel von P.P.

P=k=0n1λkψkψk\sqrt{P} = \sum_{k=0}^{n-1} \sqrt{\lambda_k} \vert \psi_k \rangle \langle \psi_k \vert

Mit diesem Konzept sind wir bereit, das Naimark-Theorem zu beweisen. Unter der Annahme, dass X\mathsf{X} nn klassische Zustände hat, kann eine unitäre Operation UU auf dem Paar (Y,X)(\mathsf{Y},\mathsf{X}) durch eine nm×nmnm\times nm-Matrix dargestellt werden, die wir als eine m×mm\times m-Blockmatrix betrachten können, deren Blöcke n×nn\times n groß sind. Der Schlüssel zum Beweis ist, UU als eine beliebige unitäre Matrix zu wählen, die dem folgenden Muster entspricht.

U=(P0??P1??Pm1??)U = \begin{pmatrix} \sqrt{P_0} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \sqrt{P_1} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \sqrt{P_{m-1}} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix}

Damit es möglich ist, die mit Fragezeichen markierten Blöcke so auszufüllen, dass UU unitär ist, ist es notwendig und hinreichend, dass die ersten nn Spalten, die durch die Blöcke P0,,Pm1\sqrt{P_0},\ldots,\sqrt{P_{m-1}} gebildet werden, orthonormal sind. Wir können dann den Gram-Schmidt-Orthogonalisierungsprozess verwenden, um die verbleibenden Spalten aufzufüllen, genau wie in der vorherigen Lektion.

Die ersten nn Spalten von UU können wie folgt als Vektoren ausgedrückt werden, wobei c=0,,n1c = 0,\ldots,n-1 die Spaltennummer ab 00 bezeichnet.

γc=a=0m1aPac\vert\gamma_c\rangle = \sum_{a = 0}^{m-1} \vert a \rangle \otimes \sqrt{P_a} \vert c\rangle

Wir können das innere Produkt zwischen zwei beliebigen dieser Vektoren wie folgt berechnen.

γcγd=a,b=0m1abcPaPbd=c(a=0m1Pa)d=cd\langle \gamma_c \vert \gamma_d \rangle = \sum_{a,b = 0}^{m-1} \langle a \vert b \rangle \cdot \langle c \vert \sqrt{P_a}\sqrt{P_b}\, \vert d\rangle = \langle c \vert \Biggl(\sum_{a = 0}^{m-1} P_a \Biggr) \vert d\rangle = \langle c \vert d\rangle

Das zeigt, dass diese Spalten tatsächlich orthonormal sind, sodass wir die verbleibenden Spalten von UU so ausfüllen können, dass die gesamte Matrix unitär ist.

Es bleibt zu prüfen, dass die Messergebnis-Wahrscheinlichkeiten der Simulation konsistent mit der ursprünglichen Messung sind. Für einen gegebenen Anfangszustand ρ\rho von X\mathsf{X} liefert die durch die Sammlung {P0,,Pm1}\{P_0,\ldots,P_{m-1}\} beschriebene Messung jedes Ergebnis a{0,,m1}a\in\{0,\ldots,m-1\} mit Wahrscheinlichkeit Tr(Paρ).\operatorname{Tr}(P_a \rho).

Um die Ergebnis-Wahrscheinlichkeiten der Simulation zu erhalten, nennen wir zunächst den Zustand von (Y,X)(\mathsf{Y},\mathsf{X}) nach der Ausführung von UU den Namen σ.\sigma. Dieser Zustand kann wie folgt ausgedrückt werden.

σ=U(00ρ)U=a,b=0m1abPaρPb\sigma = U \bigl(\vert 0\rangle \langle 0 \vert \otimes \rho\bigr) U^{\dagger} = \sum_{a,b=0}^{m-1} \vert a\rangle \langle b \vert \otimes \sqrt{P_a} \rho \sqrt{P_b}

Äquivalent dazu haben wir in Blockmatrixform folgende Gleichung.

σ=(P0??P1??Pm1??)(ρ00000000)(P0P1Pm1??????)=(P0ρP0P0ρPm1Pm1ρP0Pm1ρPm1)\begin{aligned} \sigma & = \begin{pmatrix} \sqrt{P_0} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \sqrt{P_1} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \sqrt{P_{m-1}} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix} \begin{pmatrix} \rho & 0 & \cdots & 0 \\[1mm] 0 & 0 & \cdots & 0 \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] 0 & 0 & \cdots & 0 \end{pmatrix} \begin{pmatrix} \sqrt{P_0} & \sqrt{P_1} & \cdots & \sqrt{P_{m-1}} \\[1mm] \fbox{?} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \fbox{?} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix}\\[5mm] & = \begin{pmatrix} \sqrt{P_0}\rho\sqrt{P_0} & \cdots & \sqrt{P_0}\rho\sqrt{P_{m-1}} \\[1mm] \vdots & \ddots & \vdots\\[1mm] \sqrt{P_{m-1}}\rho\sqrt{P_0} & \cdots & \sqrt{P_{m-1}}\rho\sqrt{P_{m-1}} \end{pmatrix} \end{aligned}

Beachte, dass die Einträge von UU, die in die mit Fragezeichen markierten Blöcke fallen, keinen Einfluss auf das Ergebnis haben, da wir eine Matrix der Form 00ρ\vert 0 \rangle \langle 0 \vert \otimes \rho konjugieren — die Fragezeichen-Einträge werden also beim Berechnen des Matrixprodukts stets mit Nulleinträgen von 00ρ\vert 0 \rangle \langle 0 \vert \otimes \rho multipliziert.

Nun können wir analysieren, was passiert, wenn eine Standardbasismessung auf Y\mathsf{Y} durchgeführt wird. Die Wahrscheinlichkeiten der möglichen Ergebnisse ergeben sich aus den Diagonaleinträgen des reduzierten Zustands σY\sigma_{\mathsf{Y}} von Y.\mathsf{Y}.

σY=a,b=0m1Tr(PaρPb)ab\sigma_{\mathsf{Y}} = \sum_{a,b=0}^{m-1} \operatorname{Tr}\Bigl(\sqrt{P_a} \rho \sqrt{P_b}\Bigr) \vert a\rangle \langle b \vert

Mithilfe der zyklischen Eigenschaft der Spur sehen wir insbesondere, dass die Wahrscheinlichkeit, ein gegebenes Ergebnis a{0,,m1}a\in\{0,\ldots,m-1\} zu erhalten, wie folgt ist.

aσYa=Tr(PaρPa)=Tr(Paρ)\langle a \vert \sigma_{\mathsf{Y}} \vert a \rangle = \operatorname{Tr}\Bigl(\sqrt{P_a} \rho \sqrt{P_a}\Bigr) = \operatorname{Tr}(P_a \rho)

Das stimmt mit der ursprünglichen Messung überein und bestätigt die Korrektheit der Simulation.

Nicht-destruktive Messungen

Bisher in der Lektion haben wir uns mit destruktiven Messungen befasst, bei denen die Ausgabe allein aus dem klassischen Messergebnis besteht und keine Angabe über den Quantenzustand des gemessenen Systems nach der Messung gemacht wird.

Nicht-destruktive Messungen hingegen tun genau das. Konkret beschreiben nicht-destruktive Messungen nicht nur die Wahrscheinlichkeiten der klassischen Messergebnisse, sondern auch den Zustand des gemessenen Systems, bedingt auf jedes mögliche Messergebnis. Beachte, dass der Begriff nicht-destruktiv sich auf das System bezieht, das gemessen wird, nicht unbedingt auf seinen Zustand, der sich durch die Messung erheblich ändern könnte.

Im Allgemeinen gibt es für eine gegebene destruktive Messung mehrere (tatsächlich unendlich viele) nicht-destruktive Messungen, die mit der gegebenen destruktiven Messung kompatibel sind, d.h. bei denen die Wahrscheinlichkeiten der klassischen Messergebnisse genau mit der destruktiven Messung übereinstimmen. Es gibt also keinen eindeutigen Weg, den Quantenzustand eines Systems nach einer Messung zu definieren.

Es ist tatsächlich möglich, nicht-destruktive Messungen noch weiter zu verallgemeinern, sodass sie ein klassisches Messergebnis zusammen mit einem Quantenzustand-Ausgang eines Systems erzeugen, das nicht unbedingt dasselbe wie das Eingabesystem ist.

Das Konzept einer nicht-destruktiven Messung ist eine interessante und nützliche Abstraktion. Es sollte jedoch anerkannt werden, dass nicht-destruktive Messungen stets als Kompositionen von Kanälen und destruktiven Messungen beschrieben werden können — insofern ist das Konzept der destruktiven Messung das grundlegendere.

Aus dem Naimark-Theorem

Betrachten wir die Simulation einer allgemeinen Messung wie im Naimark-Theorem. Eine einfache Möglichkeit, eine nicht-destruktive Messung aus dieser Simulation zu erhalten, wird durch die vorherige Abbildung offenbart, bei der das System X\mathsf{X} nicht herausgespurt wird, sondern Teil der Ausgabe ist. Das liefert sowohl ein klassisches Messergebnis a{0,,m1}a\in\{0,\ldots,m-1\} als auch einen Quantenzustand von X\mathsf{X} nach der Messung.

Beschreiben wir diese Zustände in mathematischen Begriffen. Wir nehmen an, dass der Anfangszustand von X\mathsf{X} gleich ρ\rho ist, sodass nach Einführung des initialisierten Systems Y\mathsf{Y} und Ausführung von UU das System (Y,X)(\mathsf{Y},\mathsf{X}) im Zustand

σ=U(00ρ)U=a,b=0m1abPaρPb.\sigma = U \bigl(\vert 0\rangle \langle 0 \vert \otimes \rho\bigr) U^{\dagger} = \sum_{a,b=0}^{m-1} \vert a\rangle \langle b \vert \otimes \sqrt{P_a} \rho \sqrt{P_b}.

ist. Die Wahrscheinlichkeiten für die verschiedenen klassischen Ergebnisse sind dieselben wie zuvor — sie können sich nicht ändern, weil wir entschieden haben, X\mathsf{X} zu ignorieren oder nicht zu ignorieren. Das heißt, wir erhalten jedes a{0,,m1}a\in\{0,\ldots,m-1\} mit Wahrscheinlichkeit Tr(Paρ).\operatorname{Tr}(P_a \rho).

Bedingt auf ein bestimmtes Messergebnis aa ist der resultierende Zustand von X\mathsf{X} durch diesen Ausdruck gegeben.

PaρPaTr(Paρ)\frac{\sqrt{P_a} \rho \sqrt{P_a}}{\operatorname{Tr}(P_a \rho)}

Eine Möglichkeit, das zu sehen, ist, eine Standardbasismessung von Y\mathsf{Y} durch den vollständig dephasierenden Kanal Δm\Delta_m darzustellen, wobei der Kanalausgang klassische Messergebnisse als (diagonale) Dichtematrizen beschreibt. Ein Ausdruck des Zustands, den wir erhalten, ist wie folgt.

a,b=0m1Δm(ab)PaρPb=a=0m1aaPaρPa.\sum_{a,b=0}^{m-1} \Delta_m(\vert a\rangle \langle b \vert) \otimes \sqrt{P_a} \rho \sqrt{P_b} = \sum_{a=0}^{m-1} \vert a\rangle \langle a \vert \otimes \sqrt{P_a} \rho \sqrt{P_a}.

Wir können dann diesen Zustand als Konvexkombination von Produktzuständen schreiben,

a=0m1Tr(Paρ)aaPaρPaTr(Paρ),\sum_{a=0}^{m-1} \operatorname{Tr}(P_a \rho)\, \vert a\rangle \langle a \vert \otimes \frac{\sqrt{P_a} \rho \sqrt{P_a}}{\operatorname{Tr}(P_a \rho)},

was konsistent mit dem Ausdruck ist, den wir für den Zustand von X\mathsf{X} bedingt auf jedes mögliche Messergebnis erhalten haben.

Aus einer Kraus-Darstellung

Es gibt alternative Wahlen für UU im Kontext des Naimark-Theorems, die dieselben Messergebnis-Wahrscheinlichkeiten erzeugen, aber völlig unterschiedliche Ausgabezustände von X\mathsf{X} liefern.

Eine Option ist zum Beispiel, (IYV)U(\mathbb{I}_{\mathsf{Y}} \otimes V) U für UU einzusetzen, wobei VV eine beliebige unitäre Operation auf X\mathsf{X} ist. Die Anwendung von VV auf X\mathsf{X} kommutiert mit der Messung von Y,\mathsf{Y}, sodass sich die Wahrscheinlichkeiten der klassischen Ergebnisse nicht ändern. Nun wird der Zustand von X\mathsf{X} bedingt auf das Ergebnis aa

VPaρPaVTr(Paρ).\frac{V \sqrt{P_a} \rho \sqrt{P_a}V^{\dagger}}{\operatorname{Tr}(P_a \rho)}.

Allgemeiner könnten wir UU durch die unitäre Matrix

(a=0m1aaVa)U\Biggl(\sum_{a=0}^{m-1} \vert a\rangle\langle a \vert \otimes V_a\Biggr) U

für eine beliebige Wahl von unitären Operationen V0,,Vm1V_0,\ldots,V_{m-1} auf X\mathsf{X} ersetzen. Erneut sind die Wahrscheinlichkeiten der klassischen Ergebnisse unverändert, aber nun wird der Zustand von X\mathsf{X} bedingt auf das Ergebnis aa

VaPaρPaVaTr(Paρ).\frac{V_a \sqrt{P_a} \rho \sqrt{P_a}V_a^{\dagger}}{\operatorname{Tr}(P_a \rho)}.

Eine äquivalente Weise, diese Freiheit auszudrücken, ist mit Kraus-Darstellungen verbunden. Das heißt, wir können eine nicht-destruktive mm-Ergebnis-Messung eines Systems mit nn klassischen Zuständen durch eine Auswahl von n×nn\times n Kraus-Matrizen A0,,Am1A_0,\ldots,A_{m-1} beschreiben, die die typische Bedingung für Kraus-Matrizen erfüllen.

a=0m1AaAa=IX(1)\sum_{a = 0}^{m-1} A_a^{\dagger} A_a = \mathbb{I}_{\mathsf{X}} \tag{1}

Unter der Annahme, dass der Anfangszustand von X\mathsf{X} gleich ρ\rho ist, ist das klassische Messergebnis aa mit Wahrscheinlichkeit

Tr(AaρAa)=Tr(AaAaρ)\operatorname{Tr}\bigl(A_a \rho A_a^{\dagger}\bigr) = \operatorname{Tr}\bigl(A_a^{\dagger} A_a \rho \bigr)

und bedingt auf das Ergebnis aa wird der Zustand von X\mathsf{X}

AaρAaTr(AaAaρ).\frac{A_a \rho A_a^{\dagger}}{\operatorname{Tr}(A_a^{\dagger}A_a \rho)}.

Beachte, dass das äquivalent ist zur Wahl der unitären Operation UU im Naimark-Theorem wie folgt.

U=(A0??A1??Am1??)U = \begin{pmatrix} A_{0} & \fbox{?} & \cdots & \fbox{?} \\[1mm] A_{1} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] A_{m-1} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix}

In der vorherigen Lektion haben wir festgestellt, dass die durch die Blöcke A0,,Am1A_0,\ldots,A_{m-1} gebildeten Spalten notwendigerweise orthogonal sind, aufgrund der Bedingung (1).(1).

Verallgemeinerungen

Es gibt noch allgemeinere Möglichkeiten, nicht-destruktive Messungen zu formulieren, als die besprochenen. Das Konzept eines Quanteninstruments (das hier nicht beschrieben wird) stellt eine solche Möglichkeit dar.