Naimarks Theorem

Das Naimark-Theorem ist eine grundlegende Aussage über Messungen. Es besagt, dass jede allgemeine Messung auf eine einfache Weise implementiert werden kann, die an die Stinespring-Darstellungen von Kanälen erinnert:

Das zu messende System wird zunächst mit einem initialisierten Hilfssystem kombiniert, wodurch ein zusammengesetztes System entsteht.
Dann wird eine unitäre Operation auf das zusammengesetzte System angewandt.
Schließlich wird das Hilfssystem bezüglich einer Standardbasismessung gemessen, was das Ergebnis der ursprünglichen allgemeinen Messung liefert.

Theoremaussage und Beweis

Sei $\mathsf{X}$ ein System und $\{P_0,\ldots,P_{m-1}\}$ eine Sammlung positiv-semidefiniter Matrizen, die

P_0 + \cdots + P_{m-1} = \mathbb{I}_{\mathsf{X}},

erfüllen, was besagt, dass sie eine Messung von $\mathsf{X}$ beschreiben. Sei außerdem $\mathsf{Y}$ ein System, dessen klassische Zustandsmenge $\{0,\ldots,m-1\}$ ist, also die Menge der möglichen Messergebnisse.

Das Naimark-Theorem besagt, dass eine unitäre Operation $U$ auf dem zusammengesetzten System $(\mathsf{Y},\mathsf{X})$ existiert, sodass die Implementierung, die die folgende Abbildung vorschlägt, Messergebnisse liefert, die mit der gegebenen Messung $\{P_0,\ldots,P_{m-1}\}$ übereinstimmen – das heißt, die Wahrscheinlichkeiten für die verschiedenen möglichen Messergebnisse stimmen genau überein.

Eine Implementierung einer allgemeinen Messung gemäß Naimarks Theorem

Zur Klarstellung: Das System $\mathsf{X}$ beginnt in einem beliebigen Zustand $\rho,$ während $\mathsf{Y}$ im Zustand $\vert 0\rangle$ initialisiert wird. Die unitäre Operation $U$ wird auf $(\mathsf{Y},\mathsf{X})$ angewandt, und anschließend wird das System $\mathsf{Y}$ mit einer Standardbasismessung gemessen, was ein Ergebnis $a\in\{0,\ldots,m-1\}$ liefert.

Das System $\mathsf{X}$ ist als Teil der Ausgabe des Circuits dargestellt, aber vorerst kümmern wir uns nicht um den Zustand von $\mathsf{X}$ nach der Ausführung von $U$ , und können uns vorstellen, dass es herausgespurt wird. Wir werden uns jedoch später in der Lektion für den Zustand von $\mathsf{X}$ nach der Ausführung von $U$ interessieren.

Eine solche Implementierung einer Messung erinnert offensichtlich an eine Stinespring-Darstellung eines Kanals, und die mathematischen Grundlagen sind ähnlich. Der Unterschied besteht darin, dass das Hilfssystem hier gemessen wird, anstatt wie im Fall einer Stinespring-Darstellung herausgespurt zu werden.

Die Tatsache, dass jede Messung auf diese Weise implementiert werden kann, ist recht einfach zu beweisen, aber zunächst benötigen wir eine Aussage über positiv-semidefinite Matrizen.

Tatsache

Sei $P$ eine positiv-semidefinite $n \times n$ -Matrix. Es existiert eine eindeutige positiv-semidefinite $n\times n$ -Matrix $Q$ für die $Q^2 = P$ gilt. Diese eindeutige positiv-semidefinite Matrix wird die Quadratwurzel von $P$ genannt und mit $\sqrt{P}$ bezeichnet.

Eine Möglichkeit, die Quadratwurzel einer positiv-semidefiniten Matrix zu finden, ist, zunächst eine Spektralzerlegung zu berechnen.

P = \sum_{k=0}^{n-1} \lambda_k \vert \psi_k \rangle \langle \psi_k \vert

Da $P$ positiv-semidefinit ist, müssen ihre Eigenwerte nichtnegative reelle Zahlen sein, und indem wir sie durch ihre Quadratwurzeln ersetzen, erhalten wir einen Ausdruck für die Quadratwurzel von $P.$

\sqrt{P} = \sum_{k=0}^{n-1} \sqrt{\lambda_k} \vert \psi_k \rangle \langle \psi_k \vert

Mit diesem Konzept sind wir bereit, das Naimark-Theorem zu beweisen. Unter der Annahme, dass $\mathsf{X}$ $n$ klassische Zustände hat, kann eine unitäre Operation $U$ auf dem Paar $(\mathsf{Y},\mathsf{X})$ durch eine $nm\times nm$ -Matrix dargestellt werden, die wir als eine $m\times m$ -Blockmatrix betrachten können, deren Blöcke $n\times n$ groß sind. Der Schlüssel zum Beweis ist, $U$ als eine beliebige unitäre Matrix zu wählen, die dem folgenden Muster entspricht.

U = \begin{pmatrix} \sqrt{P_0} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \sqrt{P_1} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \sqrt{P_{m-1}} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix}

Damit es möglich ist, die mit Fragezeichen markierten Blöcke so auszufüllen, dass $U$ unitär ist, ist es notwendig und hinreichend, dass die ersten $n$ Spalten, die durch die Blöcke $\sqrt{P_0},\ldots,\sqrt{P_{m-1}}$ gebildet werden, orthonormal sind. Wir können dann den Gram-Schmidt-Orthogonalisierungsprozess verwenden, um die verbleibenden Spalten aufzufüllen, genau wie in der vorherigen Lektion.

Die ersten $n$ Spalten von $U$ können wie folgt als Vektoren ausgedrückt werden, wobei $c = 0,\ldots,n-1$ die Spaltennummer ab $0$ bezeichnet.

\vert\gamma_c\rangle = \sum_{a = 0}^{m-1} \vert a \rangle \otimes \sqrt{P_a} \vert c\rangle

Wir können das innere Produkt zwischen zwei beliebigen dieser Vektoren wie folgt berechnen.

\langle \gamma_c \vert \gamma_d \rangle = \sum_{a,b = 0}^{m-1} \langle a \vert b \rangle \cdot \langle c \vert \sqrt{P_a}\sqrt{P_b}\, \vert d\rangle = \langle c \vert \Biggl(\sum_{a = 0}^{m-1} P_a \Biggr) \vert d\rangle = \langle c \vert d\rangle

Das zeigt, dass diese Spalten tatsächlich orthonormal sind, sodass wir die verbleibenden Spalten von $U$ so ausfüllen können, dass die gesamte Matrix unitär ist.

Es bleibt zu prüfen, dass die Messergebnis-Wahrscheinlichkeiten der Simulation konsistent mit der ursprünglichen Messung sind. Für einen gegebenen Anfangszustand $\rho$ von $\mathsf{X}$ liefert die durch die Sammlung $\{P_0,\ldots,P_{m-1}\}$ beschriebene Messung jedes Ergebnis $a\in\{0,\ldots,m-1\}$ mit Wahrscheinlichkeit $\operatorname{Tr}(P_a \rho).$

Um die Ergebnis-Wahrscheinlichkeiten der Simulation zu erhalten, nennen wir zunächst den Zustand von $(\mathsf{Y},\mathsf{X})$ nach der Ausführung von $U$ den Namen $\sigma.$ Dieser Zustand kann wie folgt ausgedrückt werden.

\sigma = U \bigl(\vert 0\rangle \langle 0 \vert \otimes \rho\bigr) U^{\dagger} = \sum_{a,b=0}^{m-1} \vert a\rangle \langle b \vert \otimes \sqrt{P_a} \rho \sqrt{P_b}

Äquivalent dazu haben wir in Blockmatrixform folgende Gleichung.

\begin{aligned} \sigma & = \begin{pmatrix} \sqrt{P_0} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \sqrt{P_1} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \sqrt{P_{m-1}} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix} \begin{pmatrix} \rho & 0 & \cdots & 0 \\[1mm] 0 & 0 & \cdots & 0 \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] 0 & 0 & \cdots & 0 \end{pmatrix} \begin{pmatrix} \sqrt{P_0} & \sqrt{P_1} & \cdots & \sqrt{P_{m-1}} \\[1mm] \fbox{?} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \fbox{?} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix}\\[5mm] & = \begin{pmatrix} \sqrt{P_0}\rho\sqrt{P_0} & \cdots & \sqrt{P_0}\rho\sqrt{P_{m-1}} \\[1mm] \vdots & \ddots & \vdots\\[1mm] \sqrt{P_{m-1}}\rho\sqrt{P_0} & \cdots & \sqrt{P_{m-1}}\rho\sqrt{P_{m-1}} \end{pmatrix} \end{aligned}

Beachte, dass die Einträge von $U$ , die in die mit Fragezeichen markierten Blöcke fallen, keinen Einfluss auf das Ergebnis haben, da wir eine Matrix der Form $\vert 0 \rangle \langle 0 \vert \otimes \rho$ konjugieren — die Fragezeichen-Einträge werden also beim Berechnen des Matrixprodukts stets mit Nulleinträgen von $\vert 0 \rangle \langle 0 \vert \otimes \rho$ multipliziert.

Nun können wir analysieren, was passiert, wenn eine Standardbasismessung auf $\mathsf{Y}$ durchgeführt wird. Die Wahrscheinlichkeiten der möglichen Ergebnisse ergeben sich aus den Diagonaleinträgen des reduzierten Zustands $\sigma_{\mathsf{Y}}$ von $\mathsf{Y}.$

\sigma_{\mathsf{Y}} = \sum_{a,b=0}^{m-1} \operatorname{Tr}\Bigl(\sqrt{P_a} \rho \sqrt{P_b}\Bigr) \vert a\rangle \langle b \vert

Mithilfe der zyklischen Eigenschaft der Spur sehen wir insbesondere, dass die Wahrscheinlichkeit, ein gegebenes Ergebnis $a\in\{0,\ldots,m-1\}$ zu erhalten, wie folgt ist.

\langle a \vert \sigma_{\mathsf{Y}} \vert a \rangle = \operatorname{Tr}\Bigl(\sqrt{P_a} \rho \sqrt{P_a}\Bigr) = \operatorname{Tr}(P_a \rho)

Das stimmt mit der ursprünglichen Messung überein und bestätigt die Korrektheit der Simulation.

Nicht-destruktive Messungen

Bisher in der Lektion haben wir uns mit destruktiven Messungen befasst, bei denen die Ausgabe allein aus dem klassischen Messergebnis besteht und keine Angabe über den Quantenzustand des gemessenen Systems nach der Messung gemacht wird.

Nicht-destruktive Messungen hingegen tun genau das. Konkret beschreiben nicht-destruktive Messungen nicht nur die Wahrscheinlichkeiten der klassischen Messergebnisse, sondern auch den Zustand des gemessenen Systems, bedingt auf jedes mögliche Messergebnis. Beachte, dass der Begriff nicht-destruktiv sich auf das System bezieht, das gemessen wird, nicht unbedingt auf seinen Zustand, der sich durch die Messung erheblich ändern könnte.

Im Allgemeinen gibt es für eine gegebene destruktive Messung mehrere (tatsächlich unendlich viele) nicht-destruktive Messungen, die mit der gegebenen destruktiven Messung kompatibel sind, d.h. bei denen die Wahrscheinlichkeiten der klassischen Messergebnisse genau mit der destruktiven Messung übereinstimmen. Es gibt also keinen eindeutigen Weg, den Quantenzustand eines Systems nach einer Messung zu definieren.

Es ist tatsächlich möglich, nicht-destruktive Messungen noch weiter zu verallgemeinern, sodass sie ein klassisches Messergebnis zusammen mit einem Quantenzustand-Ausgang eines Systems erzeugen, das nicht unbedingt dasselbe wie das Eingabesystem ist.

Das Konzept einer nicht-destruktiven Messung ist eine interessante und nützliche Abstraktion. Es sollte jedoch anerkannt werden, dass nicht-destruktive Messungen stets als Kompositionen von Kanälen und destruktiven Messungen beschrieben werden können — insofern ist das Konzept der destruktiven Messung das grundlegendere.

Aus dem Naimark-Theorem

Betrachten wir die Simulation einer allgemeinen Messung wie im Naimark-Theorem. Eine einfache Möglichkeit, eine nicht-destruktive Messung aus dieser Simulation zu erhalten, wird durch die vorherige Abbildung offenbart, bei der das System $\mathsf{X}$ nicht herausgespurt wird, sondern Teil der Ausgabe ist. Das liefert sowohl ein klassisches Messergebnis $a\in\{0,\ldots,m-1\}$ als auch einen Quantenzustand von $\mathsf{X}$ nach der Messung.

Beschreiben wir diese Zustände in mathematischen Begriffen. Wir nehmen an, dass der Anfangszustand von $\mathsf{X}$ gleich $\rho$ ist, sodass nach Einführung des initialisierten Systems $\mathsf{Y}$ und Ausführung von $U$ das System $(\mathsf{Y},\mathsf{X})$ im Zustand

\sigma = U \bigl(\vert 0\rangle \langle 0 \vert \otimes \rho\bigr) U^{\dagger} = \sum_{a,b=0}^{m-1} \vert a\rangle \langle b \vert \otimes \sqrt{P_a} \rho \sqrt{P_b}.

ist. Die Wahrscheinlichkeiten für die verschiedenen klassischen Ergebnisse sind dieselben wie zuvor — sie können sich nicht ändern, weil wir entschieden haben, $\mathsf{X}$ zu ignorieren oder nicht zu ignorieren. Das heißt, wir erhalten jedes $a\in\{0,\ldots,m-1\}$ mit Wahrscheinlichkeit $\operatorname{Tr}(P_a \rho).$

Bedingt auf ein bestimmtes Messergebnis $a$ ist der resultierende Zustand von $\mathsf{X}$ durch diesen Ausdruck gegeben.

\frac{\sqrt{P_a} \rho \sqrt{P_a}}{\operatorname{Tr}(P_a \rho)}

Eine Möglichkeit, das zu sehen, ist, eine Standardbasismessung von $\mathsf{Y}$ durch den vollständig dephasierenden Kanal $\Delta_m$ darzustellen, wobei der Kanalausgang klassische Messergebnisse als (diagonale) Dichtematrizen beschreibt. Ein Ausdruck des Zustands, den wir erhalten, ist wie folgt.

\sum_{a,b=0}^{m-1} \Delta_m(\vert a\rangle \langle b \vert) \otimes \sqrt{P_a} \rho \sqrt{P_b} = \sum_{a=0}^{m-1} \vert a\rangle \langle a \vert \otimes \sqrt{P_a} \rho \sqrt{P_a}.

Wir können dann diesen Zustand als Konvexkombination von Produktzuständen schreiben,

\sum_{a=0}^{m-1} \operatorname{Tr}(P_a \rho)\, \vert a\rangle \langle a \vert \otimes \frac{\sqrt{P_a} \rho \sqrt{P_a}}{\operatorname{Tr}(P_a \rho)},

was konsistent mit dem Ausdruck ist, den wir für den Zustand von $\mathsf{X}$ bedingt auf jedes mögliche Messergebnis erhalten haben.

Aus einer Kraus-Darstellung

Es gibt alternative Wahlen für $U$ im Kontext des Naimark-Theorems, die dieselben Messergebnis-Wahrscheinlichkeiten erzeugen, aber völlig unterschiedliche Ausgabezustände von $\mathsf{X}$ liefern.

Eine Option ist zum Beispiel, $(\mathbb{I}_{\mathsf{Y}} \otimes V) U$ für $U$ einzusetzen, wobei $V$ eine beliebige unitäre Operation auf $\mathsf{X}$ ist. Die Anwendung von $V$ auf $\mathsf{X}$ kommutiert mit der Messung von $\mathsf{Y},$ sodass sich die Wahrscheinlichkeiten der klassischen Ergebnisse nicht ändern. Nun wird der Zustand von $\mathsf{X}$ bedingt auf das Ergebnis $a$

\frac{V \sqrt{P_a} \rho \sqrt{P_a}V^{\dagger}}{\operatorname{Tr}(P_a \rho)}.

Allgemeiner könnten wir $U$ durch die unitäre Matrix

\Biggl(\sum_{a=0}^{m-1} \vert a\rangle\langle a \vert \otimes V_a\Biggr) U

für eine beliebige Wahl von unitären Operationen $V_0,\ldots,V_{m-1}$ auf $\mathsf{X}$ ersetzen. Erneut sind die Wahrscheinlichkeiten der klassischen Ergebnisse unverändert, aber nun wird der Zustand von $\mathsf{X}$ bedingt auf das Ergebnis $a$

\frac{V_a \sqrt{P_a} \rho \sqrt{P_a}V_a^{\dagger}}{\operatorname{Tr}(P_a \rho)}.

Eine äquivalente Weise, diese Freiheit auszudrücken, ist mit Kraus-Darstellungen verbunden. Das heißt, wir können eine nicht-destruktive $m$ -Ergebnis-Messung eines Systems mit $n$ klassischen Zuständen durch eine Auswahl von $n\times n$ Kraus-Matrizen $A_0,\ldots,A_{m-1}$ beschreiben, die die typische Bedingung für Kraus-Matrizen erfüllen.

\sum_{a = 0}^{m-1} A_a^{\dagger} A_a = \mathbb{I}_{\mathsf{X}} \tag{1}

Unter der Annahme, dass der Anfangszustand von $\mathsf{X}$ gleich $\rho$ ist, ist das klassische Messergebnis $a$ mit Wahrscheinlichkeit

\operatorname{Tr}\bigl(A_a \rho A_a^{\dagger}\bigr) = \operatorname{Tr}\bigl(A_a^{\dagger} A_a \rho \bigr)

und bedingt auf das Ergebnis $a$ wird der Zustand von $\mathsf{X}$

\frac{A_a \rho A_a^{\dagger}}{\operatorname{Tr}(A_a^{\dagger}A_a \rho)}.

Beachte, dass das äquivalent ist zur Wahl der unitären Operation $U$ im Naimark-Theorem wie folgt.

U = \begin{pmatrix} A_{0} & \fbox{?} & \cdots & \fbox{?} \\[1mm] A_{1} & \fbox{?} & \cdots & \fbox{?} \\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] A_{m-1} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix}

In der vorherigen Lektion haben wir festgestellt, dass die durch die Blöcke $A_0,\ldots,A_{m-1}$ gebildeten Spalten notwendigerweise orthogonal sind, aufgrund der Bedingung $(1).$

Verallgemeinerungen

Es gibt noch allgemeinere Möglichkeiten, nicht-destruktive Messungen zu formulieren, als die besprochenen. Das Konzept eines Quanteninstruments (das hier nicht beschrieben wird) stellt eine solche Möglichkeit dar.

Theoremaussage und Beweis​

Nicht-destruktive Messungen​

Aus dem Naimark-Theorem​

Aus einer Kraus-Darstellung​

Verallgemeinerungen​

Theoremaussage und Beweis

Nicht-destruktive Messungen

Aus dem Naimark-Theorem

Aus einer Kraus-Darstellung

Verallgemeinerungen