Mathematische Formulierungen von Messungen

Die Lektion beginnt mit zwei äquivalenten mathematischen Beschreibungen von Messungen:

Allgemeine Messungen können durch Sammlungen von Matrizen beschrieben werden – eine für jedes Messergebnis –, die die Beschreibung projektiver Messungen verallgemeinern.
Allgemeine Messungen können als Kanäle beschrieben werden, deren Ausgaben stets klassische Zustände sind (dargestellt durch Diagonaldichtematrizen).

Wir beschränken unsere Betrachtung auf Messungen mit endlich vielen möglichen Ergebnissen. Zwar ist es möglich, Messungen mit unendlich vielen möglichen Ergebnissen zu definieren, doch treten diese im Kontext von Berechnung und Informationsverarbeitung weit seltener auf; zudem erfordern sie zusätzliche Mathematik (nämlich Maßtheorie), um sie ordnungsgemäß zu formalisieren.

Zunächst konzentrieren wir uns auf sogenannte destruktive Messungen, bei denen das Messergebnis allein der klassische Messwert ist – ohne Angabe des Post-Messzustands des gemessenen Systems. Anschaulich kann man sich vorstellen, dass eine solche Messung das Quantensystem selbst zerstört oder dass das System unmittelbar nach der Messung verworfen wird. Im weiteren Verlauf der Lektion erweitern wir unsere Betrachtung auf nicht-destruktive Messungen, bei denen es sowohl ein klassisches Messergebnis als auch einen Post-Messzustand des gemessenen Systems gibt.

Messungen als Sammlungen von Matrizen

Sei $\mathsf{X}$ ein zu messendes System, und nehme der Einfachheit halber an, dass die klassische Zustandsmenge von $\mathsf{X}$ gleich $\{0,\ldots, n-1\}$ für eine positive ganze Zahl $n$ ist, sodass Dichtematrizen, die Quantenzustände von $\mathsf{X}$ beschreiben, $n\times n$ -Matrizen sind. Wir werden nur selten auf die klassischen Zustände von $\mathsf{X}$ verweisen müssen, aber es ist praktisch, auf $n$ , die Anzahl der klassischen Zustände von $\mathsf{X}$ , Bezug zu nehmen. Wir nehmen außerdem an, dass die möglichen Ergebnisse der Messung die ganzen Zahlen $0,\ldots,m-1$ für eine positive ganze Zahl $m$ sind.

Diese Namen dienen lediglich der Vereinfachung; alles Folgende lässt sich problemlos auf andere endliche Mengen von klassischen Zuständen und Messergebnissen verallgemeinern, indem man sie entsprechend umbenennt.

Projektive Messungen

Eine projektive Messung wird durch eine Sammlung von Projektionsmatrizen beschrieben, die zur Identitätsmatrix summieren. In Symbolen:

\{\Pi_0,\ldots,\Pi_{m-1}\}

beschreibt eine projektive Messung von $\mathsf{X}$ , falls jedes $\Pi_a$ eine $n\times n$ -Projektionsmatrix ist und die folgende Bedingung erfüllt ist.

\Pi_0 + \cdots + \Pi_{m-1} = \mathbb{I}_{\mathsf{X}}

Wird eine solche Messung an einem System $\mathsf{X}$ durchgeführt, das sich im Zustand $\vert\psi\rangle$ befindet, so tritt jedes Ergebnis $a$ mit Wahrscheinlichkeit $\|\Pi_a\vert\psi\rangle\|^2$ auf. Der Post-Messzustand von $\mathsf{X}$ ergibt sich durch Normierung des Vektors $\Pi_a\vert\psi\rangle$ , den wir hier jedoch noch ignorieren.

Wird der Zustand von $\mathsf{X}$ statt durch einen Quantenzustandsvektor $\vert\psi\rangle$ durch eine Dichtematrix $\rho$ beschrieben, lässt sich die Wahrscheinlichkeit für Ergebnis $a$ alternativ als $\operatorname{Tr}(\Pi_a \rho)$ ausdrücken.

Ist $\rho = \vert \psi\rangle\langle\psi\vert$ ein reiner Zustand, so sind die beiden Ausdrücke gleich:

\operatorname{Tr}(\Pi_a \rho) = \operatorname{Tr}(\Pi_a \vert \psi\rangle\langle\psi \vert) = \langle \psi \vert \Pi_a \vert \psi \rangle = \langle \psi \vert \Pi_a \Pi_a \vert \psi \rangle = \|\Pi_a\vert\psi\rangle\|^2.

Hier verwenden wir für die zweite Gleichheit die zyklische Eigenschaft der Spur und für die dritte Gleichheit die Tatsache, dass jedes $\Pi_a$ eine Projektionsmatrix ist und daher $\Pi_a^2 = \Pi_a$ erfüllt.

Ist $\rho$ im Allgemeinen eine Konvexkombination

\rho = \sum_{k = 0}^{N-1} p_k \vert \psi_k\rangle\langle \psi_k \vert

von reinen Zuständen, so stimmt der Ausdruck $\operatorname{Tr}(\Pi_a \rho)$ mit der mittleren Wahrscheinlichkeit für Ergebnis $a$ überein, da dieser Ausdruck linear in $\rho$ ist.

\operatorname{Tr}(\Pi_a \rho) = \sum_{k = 0}^{N-1} p_k \operatorname{Tr}(\Pi_a \vert \psi_k\rangle\langle\psi_k\vert) = \sum_{k = 0}^{N-1} p_k \|\Pi_a\vert\psi_k\rangle\|^2

Allgemeine Messungen

Eine mathematische Beschreibung allgemeiner Messungen erhält man durch Abschwächung der Definition projektiver Messungen. Konkret erlauben wir, dass die Matrizen in der die Messung beschreibenden Sammlung beliebige positiv semidefinite Matrizen statt Projektionen sein dürfen. (Projektionen sind stets positiv semidefinit; sie lassen sich alternativ als positiv semidefinite Matrizen mit Eigenwerten ausschließlich aus $\{0, 1\}$ definieren.)

Eine allgemeine Messung eines Systems $\mathsf{X}$ mit Ergebnissen $0,\ldots,m-1$ wird also durch eine Sammlung positiv semidefiniter Matrizen $\{P_0,\ldots,P_{m-1}\}$ festgelegt, deren Zeilen und Spalten den klassischen Zuständen von $\mathsf{X}$ entsprechen und die die Bedingung

P_0 + \cdots + P_{m-1} = \mathbb{I}_{\mathsf{X}}

erfüllen.

Wird das System $\mathsf{X}$ im Zustand $\rho$ gemessen, so tritt jedes Ergebnis $a\in\{0,\ldots,m-1\}$ mit Wahrscheinlichkeit $\operatorname{Tr}(P_a \rho)$ auf.

Wie wir es natürlicherweise fordern müssen, bildet der Vektor der Ergebniswahrscheinlichkeiten

\bigl(\operatorname{Tr}(P_0 \rho),\ldots,\operatorname{Tr}(P_{m-1} \rho)\bigr)

einer allgemeinen Messung stets einen Wahrscheinlichkeitsvektor, für beliebige Dichtematrizen $\rho$ . Die folgenden zwei Beobachtungen zeigen, dass dies tatsächlich der Fall ist.

Jeder Wert $\operatorname{Tr}(P_a \rho)$ ist nichtnegativ, da die Spur des Produkts zweier beliebiger positiv semidefiniter Matrizen stets nichtnegativ ist:
$Q, R \geq 0 \; \Rightarrow \: \operatorname{Tr}(QR) \geq 0.$
Dies lässt sich beispielsweise mit Hilfe der Spektralzerlegungen von $Q$ und $R$ sowie der zyklischen Eigenschaft der Spur zeigen: Man drückt die Spur des Produkts $QR$ als Summe nichtnegativer reeller Zahlen aus, die daher nichtnegativ sein muss.
Die Bedingung $P_0 + \cdots + P_{m-1} = \mathbb{I}_{\mathsf{X}}$ zusammen mit der Linearität der Spur stellt sicher, dass die Wahrscheinlichkeiten sich zu $1$ summieren.
$\sum_{a = 0}^{m-1} \operatorname{Tr}(P_a \rho) = \operatorname{Tr}\Biggl(\sum_{a = 0}^{m-1} P_a \rho\Biggr) = \operatorname{Tr}(\mathbb{I}\rho) = \operatorname{Tr}(\rho) = 1$

Beispiel 1: Jede projektive Messung

Projektionen sind stets positiv semidefinit, daher ist jede projektive Messung ein Beispiel einer allgemeinen Messung.

Eine Standardbasismessung eines Qubits kann etwa durch $\{P_0,P_1\}$ dargestellt werden, wobei

P_0 = \vert 0\rangle\langle 0\vert = \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix} \quad\text{und}\quad P_1 = \vert 1\rangle\langle 1\vert = \begin{pmatrix} 0 & 0 \\ 0 & 1 \end{pmatrix}.

Die Messung eines Qubits im Zustand $\rho$ liefert folgende Ergebniswahrscheinlichkeiten.

\begin{aligned} \operatorname{Prob}(\text{outcome} = 0) & = \operatorname{Tr}(P_0 \rho) = \operatorname{Tr}\bigl(\vert 0\rangle\langle 0\vert \rho\bigr) = \langle 0\vert \rho \vert 0 \rangle \\[1mm] \operatorname{Prob}(\text{outcome} = 1) & = \operatorname{Tr}(P_1 \rho) = \operatorname{Tr}\bigl(\vert 1\rangle\langle 1\vert\rho\bigr) = \langle 1 \vert \rho \vert 1 \rangle \end{aligned}

Beispiel 2: Eine nicht-projektive Qubit-Messung

Sei $\mathsf{X}$ ein Qubit, und definiere zwei Matrizen wie folgt.

P_0 = \begin{pmatrix} \frac{2}{3} & \frac{1}{3}\\[2mm] \frac{1}{3} & \frac{1}{3} \end{pmatrix} \qquad P_1 = \begin{pmatrix} \frac{1}{3} & -\frac{1}{3}\\[2mm] -\frac{1}{3} & \frac{2}{3} \end{pmatrix}

Beide Matrizen sind positiv semidefinit: sie sind hermitesch, und ihre Eigenwerte sind in beiden Fällen $1/2 \pm \sqrt{5}/6$ , die beide positiv sind. Es gilt außerdem $P_0 + P_1 = \mathbb{I}$ , also beschreibt $\{P_0,P_1\}$ eine Messung.

Wird das System $\mathsf{X}$ im Zustand $\rho$ mit dieser Messung gemessen, so ist die Wahrscheinlichkeit für Ergebnis $0$ gleich $\operatorname{Tr}(P_0 \rho)$ und für Ergebnis $1$ gleich $\operatorname{Tr}(P_1 \rho)$ . Ist zum Beispiel $\rho = \vert + \rangle \langle + \vert$ , ergeben sich folgende Wahrscheinlichkeiten für die Ergebnisse $0$ und $1$ :

\begin{aligned} \operatorname{Tr}(P_0 \rho) & = \operatorname{Tr}\left( \begin{pmatrix} \frac{2}{3} & \frac{1}{3}\\[2mm] \frac{1}{3} & \frac{1}{3} \end{pmatrix} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} \right)\\[4mm] & = \biggl(\frac{2}{3} \cdot \frac{1}{2} + \frac{1}{3} \cdot \frac{1}{2}\biggr) + \biggl(\frac{1}{3}\cdot\frac{1}{2} + \frac{1}{3}\cdot\frac{1}{2}\biggr)\\ & = \frac{1}{2} + \frac{1}{3} = \frac{5}{6}\\[4mm] \operatorname{Tr}(P_1 \rho) & = \operatorname{Tr}\left( \begin{pmatrix} \frac{1}{3} & -\frac{1}{3}\\[2mm] -\frac{1}{3} & \frac{2}{3} \end{pmatrix} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} \right)\\[4mm] & = \biggl(\frac{1}{3} \cdot \frac{1}{2} - \frac{1}{3} \cdot \frac{1}{2}\biggr) + \biggl(-\frac{1}{3}\cdot\frac{1}{2} + \frac{2}{3}\cdot\frac{1}{2}\biggr)\\ & = 0 + \frac{1}{6} = \frac{1}{6} \end{aligned}

Beispiel 3: Tetraedermessung

Definiere vier Einzelqubit-Quantenzustandsvektoren wie folgt.

\begin{aligned} \vert\phi_0\rangle & = \vert 0 \rangle\\ \vert\phi_1\rangle & = \frac{1}{\sqrt{3}}\vert 0 \rangle + \sqrt{\frac{2}{3}} \vert 1\rangle \\ \vert\phi_2\rangle & = \frac{1}{\sqrt{3}}\vert 0 \rangle + \sqrt{\frac{2}{3}} e^{2\pi i/3} \vert 1\rangle \\ \vert\phi_3\rangle & = \frac{1}{\sqrt{3}}\vert 0 \rangle + \sqrt{\frac{2}{3}} e^{-2\pi i/3} \vert 1\rangle \end{aligned}

Diese vier Zustände werden manchmal als Tetraederzustände bezeichnet, da sie die Eckpunkte eines regulären Tetraeders bilden, das in die Bloch-Kugel einbeschrieben ist.

Illustration eines in die Bloch-Kugel einbeschriebenen Tetraeders

Die kartesischen Koordinaten dieser vier Zustände auf der Bloch-Kugel sind

(0,0,1),\\[2mm] \left( \frac{2\sqrt{2}}{3} , 0 , -\frac{1}{3} \right),\\[1mm] \left( -\frac{\sqrt{2}}{3} , \sqrt{\frac{2}{3}} , -\frac{1}{3} \right),\\[1mm] \left( -\frac{\sqrt{2}}{3} , -\sqrt{\frac{2}{3}} , -\frac{1}{3} \right),

was sich durch Ausdrücken der Dichtematrixdarstellungen dieser Zustände als Linearkombinationen von Pauli-Matrizen überprüfen lässt.

\vert \phi_0 \rangle\langle \phi_0 \vert = \begin{pmatrix} 1 & 0\\[1mm] 0 & 0 \end{pmatrix} = \frac{\mathbb{I} + \sigma_z}{2}

\vert \phi_1 \rangle\langle \phi_1 \vert = \begin{pmatrix} \frac{1}{3} & \frac{\sqrt{2}}{3} \\[2mm] \frac{\sqrt{2}}{3} & \frac{2}{3} \end{pmatrix} = \frac{\mathbb{I} + \frac{2\sqrt{2}}{3} \sigma_x - \frac{1}{3}\sigma_z}{2}

\vert \phi_2 \rangle\langle \phi_2 \vert = \begin{pmatrix} \frac{1}{3} & -\frac{1}{3\sqrt{2}} - \frac{i}{\sqrt{6}} \\[2mm] -\frac{1}{3\sqrt{2}} + \frac{i}{\sqrt{6}} & \frac{2}{3} \end{pmatrix} = \frac{\mathbb{I} - \frac{\sqrt{2}}{3} \sigma_x + \sqrt{\frac{2}{3}} \sigma_y - \frac{1}{3}\sigma_z}{2}

\vert \phi_3 \rangle\langle \phi_3 \vert = \begin{pmatrix} \frac{1}{3} & -\frac{1}{3\sqrt{2}} + \frac{i}{\sqrt{6}} \\[2mm] -\frac{1}{3\sqrt{2}} - \frac{i}{\sqrt{6}} & \frac{2}{3} \end{pmatrix} = \frac{\mathbb{I} - \frac{\sqrt{2}}{3} \sigma_x - \sqrt{\frac{2}{3}} \sigma_y - \frac{1}{3}\sigma_z}{2}

Diese vier Zustände sind auf der Bloch-Kugel gleichmäßig verteilt: Jeder Zustand hat denselben Abstand zu den anderen drei, und die Winkel zwischen je zwei Zuständen sind stets gleich.

Nun definieren wir eine Messung $\{P_0,P_1,P_2,P_3\}$ eines Qubits, indem wir $P_a$ für jedes $a=0,\ldots,3$ wie folgt setzen.

P_a = \frac{\vert\phi_a\rangle\langle\phi_a\vert}{2}

Dass dies eine gültige Messung ist, lässt sich folgendermaßen überprüfen.

Jedes $P_a$ ist offensichtlich positiv semidefinit, da es ein reiner Zustand dividiert durch zwei ist. Das heißt, jedes $P_a$ ist eine hermitesche Matrix mit einem Eigenwert $1/2$ und allen anderen Eigenwerten gleich null.
Die Summe dieser Matrizen ist die Identitätsmatrix: $P_0 + P_1 + P_2 + P_3 = \mathbb{I}$ . Dies lässt sich leicht überprüfen, indem man die Darstellungen dieser Matrizen als Linearkombinationen von Pauli-Matrizen verwendet.

Messungen als Kanäle

Eine zweite Möglichkeit, Messungen mathematisch zu beschreiben, besteht darin, sie als Kanäle aufzufassen.

Klassische Information kann als Spezialfall quantenmechanischer Information betrachtet werden, indem man probabilistische Zustände mit diagonalen Dichtematrizen identifiziert. Operativ gesehen können wir Messungen daher als Kanäle verstehen, deren Eingaben Matrizen sind, die Zustände des gemessenen Systems beschreiben, und deren Ausgaben diagonale Dichtematrizen sind, die die resultierende Verteilung der Messergebnisse beschreiben.

Wir werden gleich sehen, dass sich jeder Kanal mit dieser Eigenschaft stets in einer einfachen, kanonischen Form schreiben lässt, die direkt mit der Beschreibung von Messungen als Sammlungen positiv semidefiniter Matrizen zusammenhängt. Umgekehrt gibt es zu jeder beliebigen Messung als Matrizensammlung stets einen gültigen Kanal mit der Diagonalausgabeeigenschaft, der die gegebene Messung gemäß dem vorherigen Absatz beschreibt. Aus diesen Beobachtungen folgt, dass die beiden Beschreibungen allgemeiner Messungen äquivalent sind.

Bevor wir fortfahren, wollen wir präziser sein: Was ist die Messung, wie fassen wir sie als Kanal auf, und welche Annahmen treffen wir?

Wie zuvor nehmen wir an, dass $\mathsf{X}$ das zu messende System ist und dass die möglichen Messergebnisse die ganzen Zahlen $0,\ldots,m-1$ für eine positive ganze Zahl $m$ sind. Sei $\mathsf{Y}$ das System, das die Messergebnisse speichert; seine klassische Zustandsmenge ist also $\{0,\ldots,m-1\}$ , und wir stellen die Messung als Kanal $\Phi$ von $\mathsf{X}$ nach $\mathsf{Y}$ dar. Unsere Annahme ist, dass $\mathsf{Y}$ klassisch ist – das heißt, unabhängig davon, in welchem Zustand $\mathsf{X}$ zu Beginn ist, ist der resultierende Zustand von $\mathsf{Y}$ stets durch eine diagonale Dichtematrix dargestellt.

Wir können in mathematischen Begriffen ausdrücken, dass die Ausgabe von $\Phi$ stets diagonal ist, wie folgt. Definiere zunächst den vollständig dephasierenden Kanal $\Delta_m$ auf $\mathsf{Y}$ .

\Delta_m(\sigma) = \sum_{a = 0}^{m-1} \langle a \vert \sigma \vert a\rangle \,\vert a\rangle\langle a\vert

Dieser Kanal ist analog zum vollständig dephasierenden Qubit-Kanal $\Delta$ aus der vorherigen Lektion. Als lineare Abbildung setzt er alle Außerdiagonaleinträge einer Eingabematrix auf null und lässt die Diagonale unverändert.

Eine einfache Möglichkeit auszudrücken, dass eine gegebene Dichtematrix $\sigma$ diagonal ist, lautet: $\sigma = \Delta_m(\sigma)$ . Mit anderen Worten: Das Nullsetzen aller Außerdiagonaleinträge einer Dichtematrix hat genau dann keine Wirkung, wenn diese Einträge von vornherein alle null waren. Der Kanal $\Phi$ erfüllt unsere Annahme – dass $\mathsf{Y}$ klassisch ist – genau dann, wenn

\Phi(\rho) = \Delta_m(\Phi(\rho))

für jede Dichtematrix $\rho$ , die einen Zustand von $\mathsf{X}$ beschreibt.

Äquivalenz der Formulierungen

Von Kanälen zu Matrizen

Angenommen, wir haben einen Kanal von $\mathsf{X}$ nach $\mathsf{Y}$ mit der Eigenschaft, dass

\Phi(\rho) = \Delta_m(\Phi(\rho))

für jede Dichtematrix $\rho$ gilt. Dies lässt sich alternativ wie folgt ausdrücken.

\Phi(\rho) = \sum_{a = 0}^{m-1} \langle a \vert \Phi(\rho) \vert a\rangle\, \vert a\rangle\langle a \vert \tag{1}

Wie jeden Kanal können wir $\Phi$ in Kraus-Form für eine geeignete Wahl von Kraus-Matrizen $A_0,\ldots,A_{N-1}$ schreiben.

\Phi(\rho) = \sum_{k = 0}^{N-1} A_k \rho A_k^{\dagger}

Dies liefert uns einen alternativen Ausdruck für die Diagonaleinträge von $\Phi(\rho)\!:$

\begin{aligned} \langle a \vert \Phi(\rho) \vert a\rangle & = \sum_{k = 0}^{N-1} \langle a \vert A_k \rho A_k^{\dagger} \vert a\rangle \\ & = \sum_{k = 0}^{N-1} \operatorname{Tr}\bigl( A_k^{\dagger} \vert a\rangle\langle a \vert A_k \rho\bigr)\\ & = \operatorname{Tr}\bigl(P_a\rho\bigr) \end{aligned}

für

P_a = \sum_{k = 0}^{N-1} A_k^{\dagger} \vert a\rangle\langle a \vert A_k.

Für dieselben Matrizen $P_0,\ldots,P_{m-1}$ lässt sich der Kanal $\Phi$ also wie folgt ausdrücken.

\Phi(\rho) = \sum_{a = 0}^{m-1} \operatorname{Tr}(P_a \rho) \vert a\rangle\langle a\vert

Dieser Ausdruck stimmt mit unserer Beschreibung allgemeiner Messungen durch Matrizen überein: Jedes Messergebnis tritt mit Wahrscheinlichkeit $\operatorname{Tr}(P_a \rho)$ auf.

Nun stellen wir fest, dass die zwei Eigenschaften, die die Matrizensammlung $\{P_0,\ldots,P_{m-1}\}$ für eine allgemeine Messung erfüllen muss, tatsächlich gegeben sind. Die erste Eigenschaft ist, dass alle Matrizen positiv semidefinit sind. Dies ergibt sich daraus, dass für jeden Vektor $\vert \psi\rangle$ mit Einträgen entsprechend den klassischen Zuständen von $\mathsf{X}$ gilt:

\langle \psi \vert P_a \vert \psi\rangle = \sum_{k = 0}^{N-1} \langle \psi \vert A_k^{\dagger} \vert a\rangle\langle a \vert A_k\vert \psi\rangle = \sum_{k = 0}^{N-1} \bigl\vert\langle a \vert A_k\vert \psi\rangle\bigr\vert^2 \geq 0.

Die zweite Eigenschaft ist, dass die Summe dieser Matrizen die Identitätsmatrix ergibt.

\begin{aligned} \sum_{a = 0}^{m-1} P_a & = \sum_{a = 0}^{m-1} \sum_{k = 0}^{N-1} A_k^{\dagger} \vert a\rangle\langle a \vert A_k \\ & = \sum_{k = 0}^{N-1} A_k^{\dagger} \Biggl(\sum_{a = 0}^{m-1} \vert a\rangle\langle a \vert\Biggr) A_k \\ & = \sum_{k = 0}^{N-1} A_k^{\dagger} A_k \\ & = \mathbb{I}_{\mathsf{X}} \end{aligned}

Die letzte Gleichheit folgt daraus, dass $\Phi$ ein Kanal ist und seine Kraus-Matrizen diese Bedingung erfüllen müssen.

Von Matrizen zu Kanälen

Nun überprüfen wir, dass für eine beliebige Sammlung $\{P_0,\ldots,P_{m-1}\}$ positiv semidefiniter Matrizen, die $P_0 + \cdots + P_{m-1} = \mathbb{I}_{\mathsf{X}}$ erfüllen, die durch

\Phi(\rho) = \sum_{a = 0}^{m-1} \operatorname{Tr}(P_a \rho) \vert a \rangle\langle a\vert

definierte Abbildung tatsächlich ein gültiger Kanal von $\mathsf{X}$ nach $\mathsf{Y}$ ist.

Eine Möglichkeit besteht darin, die Choi-Darstellung dieser Abbildung zu berechnen.

\begin{aligned} J(\Phi) & = \sum_{b,c = 0}^{n-1} \vert b \rangle \langle c \vert \otimes \Phi(\vert b \rangle \langle c \vert)\\[1mm] & = \sum_{b,c = 0}^{n-1} \sum_{a = 0}^{m-1} \vert b \rangle \langle c \vert \otimes \operatorname{Tr}(P_a \vert b \rangle \langle c \vert) \vert a \rangle\langle a\vert\\[1mm] & = \sum_{b,c = 0}^{n-1} \sum_{a = 0}^{m-1} \vert b \rangle \langle b \vert P_a^T \vert c \rangle \langle c \vert \otimes \vert a \rangle\langle a\vert\\[1mm] & = \sum_{a = 0}^{m-1} P_a^T \otimes \vert a \rangle\langle a\vert \end{aligned}

Die Transponierte jedes $P_a$ tritt bei der dritten Gleichheit auf, weil

\langle c \vert P_a \vert b\rangle = \langle b \vert P_a^T \vert c\rangle.

Dies erlaubt, die Ausdrücke $\vert b \rangle \langle b \vert$ und $\vert c \rangle \langle c \vert$ erscheinen zu lassen, die sich beim Summieren über $b$ bzw. $c$ zur Identitätsmatrix vereinfachen.

Da $P_0,\ldots,P_{m-1}$ nach Voraussetzung positiv semidefinit sind, gilt das auch für $P_0^{T},\ldots,P_{m-1}^{T}$ . Insbesondere ergibt das Transponieren einer hermiteschen Matrix wieder eine hermitesche Matrix, und die Eigenwerte einer quadratischen Matrix und ihrer Transponierten stimmen stets überein. Daraus folgt, dass $J(\Phi)$ positiv semidefinit ist. Das Ausspuren des Ausgabesystems $\mathsf{Y}$ (das rechte System) ergibt

\operatorname{Tr}_{\mathsf{Y}} (J(\Phi)) = \sum_{a = 0}^{m-1} P_a^T = \mathbb{I}_{\mathsf{X}}^T = \mathbb{I}_{\mathsf{X}},

und wir schließen, dass $\Phi$ ein Kanal ist.

Partielle Messungen

Angenommen, mehrere Systeme befinden sich zusammen in einem Quantenzustand, und es wird eine allgemeine Messung an einem der Systeme durchgeführt. Dies führt zu einem der Messergebnisse, das zufällig mit Wahrscheinlichkeiten gewählt wird, die durch die Messung und den Zustand des Systems vor der Messung bestimmt werden. Der resultierende Zustand der verbleibenden Systeme hängt dann im Allgemeinen davon ab, welches Messergebnis erzielt wurde.

Untersuchen wir, wie dies für ein Paar von Systemen $(\mathsf{X},\mathsf{Z})$ funktioniert, wenn das System $\mathsf{X}$ gemessen wird. (Wir nennen das rechte System $\mathsf{Z}$ , weil wir $\mathsf{Y}$ für das System reservieren, das die klassische Ausgabe der Messung darstellt, wenn wir sie als Kanal betrachten.) Anschließend lässt sich dies leicht auf den Fall verallgemeinern, in dem die Systeme vertauscht sind oder drei oder mehr Systeme vorhanden sind.

Der Zustand von $(\mathsf{X},\mathsf{Z})$ vor der Messung sei durch eine Dichtematrix $\rho$ beschrieben, die wir wie folgt schreiben können.

\rho = \sum_{b,c = 0}^{n-1} \vert b\rangle\langle c\vert \otimes \rho_{b,c}

In diesem Ausdruck nehmen wir an, dass die klassischen Zustände von $\mathsf{X}$ gleich $0,\ldots,n-1$ sind.

Wir nehmen an, dass die Messung durch die Matrizensammlung $\{P_0,\ldots,P_{m-1}\}$ beschrieben wird. Diese Messung kann alternativ als Kanal $\Phi$ von $\mathsf{X}$ nach $\mathsf{Y}$ beschrieben werden, wobei $\mathsf{Y}$ ein neues System mit klassischer Zustandsmenge $\{0,\ldots,m-1\}$ ist. Die Wirkung dieses Kanals lässt sich konkret wie folgt ausdrücken.

\Phi(\xi) = \sum_{a = 0}^{m-1} \operatorname{Tr}(P_a \xi)\, \vert a \rangle \langle a \vert

Ergebniswahrscheinlichkeiten

Da wir eine Messung des Systems $\mathsf{X}$ betrachten, können die Wahrscheinlichkeiten der verschiedenen Messergebnisse nur vom reduzierten Zustand $\rho_{\mathsf{X}}$ von $\mathsf{X}$ abhängen. Insbesondere lässt sich die Wahrscheinlichkeit für jedes Ergebnis $a\in\{0,\ldots,m-1\}$ auf drei äquivalente Weisen ausdrücken.

\operatorname{Tr}\bigl( P_a \rho_{\mathsf{X}}\bigr) = \operatorname{Tr}\bigl( P_a \operatorname{Tr}_{\mathsf{Z}}(\rho)\bigr) = \operatorname{Tr}\bigl( (P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho \bigr)

Der erste Ausdruck stellt die Wahrscheinlichkeit für Ergebnis $a$ auf natürliche Weise dar, basierend auf dem, was wir bereits über Messungen an einem einzelnen System wissen. Der zweite Ausdruck folgt direkt aus der Definition $\rho_{\mathsf{X}} = \operatorname{Tr}_{\mathsf{Z}}(\rho)$ .

Der dritte Ausdruck erfordert etwas mehr Nachdenken – und du bist eingeladen, dich selbst davon zu überzeugen, dass er wahr ist. Hier ein Hinweis: Die Äquivalenz von zweitem und drittem Ausdruck hängt nicht davon ab, ob $\rho$ eine Dichtematrix oder jedes $P_a$ positiv semidefinit ist. Versuche zunächst, es für Tensorprodukte der Form $\rho = M\otimes N$ zu zeigen, und schließe dann durch Linearität auf den allgemeinen Fall.

Obwohl die Äquivalenz von erstem und drittem Ausdruck nicht unmittelbar offensichtlich ist, ergibt sie sich plausibel. Ausgehend von einer Messung an $\mathsf{X}$ definieren wir effektiv eine Messung von $(\mathsf{X},\mathsf{Z})$ , bei der wir $\mathsf{Z}$ einfach verwerfen und $\mathsf{X}$ messen. Wie jede Messung lässt sich diese neue Messung durch eine Matrizensammlung beschreiben, und es ist nicht überraschend, dass diese Messung durch die Sammlung

\{P_0\otimes\mathbb{I}_{\mathsf{Z}}, \ldots, P_{m-1}\otimes\mathbb{I}_{\mathsf{Z}}\}

beschrieben wird.

Zustände bedingt auf Messergebnisse

Möchten wir nicht nur die Wahrscheinlichkeiten der verschiedenen Ergebnisse bestimmen, sondern auch den resultierenden Zustand von $\mathsf{Z}$ bedingt auf jedes Messergebnis, können wir die Kanalbeschreibung der Messung heranziehen. Insbesondere betrachten wir den Zustand, den wir erhalten, wenn wir $\Phi$ auf $\mathsf{X}$ anwenden und $\mathsf{Z}$ unverändert lassen.

\begin{aligned} (\Phi\otimes\operatorname{Id}_{\mathsf{Z}})(\rho) & = \sum_{b,c = 0}^{n-1} \Phi(\vert b\rangle\langle c\vert) \otimes \rho_{b,c}\\ & = \sum_{a = 0}^{m-1} \sum_{b,c = 0}^{n-1} \operatorname{Tr}(P_a \vert b\rangle\langle c\vert) \,\vert a\rangle \langle a \vert \otimes \rho_{b,c}\\ & = \sum_{a = 0}^{m-1} \vert a\rangle \langle a \vert \otimes \sum_{b,c = 0}^{n-1} \operatorname{Tr}(P_a \vert b\rangle\langle c\vert) \rho_{b,c}\\ & = \sum_{a = 0}^{m-1} \vert a\rangle \langle a \vert \otimes \sum_{b,c = 0}^{n-1} \operatorname{Tr}_{\mathsf{X}}\bigl((P_a\otimes\mathbb{I}_{\mathsf{Z}}) (\vert b\rangle\langle c\vert\otimes\rho_{b,c})\bigr)\\ & = \sum_{a = 0}^{m-1} \vert a\rangle \langle a \vert \otimes \operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho\bigr) \end{aligned}

Dies ist eine Dichtematrix, da $\Phi$ ein Kanal ist; jede Matrix $\operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)$ ist daher notwendigerweise positiv semidefinit.

Ein letzter Schritt formt diesen Ausdruck in eine Form um, die das Gesuchte offenbart.

\sum_{a = 0}^{m-1} \operatorname{Tr}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)\, \vert a\rangle \langle a \vert \otimes \frac{\operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)}{\operatorname{Tr}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)}

Dies ist ein Beispiel eines klassisch-quantenmechanischen Zustands,

\sum_{a = 0}^{m-1} p(a)\, \vert a\rangle\langle a\vert \otimes \sigma_a,

wie wir ihn in der Lektion über Dichtematrizen kennengelernt haben. Für jedes Messergebnis $a\in\{0,\ldots,m-1\}$ gilt: Mit Wahrscheinlichkeit

p(a) = \operatorname{Tr}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)

befindet sich $\mathsf{Y}$ im klassischen Zustand $\vert a \rangle \langle a \vert$ und $\mathsf{Z}$ im Zustand

\sigma_a = \frac{\operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)}{\operatorname{Tr}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)}. \tag{2}

Das ist die Dichtematrix, die wir durch Normierung von

\operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)

durch Division durch ihre Spur erhalten. (Formal ist der Zustand $\sigma_a$ nur definiert, wenn die Wahrscheinlichkeit $p(a)$ von null verschieden ist; wenn $p(a) = 0$ , ist dieser Zustand irrelevant, da er auf ein diskretes Ereignis mit Wahrscheinlichkeit null verweist.)

Natürlich sind die Ergebniswahrscheinlichkeiten konsistent mit unseren bisherigen Beobachtungen.

Zusammenfassend ergibt sich folgendes, wenn die Messung $\{P_0,\ldots,P_{m-1}\}$ an $\mathsf{X}$ durchgeführt wird, während $(\mathsf{X},\mathsf{Z})$ im Zustand $\rho$ ist:

Jedes Ergebnis $a$ tritt mit Wahrscheinlichkeit $p(a) = \operatorname{Tr}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)$ auf.
Bedingt auf Ergebnis $a$ ist der Zustand von $\mathsf{Z}$ durch die Dichtematrix $\sigma_a$ aus Gleichung $(2)$ gegeben, die durch Normierung von $\operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)$ erhalten wird.

Verallgemeinerung

Diese Beschreibung lässt sich auf andere Situationen anpassen, etwa wenn die Reihenfolge der Systeme umgekehrt ist oder wenn es drei oder mehr Systeme gibt. Konzeptuell ist dies unkompliziert, auch wenn die Formeln umständlich werden können.

Im Allgemeinen gilt: Haben wir $r$ Systeme $\mathsf{X}_1,\ldots,\mathsf{X}_r$ , ist der Zustand des zusammengesetzten Systems $(\mathsf{X}_1,\ldots,\mathsf{X}_r)$ gleich $\rho$ , und wird die Messung $\{P_0,\ldots,P_{m-1}\}$ an $\mathsf{X}_k$ durchgeführt, so gilt Folgendes.

Jedes Ergebnis $a$ tritt mit Wahrscheinlichkeit
$p(a) = \operatorname{Tr}\bigl((\mathbb{I}_{\mathsf{X}_1}\otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_{k-1}} \otimes P_a \otimes \mathbb{I}_{\mathsf{X}_{k+1}} \otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_r}) \rho\bigr).$
auf.
Bedingt auf Ergebnis $a$ ist der Zustand von $(\mathsf{X}_1,\ldots,\mathsf{X}_{k-1},\mathsf{X}_{k+1},\ldots,\mathsf{X}_r)$ durch folgende Dichtematrix gegeben:
$\frac{\operatorname{Tr}_{\mathsf{X}_k}\bigl((\mathbb{I}_{\mathsf{X}_1}\otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_{k-1}} \otimes P_a \otimes \mathbb{I}_{\mathsf{X}_{k+1}} \otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_r}) \rho\bigr)}{\operatorname{Tr}\bigl((\mathbb{I}_{\mathsf{X}_1}\otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_{k-1}} \otimes P_a \otimes \mathbb{I}_{\mathsf{X}_{k+1}} \otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_r}) \rho\bigr)}$

Messungen als Sammlungen von Matrizen​

Projektive Messungen​

Allgemeine Messungen​

Beispiel 1: Jede projektive Messung​

Beispiel 2: Eine nicht-projektive Qubit-Messung​

Beispiel 3: Tetraedermessung​

Messungen als Kanäle​

Äquivalenz der Formulierungen​

Von Kanälen zu Matrizen​

Von Matrizen zu Kanälen​

Partielle Messungen​

Ergebniswahrscheinlichkeiten​

Zustände bedingt auf Messergebnisse​

Verallgemeinerung​