Zum Hauptinhalt springen

Mathematische Formulierungen von Messungen

Die Lektion beginnt mit zwei äquivalenten mathematischen Beschreibungen von Messungen:

  1. Allgemeine Messungen können durch Sammlungen von Matrizen beschrieben werden – eine für jedes Messergebnis –, die die Beschreibung projektiver Messungen verallgemeinern.
  2. Allgemeine Messungen können als Kanäle beschrieben werden, deren Ausgaben stets klassische Zustände sind (dargestellt durch Diagonaldichtematrizen).

Wir beschränken unsere Betrachtung auf Messungen mit endlich vielen möglichen Ergebnissen. Zwar ist es möglich, Messungen mit unendlich vielen möglichen Ergebnissen zu definieren, doch treten diese im Kontext von Berechnung und Informationsverarbeitung weit seltener auf; zudem erfordern sie zusätzliche Mathematik (nämlich Maßtheorie), um sie ordnungsgemäß zu formalisieren.

Zunächst konzentrieren wir uns auf sogenannte destruktive Messungen, bei denen das Messergebnis allein der klassische Messwert ist – ohne Angabe des Post-Messzustands des gemessenen Systems. Anschaulich kann man sich vorstellen, dass eine solche Messung das Quantensystem selbst zerstört oder dass das System unmittelbar nach der Messung verworfen wird. Im weiteren Verlauf der Lektion erweitern wir unsere Betrachtung auf nicht-destruktive Messungen, bei denen es sowohl ein klassisches Messergebnis als auch einen Post-Messzustand des gemessenen Systems gibt.

Messungen als Sammlungen von Matrizen

Sei X\mathsf{X} ein zu messendes System, und nehme der Einfachheit halber an, dass die klassische Zustandsmenge von X\mathsf{X} gleich {0,,n1}\{0,\ldots, n-1\} für eine positive ganze Zahl nn ist, sodass Dichtematrizen, die Quantenzustände von X\mathsf{X} beschreiben, n×nn\times n-Matrizen sind. Wir werden nur selten auf die klassischen Zustände von X\mathsf{X} verweisen müssen, aber es ist praktisch, auf nn, die Anzahl der klassischen Zustände von X\mathsf{X}, Bezug zu nehmen. Wir nehmen außerdem an, dass die möglichen Ergebnisse der Messung die ganzen Zahlen 0,,m10,\ldots,m-1 für eine positive ganze Zahl mm sind.

Diese Namen dienen lediglich der Vereinfachung; alles Folgende lässt sich problemlos auf andere endliche Mengen von klassischen Zuständen und Messergebnissen verallgemeinern, indem man sie entsprechend umbenennt.

Projektive Messungen

Eine projektive Messung wird durch eine Sammlung von Projektionsmatrizen beschrieben, die zur Identitätsmatrix summieren. In Symbolen:

{Π0,,Πm1}\{\Pi_0,\ldots,\Pi_{m-1}\}

beschreibt eine projektive Messung von X\mathsf{X}, falls jedes Πa\Pi_a eine n×nn\times n-Projektionsmatrix ist und die folgende Bedingung erfüllt ist.

Π0++Πm1=IX\Pi_0 + \cdots + \Pi_{m-1} = \mathbb{I}_{\mathsf{X}}

Wird eine solche Messung an einem System X\mathsf{X} durchgeführt, das sich im Zustand ψ\vert\psi\rangle befindet, so tritt jedes Ergebnis aa mit Wahrscheinlichkeit Πaψ2\|\Pi_a\vert\psi\rangle\|^2 auf. Der Post-Messzustand von X\mathsf{X} ergibt sich durch Normierung des Vektors Πaψ\Pi_a\vert\psi\rangle, den wir hier jedoch noch ignorieren.

Wird der Zustand von X\mathsf{X} statt durch einen Quantenzustandsvektor ψ\vert\psi\rangle durch eine Dichtematrix ρ\rho beschrieben, lässt sich die Wahrscheinlichkeit für Ergebnis aa alternativ als Tr(Πaρ)\operatorname{Tr}(\Pi_a \rho) ausdrücken.

Ist ρ=ψψ\rho = \vert \psi\rangle\langle\psi\vert ein reiner Zustand, so sind die beiden Ausdrücke gleich:

Tr(Πaρ)=Tr(Πaψψ)=ψΠaψ=ψΠaΠaψ=Πaψ2.\operatorname{Tr}(\Pi_a \rho) = \operatorname{Tr}(\Pi_a \vert \psi\rangle\langle\psi \vert) = \langle \psi \vert \Pi_a \vert \psi \rangle = \langle \psi \vert \Pi_a \Pi_a \vert \psi \rangle = \|\Pi_a\vert\psi\rangle\|^2.

Hier verwenden wir für die zweite Gleichheit die zyklische Eigenschaft der Spur und für die dritte Gleichheit die Tatsache, dass jedes Πa\Pi_a eine Projektionsmatrix ist und daher Πa2=Πa\Pi_a^2 = \Pi_a erfüllt.

Ist ρ\rho im Allgemeinen eine Konvexkombination

ρ=k=0N1pkψkψk\rho = \sum_{k = 0}^{N-1} p_k \vert \psi_k\rangle\langle \psi_k \vert

von reinen Zuständen, so stimmt der Ausdruck Tr(Πaρ)\operatorname{Tr}(\Pi_a \rho) mit der mittleren Wahrscheinlichkeit für Ergebnis aa überein, da dieser Ausdruck linear in ρ\rho ist.

Tr(Πaρ)=k=0N1pkTr(Πaψkψk)=k=0N1pkΠaψk2\operatorname{Tr}(\Pi_a \rho) = \sum_{k = 0}^{N-1} p_k \operatorname{Tr}(\Pi_a \vert \psi_k\rangle\langle\psi_k\vert) = \sum_{k = 0}^{N-1} p_k \|\Pi_a\vert\psi_k\rangle\|^2

Allgemeine Messungen

Eine mathematische Beschreibung allgemeiner Messungen erhält man durch Abschwächung der Definition projektiver Messungen. Konkret erlauben wir, dass die Matrizen in der die Messung beschreibenden Sammlung beliebige positiv semidefinite Matrizen statt Projektionen sein dürfen. (Projektionen sind stets positiv semidefinit; sie lassen sich alternativ als positiv semidefinite Matrizen mit Eigenwerten ausschließlich aus {0,1}\{0, 1\} definieren.)

Eine allgemeine Messung eines Systems X\mathsf{X} mit Ergebnissen 0,,m10,\ldots,m-1 wird also durch eine Sammlung positiv semidefiniter Matrizen {P0,,Pm1}\{P_0,\ldots,P_{m-1}\} festgelegt, deren Zeilen und Spalten den klassischen Zuständen von X\mathsf{X} entsprechen und die die Bedingung

P0++Pm1=IXP_0 + \cdots + P_{m-1} = \mathbb{I}_{\mathsf{X}}

erfüllen.

Wird das System X\mathsf{X} im Zustand ρ\rho gemessen, so tritt jedes Ergebnis a{0,,m1}a\in\{0,\ldots,m-1\} mit Wahrscheinlichkeit Tr(Paρ)\operatorname{Tr}(P_a \rho) auf.

Wie wir es natürlicherweise fordern müssen, bildet der Vektor der Ergebniswahrscheinlichkeiten

(Tr(P0ρ),,Tr(Pm1ρ))\bigl(\operatorname{Tr}(P_0 \rho),\ldots,\operatorname{Tr}(P_{m-1} \rho)\bigr)

einer allgemeinen Messung stets einen Wahrscheinlichkeitsvektor, für beliebige Dichtematrizen ρ\rho. Die folgenden zwei Beobachtungen zeigen, dass dies tatsächlich der Fall ist.

  1. Jeder Wert Tr(Paρ)\operatorname{Tr}(P_a \rho) ist nichtnegativ, da die Spur des Produkts zweier beliebiger positiv semidefiniter Matrizen stets nichtnegativ ist:

    Q,R0  Tr(QR)0.Q, R \geq 0 \; \Rightarrow \: \operatorname{Tr}(QR) \geq 0.

    Dies lässt sich beispielsweise mit Hilfe der Spektralzerlegungen von QQ und RR sowie der zyklischen Eigenschaft der Spur zeigen: Man drückt die Spur des Produkts QRQR als Summe nichtnegativer reeller Zahlen aus, die daher nichtnegativ sein muss.

  2. Die Bedingung P0++Pm1=IXP_0 + \cdots + P_{m-1} = \mathbb{I}_{\mathsf{X}} zusammen mit der Linearität der Spur stellt sicher, dass die Wahrscheinlichkeiten sich zu 11 summieren.

    a=0m1Tr(Paρ)=Tr(a=0m1Paρ)=Tr(Iρ)=Tr(ρ)=1\sum_{a = 0}^{m-1} \operatorname{Tr}(P_a \rho) = \operatorname{Tr}\Biggl(\sum_{a = 0}^{m-1} P_a \rho\Biggr) = \operatorname{Tr}(\mathbb{I}\rho) = \operatorname{Tr}(\rho) = 1

Beispiel 1: Jede projektive Messung

Projektionen sind stets positiv semidefinit, daher ist jede projektive Messung ein Beispiel einer allgemeinen Messung.

Eine Standardbasismessung eines Qubits kann etwa durch {P0,P1}\{P_0,P_1\} dargestellt werden, wobei

P0=00=(1000)undP1=11=(0001).P_0 = \vert 0\rangle\langle 0\vert = \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix} \quad\text{und}\quad P_1 = \vert 1\rangle\langle 1\vert = \begin{pmatrix} 0 & 0 \\ 0 & 1 \end{pmatrix}.

Die Messung eines Qubits im Zustand ρ\rho liefert folgende Ergebniswahrscheinlichkeiten.

Prob(outcome=0)=Tr(P0ρ)=Tr(00ρ)=0ρ0Prob(outcome=1)=Tr(P1ρ)=Tr(11ρ)=1ρ1\begin{aligned} \operatorname{Prob}(\text{outcome} = 0) & = \operatorname{Tr}(P_0 \rho) = \operatorname{Tr}\bigl(\vert 0\rangle\langle 0\vert \rho\bigr) = \langle 0\vert \rho \vert 0 \rangle \\[1mm] \operatorname{Prob}(\text{outcome} = 1) & = \operatorname{Tr}(P_1 \rho) = \operatorname{Tr}\bigl(\vert 1\rangle\langle 1\vert\rho\bigr) = \langle 1 \vert \rho \vert 1 \rangle \end{aligned}

Beispiel 2: Eine nicht-projektive Qubit-Messung

Sei X\mathsf{X} ein Qubit, und definiere zwei Matrizen wie folgt.

P0=(23131313)P1=(13131323)P_0 = \begin{pmatrix} \frac{2}{3} & \frac{1}{3}\\[2mm] \frac{1}{3} & \frac{1}{3} \end{pmatrix} \qquad P_1 = \begin{pmatrix} \frac{1}{3} & -\frac{1}{3}\\[2mm] -\frac{1}{3} & \frac{2}{3} \end{pmatrix}

Beide Matrizen sind positiv semidefinit: sie sind hermitesch, und ihre Eigenwerte sind in beiden Fällen 1/2±5/61/2 \pm \sqrt{5}/6, die beide positiv sind. Es gilt außerdem P0+P1=IP_0 + P_1 = \mathbb{I}, also beschreibt {P0,P1}\{P_0,P_1\} eine Messung.

Wird das System X\mathsf{X} im Zustand ρ\rho mit dieser Messung gemessen, so ist die Wahrscheinlichkeit für Ergebnis 00 gleich Tr(P0ρ)\operatorname{Tr}(P_0 \rho) und für Ergebnis 11 gleich Tr(P1ρ)\operatorname{Tr}(P_1 \rho). Ist zum Beispiel ρ=++\rho = \vert + \rangle \langle + \vert, ergeben sich folgende Wahrscheinlichkeiten für die Ergebnisse 00 und 11:

Tr(P0ρ)=Tr((23131313)(12121212))=(2312+1312)+(1312+1312)=12+13=56Tr(P1ρ)=Tr((13131323)(12121212))=(13121312)+(1312+2312)=0+16=16\begin{aligned} \operatorname{Tr}(P_0 \rho) & = \operatorname{Tr}\left( \begin{pmatrix} \frac{2}{3} & \frac{1}{3}\\[2mm] \frac{1}{3} & \frac{1}{3} \end{pmatrix} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} \right)\\[4mm] & = \biggl(\frac{2}{3} \cdot \frac{1}{2} + \frac{1}{3} \cdot \frac{1}{2}\biggr) + \biggl(\frac{1}{3}\cdot\frac{1}{2} + \frac{1}{3}\cdot\frac{1}{2}\biggr)\\ & = \frac{1}{2} + \frac{1}{3} = \frac{5}{6}\\[4mm] \operatorname{Tr}(P_1 \rho) & = \operatorname{Tr}\left( \begin{pmatrix} \frac{1}{3} & -\frac{1}{3}\\[2mm] -\frac{1}{3} & \frac{2}{3} \end{pmatrix} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} \right)\\[4mm] & = \biggl(\frac{1}{3} \cdot \frac{1}{2} - \frac{1}{3} \cdot \frac{1}{2}\biggr) + \biggl(-\frac{1}{3}\cdot\frac{1}{2} + \frac{2}{3}\cdot\frac{1}{2}\biggr)\\ & = 0 + \frac{1}{6} = \frac{1}{6} \end{aligned}

Beispiel 3: Tetraedermessung

Definiere vier Einzelqubit-Quantenzustandsvektoren wie folgt.

ϕ0=0ϕ1=130+231ϕ2=130+23e2πi/31ϕ3=130+23e2πi/31\begin{aligned} \vert\phi_0\rangle & = \vert 0 \rangle\\ \vert\phi_1\rangle & = \frac{1}{\sqrt{3}}\vert 0 \rangle + \sqrt{\frac{2}{3}} \vert 1\rangle \\ \vert\phi_2\rangle & = \frac{1}{\sqrt{3}}\vert 0 \rangle + \sqrt{\frac{2}{3}} e^{2\pi i/3} \vert 1\rangle \\ \vert\phi_3\rangle & = \frac{1}{\sqrt{3}}\vert 0 \rangle + \sqrt{\frac{2}{3}} e^{-2\pi i/3} \vert 1\rangle \end{aligned}

Diese vier Zustände werden manchmal als Tetraederzustände bezeichnet, da sie die Eckpunkte eines regulären Tetraeders bilden, das in die Bloch-Kugel einbeschrieben ist.

Illustration eines in die Bloch-Kugel einbeschriebenen Tetraeders

Die kartesischen Koordinaten dieser vier Zustände auf der Bloch-Kugel sind

(0,0,1),(223,0,13),(23,23,13),(23,23,13),(0,0,1),\\[2mm] \left( \frac{2\sqrt{2}}{3} , 0 , -\frac{1}{3} \right),\\[1mm] \left( -\frac{\sqrt{2}}{3} , \sqrt{\frac{2}{3}} , -\frac{1}{3} \right),\\[1mm] \left( -\frac{\sqrt{2}}{3} , -\sqrt{\frac{2}{3}} , -\frac{1}{3} \right),

was sich durch Ausdrücken der Dichtematrixdarstellungen dieser Zustände als Linearkombinationen von Pauli-Matrizen überprüfen lässt.

ϕ0ϕ0=(1000)=I+σz2\vert \phi_0 \rangle\langle \phi_0 \vert = \begin{pmatrix} 1 & 0\\[1mm] 0 & 0 \end{pmatrix} = \frac{\mathbb{I} + \sigma_z}{2} ϕ1ϕ1=(13232323)=I+223σx13σz2\vert \phi_1 \rangle\langle \phi_1 \vert = \begin{pmatrix} \frac{1}{3} & \frac{\sqrt{2}}{3} \\[2mm] \frac{\sqrt{2}}{3} & \frac{2}{3} \end{pmatrix} = \frac{\mathbb{I} + \frac{2\sqrt{2}}{3} \sigma_x - \frac{1}{3}\sigma_z}{2} ϕ2ϕ2=(13132i6132+i623)=I23σx+23σy13σz2\vert \phi_2 \rangle\langle \phi_2 \vert = \begin{pmatrix} \frac{1}{3} & -\frac{1}{3\sqrt{2}} - \frac{i}{\sqrt{6}} \\[2mm] -\frac{1}{3\sqrt{2}} + \frac{i}{\sqrt{6}} & \frac{2}{3} \end{pmatrix} = \frac{\mathbb{I} - \frac{\sqrt{2}}{3} \sigma_x + \sqrt{\frac{2}{3}} \sigma_y - \frac{1}{3}\sigma_z}{2} ϕ3ϕ3=(13132+i6132i623)=I23σx23σy13σz2\vert \phi_3 \rangle\langle \phi_3 \vert = \begin{pmatrix} \frac{1}{3} & -\frac{1}{3\sqrt{2}} + \frac{i}{\sqrt{6}} \\[2mm] -\frac{1}{3\sqrt{2}} - \frac{i}{\sqrt{6}} & \frac{2}{3} \end{pmatrix} = \frac{\mathbb{I} - \frac{\sqrt{2}}{3} \sigma_x - \sqrt{\frac{2}{3}} \sigma_y - \frac{1}{3}\sigma_z}{2}

Diese vier Zustände sind auf der Bloch-Kugel gleichmäßig verteilt: Jeder Zustand hat denselben Abstand zu den anderen drei, und die Winkel zwischen je zwei Zuständen sind stets gleich.

Nun definieren wir eine Messung {P0,P1,P2,P3}\{P_0,P_1,P_2,P_3\} eines Qubits, indem wir PaP_a für jedes a=0,,3a=0,\ldots,3 wie folgt setzen.

Pa=ϕaϕa2P_a = \frac{\vert\phi_a\rangle\langle\phi_a\vert}{2}

Dass dies eine gültige Messung ist, lässt sich folgendermaßen überprüfen.

  1. Jedes PaP_a ist offensichtlich positiv semidefinit, da es ein reiner Zustand dividiert durch zwei ist. Das heißt, jedes PaP_a ist eine hermitesche Matrix mit einem Eigenwert 1/21/2 und allen anderen Eigenwerten gleich null.
  2. Die Summe dieser Matrizen ist die Identitätsmatrix: P0+P1+P2+P3=IP_0 + P_1 + P_2 + P_3 = \mathbb{I}. Dies lässt sich leicht überprüfen, indem man die Darstellungen dieser Matrizen als Linearkombinationen von Pauli-Matrizen verwendet.

Messungen als Kanäle

Eine zweite Möglichkeit, Messungen mathematisch zu beschreiben, besteht darin, sie als Kanäle aufzufassen.

Klassische Information kann als Spezialfall quantenmechanischer Information betrachtet werden, indem man probabilistische Zustände mit diagonalen Dichtematrizen identifiziert. Operativ gesehen können wir Messungen daher als Kanäle verstehen, deren Eingaben Matrizen sind, die Zustände des gemessenen Systems beschreiben, und deren Ausgaben diagonale Dichtematrizen sind, die die resultierende Verteilung der Messergebnisse beschreiben.

Wir werden gleich sehen, dass sich jeder Kanal mit dieser Eigenschaft stets in einer einfachen, kanonischen Form schreiben lässt, die direkt mit der Beschreibung von Messungen als Sammlungen positiv semidefiniter Matrizen zusammenhängt. Umgekehrt gibt es zu jeder beliebigen Messung als Matrizensammlung stets einen gültigen Kanal mit der Diagonalausgabeeigenschaft, der die gegebene Messung gemäß dem vorherigen Absatz beschreibt. Aus diesen Beobachtungen folgt, dass die beiden Beschreibungen allgemeiner Messungen äquivalent sind.

Bevor wir fortfahren, wollen wir präziser sein: Was ist die Messung, wie fassen wir sie als Kanal auf, und welche Annahmen treffen wir?

Wie zuvor nehmen wir an, dass X\mathsf{X} das zu messende System ist und dass die möglichen Messergebnisse die ganzen Zahlen 0,,m10,\ldots,m-1 für eine positive ganze Zahl mm sind. Sei Y\mathsf{Y} das System, das die Messergebnisse speichert; seine klassische Zustandsmenge ist also {0,,m1}\{0,\ldots,m-1\}, und wir stellen die Messung als Kanal Φ\Phi von X\mathsf{X} nach Y\mathsf{Y} dar. Unsere Annahme ist, dass Y\mathsf{Y} klassisch ist – das heißt, unabhängig davon, in welchem Zustand X\mathsf{X} zu Beginn ist, ist der resultierende Zustand von Y\mathsf{Y} stets durch eine diagonale Dichtematrix dargestellt.

Wir können in mathematischen Begriffen ausdrücken, dass die Ausgabe von Φ\Phi stets diagonal ist, wie folgt. Definiere zunächst den vollständig dephasierenden Kanal Δm\Delta_m auf Y\mathsf{Y}.

Δm(σ)=a=0m1aσaaa\Delta_m(\sigma) = \sum_{a = 0}^{m-1} \langle a \vert \sigma \vert a\rangle \,\vert a\rangle\langle a\vert

Dieser Kanal ist analog zum vollständig dephasierenden Qubit-Kanal Δ\Delta aus der vorherigen Lektion. Als lineare Abbildung setzt er alle Außerdiagonaleinträge einer Eingabematrix auf null und lässt die Diagonale unverändert.

Eine einfache Möglichkeit auszudrücken, dass eine gegebene Dichtematrix σ\sigma diagonal ist, lautet: σ=Δm(σ)\sigma = \Delta_m(\sigma). Mit anderen Worten: Das Nullsetzen aller Außerdiagonaleinträge einer Dichtematrix hat genau dann keine Wirkung, wenn diese Einträge von vornherein alle null waren. Der Kanal Φ\Phi erfüllt unsere Annahme – dass Y\mathsf{Y} klassisch ist – genau dann, wenn

Φ(ρ)=Δm(Φ(ρ))\Phi(\rho) = \Delta_m(\Phi(\rho))

für jede Dichtematrix ρ\rho, die einen Zustand von X\mathsf{X} beschreibt.

Äquivalenz der Formulierungen

Von Kanälen zu Matrizen

Angenommen, wir haben einen Kanal von X\mathsf{X} nach Y\mathsf{Y} mit der Eigenschaft, dass

Φ(ρ)=Δm(Φ(ρ))\Phi(\rho) = \Delta_m(\Phi(\rho))

für jede Dichtematrix ρ\rho gilt. Dies lässt sich alternativ wie folgt ausdrücken.

Φ(ρ)=a=0m1aΦ(ρ)aaa(1)\Phi(\rho) = \sum_{a = 0}^{m-1} \langle a \vert \Phi(\rho) \vert a\rangle\, \vert a\rangle\langle a \vert \tag{1}

Wie jeden Kanal können wir Φ\Phi in Kraus-Form für eine geeignete Wahl von Kraus-Matrizen A0,,AN1A_0,\ldots,A_{N-1} schreiben.

Φ(ρ)=k=0N1AkρAk\Phi(\rho) = \sum_{k = 0}^{N-1} A_k \rho A_k^{\dagger}

Dies liefert uns einen alternativen Ausdruck für die Diagonaleinträge von Φ(ρ) ⁣:\Phi(\rho)\!:

aΦ(ρ)a=k=0N1aAkρAka=k=0N1Tr(AkaaAkρ)=Tr(Paρ)\begin{aligned} \langle a \vert \Phi(\rho) \vert a\rangle & = \sum_{k = 0}^{N-1} \langle a \vert A_k \rho A_k^{\dagger} \vert a\rangle \\ & = \sum_{k = 0}^{N-1} \operatorname{Tr}\bigl( A_k^{\dagger} \vert a\rangle\langle a \vert A_k \rho\bigr)\\ & = \operatorname{Tr}\bigl(P_a\rho\bigr) \end{aligned}

für

Pa=k=0N1AkaaAk.P_a = \sum_{k = 0}^{N-1} A_k^{\dagger} \vert a\rangle\langle a \vert A_k.

Für dieselben Matrizen P0,,Pm1P_0,\ldots,P_{m-1} lässt sich der Kanal Φ\Phi also wie folgt ausdrücken.

Φ(ρ)=a=0m1Tr(Paρ)aa\Phi(\rho) = \sum_{a = 0}^{m-1} \operatorname{Tr}(P_a \rho) \vert a\rangle\langle a\vert

Dieser Ausdruck stimmt mit unserer Beschreibung allgemeiner Messungen durch Matrizen überein: Jedes Messergebnis tritt mit Wahrscheinlichkeit Tr(Paρ)\operatorname{Tr}(P_a \rho) auf.

Nun stellen wir fest, dass die zwei Eigenschaften, die die Matrizensammlung {P0,,Pm1}\{P_0,\ldots,P_{m-1}\} für eine allgemeine Messung erfüllen muss, tatsächlich gegeben sind. Die erste Eigenschaft ist, dass alle Matrizen positiv semidefinit sind. Dies ergibt sich daraus, dass für jeden Vektor ψ\vert \psi\rangle mit Einträgen entsprechend den klassischen Zuständen von X\mathsf{X} gilt:

ψPaψ=k=0N1ψAkaaAkψ=k=0N1aAkψ20.\langle \psi \vert P_a \vert \psi\rangle = \sum_{k = 0}^{N-1} \langle \psi \vert A_k^{\dagger} \vert a\rangle\langle a \vert A_k\vert \psi\rangle = \sum_{k = 0}^{N-1} \bigl\vert\langle a \vert A_k\vert \psi\rangle\bigr\vert^2 \geq 0.

Die zweite Eigenschaft ist, dass die Summe dieser Matrizen die Identitätsmatrix ergibt.

a=0m1Pa=a=0m1k=0N1AkaaAk=k=0N1Ak(a=0m1aa)Ak=k=0N1AkAk=IX\begin{aligned} \sum_{a = 0}^{m-1} P_a & = \sum_{a = 0}^{m-1} \sum_{k = 0}^{N-1} A_k^{\dagger} \vert a\rangle\langle a \vert A_k \\ & = \sum_{k = 0}^{N-1} A_k^{\dagger} \Biggl(\sum_{a = 0}^{m-1} \vert a\rangle\langle a \vert\Biggr) A_k \\ & = \sum_{k = 0}^{N-1} A_k^{\dagger} A_k \\ & = \mathbb{I}_{\mathsf{X}} \end{aligned}

Die letzte Gleichheit folgt daraus, dass Φ\Phi ein Kanal ist und seine Kraus-Matrizen diese Bedingung erfüllen müssen.

Von Matrizen zu Kanälen

Nun überprüfen wir, dass für eine beliebige Sammlung {P0,,Pm1}\{P_0,\ldots,P_{m-1}\} positiv semidefiniter Matrizen, die P0++Pm1=IXP_0 + \cdots + P_{m-1} = \mathbb{I}_{\mathsf{X}} erfüllen, die durch

Φ(ρ)=a=0m1Tr(Paρ)aa\Phi(\rho) = \sum_{a = 0}^{m-1} \operatorname{Tr}(P_a \rho) \vert a \rangle\langle a\vert

definierte Abbildung tatsächlich ein gültiger Kanal von X\mathsf{X} nach Y\mathsf{Y} ist.

Eine Möglichkeit besteht darin, die Choi-Darstellung dieser Abbildung zu berechnen.

J(Φ)=b,c=0n1bcΦ(bc)=b,c=0n1a=0m1bcTr(Pabc)aa=b,c=0n1a=0m1bbPaTccaa=a=0m1PaTaa\begin{aligned} J(\Phi) & = \sum_{b,c = 0}^{n-1} \vert b \rangle \langle c \vert \otimes \Phi(\vert b \rangle \langle c \vert)\\[1mm] & = \sum_{b,c = 0}^{n-1} \sum_{a = 0}^{m-1} \vert b \rangle \langle c \vert \otimes \operatorname{Tr}(P_a \vert b \rangle \langle c \vert) \vert a \rangle\langle a\vert\\[1mm] & = \sum_{b,c = 0}^{n-1} \sum_{a = 0}^{m-1} \vert b \rangle \langle b \vert P_a^T \vert c \rangle \langle c \vert \otimes \vert a \rangle\langle a\vert\\[1mm] & = \sum_{a = 0}^{m-1} P_a^T \otimes \vert a \rangle\langle a\vert \end{aligned}

Die Transponierte jedes PaP_a tritt bei der dritten Gleichheit auf, weil

cPab=bPaTc.\langle c \vert P_a \vert b\rangle = \langle b \vert P_a^T \vert c\rangle.

Dies erlaubt, die Ausdrücke bb\vert b \rangle \langle b \vert und cc\vert c \rangle \langle c \vert erscheinen zu lassen, die sich beim Summieren über bb bzw. cc zur Identitätsmatrix vereinfachen.

Da P0,,Pm1P_0,\ldots,P_{m-1} nach Voraussetzung positiv semidefinit sind, gilt das auch für P0T,,Pm1TP_0^{T},\ldots,P_{m-1}^{T}. Insbesondere ergibt das Transponieren einer hermiteschen Matrix wieder eine hermitesche Matrix, und die Eigenwerte einer quadratischen Matrix und ihrer Transponierten stimmen stets überein. Daraus folgt, dass J(Φ)J(\Phi) positiv semidefinit ist. Das Ausspuren des Ausgabesystems Y\mathsf{Y} (das rechte System) ergibt

TrY(J(Φ))=a=0m1PaT=IXT=IX,\operatorname{Tr}_{\mathsf{Y}} (J(\Phi)) = \sum_{a = 0}^{m-1} P_a^T = \mathbb{I}_{\mathsf{X}}^T = \mathbb{I}_{\mathsf{X}},

und wir schließen, dass Φ\Phi ein Kanal ist.

Partielle Messungen

Angenommen, mehrere Systeme befinden sich zusammen in einem Quantenzustand, und es wird eine allgemeine Messung an einem der Systeme durchgeführt. Dies führt zu einem der Messergebnisse, das zufällig mit Wahrscheinlichkeiten gewählt wird, die durch die Messung und den Zustand des Systems vor der Messung bestimmt werden. Der resultierende Zustand der verbleibenden Systeme hängt dann im Allgemeinen davon ab, welches Messergebnis erzielt wurde.

Untersuchen wir, wie dies für ein Paar von Systemen (X,Z)(\mathsf{X},\mathsf{Z}) funktioniert, wenn das System X\mathsf{X} gemessen wird. (Wir nennen das rechte System Z\mathsf{Z}, weil wir Y\mathsf{Y} für das System reservieren, das die klassische Ausgabe der Messung darstellt, wenn wir sie als Kanal betrachten.) Anschließend lässt sich dies leicht auf den Fall verallgemeinern, in dem die Systeme vertauscht sind oder drei oder mehr Systeme vorhanden sind.

Der Zustand von (X,Z)(\mathsf{X},\mathsf{Z}) vor der Messung sei durch eine Dichtematrix ρ\rho beschrieben, die wir wie folgt schreiben können.

ρ=b,c=0n1bcρb,c\rho = \sum_{b,c = 0}^{n-1} \vert b\rangle\langle c\vert \otimes \rho_{b,c}

In diesem Ausdruck nehmen wir an, dass die klassischen Zustände von X\mathsf{X} gleich 0,,n10,\ldots,n-1 sind.

Wir nehmen an, dass die Messung durch die Matrizensammlung {P0,,Pm1}\{P_0,\ldots,P_{m-1}\} beschrieben wird. Diese Messung kann alternativ als Kanal Φ\Phi von X\mathsf{X} nach Y\mathsf{Y} beschrieben werden, wobei Y\mathsf{Y} ein neues System mit klassischer Zustandsmenge {0,,m1}\{0,\ldots,m-1\} ist. Die Wirkung dieses Kanals lässt sich konkret wie folgt ausdrücken.

Φ(ξ)=a=0m1Tr(Paξ)aa\Phi(\xi) = \sum_{a = 0}^{m-1} \operatorname{Tr}(P_a \xi)\, \vert a \rangle \langle a \vert

Ergebniswahrscheinlichkeiten

Da wir eine Messung des Systems X\mathsf{X} betrachten, können die Wahrscheinlichkeiten der verschiedenen Messergebnisse nur vom reduzierten Zustand ρX\rho_{\mathsf{X}} von X\mathsf{X} abhängen. Insbesondere lässt sich die Wahrscheinlichkeit für jedes Ergebnis a{0,,m1}a\in\{0,\ldots,m-1\} auf drei äquivalente Weisen ausdrücken.

Tr(PaρX)=Tr(PaTrZ(ρ))=Tr((PaIZ)ρ)\operatorname{Tr}\bigl( P_a \rho_{\mathsf{X}}\bigr) = \operatorname{Tr}\bigl( P_a \operatorname{Tr}_{\mathsf{Z}}(\rho)\bigr) = \operatorname{Tr}\bigl( (P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho \bigr)

Der erste Ausdruck stellt die Wahrscheinlichkeit für Ergebnis aa auf natürliche Weise dar, basierend auf dem, was wir bereits über Messungen an einem einzelnen System wissen. Der zweite Ausdruck folgt direkt aus der Definition ρX=TrZ(ρ)\rho_{\mathsf{X}} = \operatorname{Tr}_{\mathsf{Z}}(\rho).

Der dritte Ausdruck erfordert etwas mehr Nachdenken – und du bist eingeladen, dich selbst davon zu überzeugen, dass er wahr ist. Hier ein Hinweis: Die Äquivalenz von zweitem und drittem Ausdruck hängt nicht davon ab, ob ρ\rho eine Dichtematrix oder jedes PaP_a positiv semidefinit ist. Versuche zunächst, es für Tensorprodukte der Form ρ=MN\rho = M\otimes N zu zeigen, und schließe dann durch Linearität auf den allgemeinen Fall.

Obwohl die Äquivalenz von erstem und drittem Ausdruck nicht unmittelbar offensichtlich ist, ergibt sie sich plausibel. Ausgehend von einer Messung an X\mathsf{X} definieren wir effektiv eine Messung von (X,Z)(\mathsf{X},\mathsf{Z}), bei der wir Z\mathsf{Z} einfach verwerfen und X\mathsf{X} messen. Wie jede Messung lässt sich diese neue Messung durch eine Matrizensammlung beschreiben, und es ist nicht überraschend, dass diese Messung durch die Sammlung

{P0IZ,,Pm1IZ}\{P_0\otimes\mathbb{I}_{\mathsf{Z}}, \ldots, P_{m-1}\otimes\mathbb{I}_{\mathsf{Z}}\}

beschrieben wird.

Zustände bedingt auf Messergebnisse

Möchten wir nicht nur die Wahrscheinlichkeiten der verschiedenen Ergebnisse bestimmen, sondern auch den resultierenden Zustand von Z\mathsf{Z} bedingt auf jedes Messergebnis, können wir die Kanalbeschreibung der Messung heranziehen. Insbesondere betrachten wir den Zustand, den wir erhalten, wenn wir Φ\Phi auf X\mathsf{X} anwenden und Z\mathsf{Z} unverändert lassen.

(ΦIdZ)(ρ)=b,c=0n1Φ(bc)ρb,c=a=0m1b,c=0n1Tr(Pabc)aaρb,c=a=0m1aab,c=0n1Tr(Pabc)ρb,c=a=0m1aab,c=0n1TrX((PaIZ)(bcρb,c))=a=0m1aaTrX((PaIZ)ρ)\begin{aligned} (\Phi\otimes\operatorname{Id}_{\mathsf{Z}})(\rho) & = \sum_{b,c = 0}^{n-1} \Phi(\vert b\rangle\langle c\vert) \otimes \rho_{b,c}\\ & = \sum_{a = 0}^{m-1} \sum_{b,c = 0}^{n-1} \operatorname{Tr}(P_a \vert b\rangle\langle c\vert) \,\vert a\rangle \langle a \vert \otimes \rho_{b,c}\\ & = \sum_{a = 0}^{m-1} \vert a\rangle \langle a \vert \otimes \sum_{b,c = 0}^{n-1} \operatorname{Tr}(P_a \vert b\rangle\langle c\vert) \rho_{b,c}\\ & = \sum_{a = 0}^{m-1} \vert a\rangle \langle a \vert \otimes \sum_{b,c = 0}^{n-1} \operatorname{Tr}_{\mathsf{X}}\bigl((P_a\otimes\mathbb{I}_{\mathsf{Z}}) (\vert b\rangle\langle c\vert\otimes\rho_{b,c})\bigr)\\ & = \sum_{a = 0}^{m-1} \vert a\rangle \langle a \vert \otimes \operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho\bigr) \end{aligned}

Dies ist eine Dichtematrix, da Φ\Phi ein Kanal ist; jede Matrix TrX((PaIZ)ρ)\operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho) ist daher notwendigerweise positiv semidefinit.

Ein letzter Schritt formt diesen Ausdruck in eine Form um, die das Gesuchte offenbart.

a=0m1Tr((PaIZ)ρ)aaTrX((PaIZ)ρ)Tr((PaIZ)ρ)\sum_{a = 0}^{m-1} \operatorname{Tr}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)\, \vert a\rangle \langle a \vert \otimes \frac{\operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)}{\operatorname{Tr}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)}

Dies ist ein Beispiel eines klassisch-quantenmechanischen Zustands,

a=0m1p(a)aaσa,\sum_{a = 0}^{m-1} p(a)\, \vert a\rangle\langle a\vert \otimes \sigma_a,

wie wir ihn in der Lektion über Dichtematrizen kennengelernt haben. Für jedes Messergebnis a{0,,m1}a\in\{0,\ldots,m-1\} gilt: Mit Wahrscheinlichkeit

p(a)=Tr((PaIZ)ρ)p(a) = \operatorname{Tr}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)

befindet sich Y\mathsf{Y} im klassischen Zustand aa\vert a \rangle \langle a \vert und Z\mathsf{Z} im Zustand

σa=TrX((PaIZ)ρ)Tr((PaIZ)ρ).(2)\sigma_a = \frac{\operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)}{\operatorname{Tr}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)}. \tag{2}

Das ist die Dichtematrix, die wir durch Normierung von

TrX((PaIZ)ρ)\operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)

durch Division durch ihre Spur erhalten. (Formal ist der Zustand σa\sigma_a nur definiert, wenn die Wahrscheinlichkeit p(a)p(a) von null verschieden ist; wenn p(a)=0p(a) = 0, ist dieser Zustand irrelevant, da er auf ein diskretes Ereignis mit Wahrscheinlichkeit null verweist.)

Natürlich sind die Ergebniswahrscheinlichkeiten konsistent mit unseren bisherigen Beobachtungen.

Zusammenfassend ergibt sich folgendes, wenn die Messung {P0,,Pm1}\{P_0,\ldots,P_{m-1}\} an X\mathsf{X} durchgeführt wird, während (X,Z)(\mathsf{X},\mathsf{Z}) im Zustand ρ\rho ist:

  1. Jedes Ergebnis aa tritt mit Wahrscheinlichkeit p(a)=Tr((PaIZ)ρ)p(a) = \operatorname{Tr}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho) auf.
  2. Bedingt auf Ergebnis aa ist der Zustand von Z\mathsf{Z} durch die Dichtematrix σa\sigma_a aus Gleichung (2)(2) gegeben, die durch Normierung von TrX((PaIZ)ρ)\operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho) erhalten wird.

Verallgemeinerung

Diese Beschreibung lässt sich auf andere Situationen anpassen, etwa wenn die Reihenfolge der Systeme umgekehrt ist oder wenn es drei oder mehr Systeme gibt. Konzeptuell ist dies unkompliziert, auch wenn die Formeln umständlich werden können.

Im Allgemeinen gilt: Haben wir rr Systeme X1,,Xr\mathsf{X}_1,\ldots,\mathsf{X}_r, ist der Zustand des zusammengesetzten Systems (X1,,Xr)(\mathsf{X}_1,\ldots,\mathsf{X}_r) gleich ρ\rho, und wird die Messung {P0,,Pm1}\{P_0,\ldots,P_{m-1}\} an Xk\mathsf{X}_k durchgeführt, so gilt Folgendes.

  1. Jedes Ergebnis aa tritt mit Wahrscheinlichkeit

    p(a)=Tr((IX1IXk1PaIXk+1IXr)ρ).p(a) = \operatorname{Tr}\bigl((\mathbb{I}_{\mathsf{X}_1}\otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_{k-1}} \otimes P_a \otimes \mathbb{I}_{\mathsf{X}_{k+1}} \otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_r}) \rho\bigr).

    auf.

  2. Bedingt auf Ergebnis aa ist der Zustand von (X1,,Xk1,Xk+1,,Xr)(\mathsf{X}_1,\ldots,\mathsf{X}_{k-1},\mathsf{X}_{k+1},\ldots,\mathsf{X}_r) durch folgende Dichtematrix gegeben:

    TrXk((IX1IXk1PaIXk+1IXr)ρ)Tr((IX1IXk1PaIXk+1IXr)ρ)\frac{\operatorname{Tr}_{\mathsf{X}_k}\bigl((\mathbb{I}_{\mathsf{X}_1}\otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_{k-1}} \otimes P_a \otimes \mathbb{I}_{\mathsf{X}_{k+1}} \otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_r}) \rho\bigr)}{\operatorname{Tr}\bigl((\mathbb{I}_{\mathsf{X}_1}\otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_{k-1}} \otimes P_a \otimes \mathbb{I}_{\mathsf{X}_{k+1}} \otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_r}) \rho\bigr)}