Pauli-Operationen und Observablen

Pauli-Matrizen spielen eine zentrale Rolle im Stabilisatorformalismus. Wir beginnen die Lektion mit einer Diskussion der Pauli-Matrizen, einschließlich einiger ihrer grundlegenden algebraischen Eigenschaften, und wir werden auch besprechen, wie Pauli-Matrizen (und Tensorprodukte von Pauli-Matrizen) Messungen beschreiben können.

Grundlagen der Pauli-Operationen

Hier sind die Pauli-Matrizen, einschließlich der $2\times 2$ -Identitätsmatrix und der drei nicht-identischen Pauli-Matrizen.

\mathbb{I} = \begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix} \qquad X = \begin{pmatrix} 0 & 1\\ 1 & 0 \end{pmatrix} \qquad Y = \begin{pmatrix} 0 & -i\\ i & 0 \end{pmatrix} \qquad Z = \begin{pmatrix} 1 & 0\\ 0 & -1 \end{pmatrix}

Eigenschaften der Pauli-Matrizen

Alle vier Pauli-Matrizen sind sowohl unitär als auch hermitesch. Früher in der Reihe wurden die Namen $\sigma_x,$ $\sigma_y,$ und $\sigma_z$ für die nicht-identischen Pauli-Matrizen verwendet, aber es ist konventionell, im Kontext der Fehlerkorrektur stattdessen die Großbuchstaben $X,$ $Y,$ und $Z$ zu verwenden. Diese Konvention wurde in der vorherigen Lektion eingeführt und wir werden sie für die verbleibenden Lektionen beibehalten.

Verschiedene nicht-identische Pauli-Matrizen antikommutieren miteinander.

XY = -YX \qquad XZ = -ZX \qquad YZ = -ZY

Diese Antikommutationsrelationen sind einfach und lassen sich leicht durch Durchführen der Multiplikationen verifizieren, aber sie sind von entscheidender Bedeutung – im Stabilisatorformalismus und anderswo. Wie wir sehen werden, entsprechen die Minuszeichen, die entstehen, wenn die Reihenfolge zweier verschiedener nicht-identischer Pauli-Matrizen in einem Matrizenprodukt umgekehrt wird, genau der Erkennung von Fehlern im Stabilisatorformalismus.

Wir haben auch die hier aufgelisteten Multiplikationsregeln.

XX = YY = ZZ = \mathbb{I} \qquad XY = iZ \qquad YZ = iX \qquad ZX = iY

Das heißt: Jede Pauli-Matrix ist ihre eigene Inverse (was für jede Matrix gilt, die sowohl unitär als auch hermitesch ist), und das Multiplizieren zweier verschiedener nicht-identischer Pauli-Matrizen ist immer $\pm i$ mal die verbleibende nicht-identische Pauli-Matrix. Insbesondere ist $Y$ bis auf einen Phasenfaktor äquivalent zu $X Z$ , was unseren Fokus auf $X$ - und $Z$ -Fehler und die scheinbare Vernachlässigung von $Y$ -Fehlern bei der Quantenfehlerkorrektur erklärt; $X$ stellt einen Bit-Flip dar, $Z$ stellt einen Phasen-Flip dar, und so stellt $Y$ (bis auf einen globalen Phasenfaktor) beide dieser Fehler dar, die gleichzeitig auf demselben Qubit auftreten.

Pauli-Operationen auf mehreren Qubits

Die vier Pauli-Matrizen stellen alle Operationen (die Fehler sein könnten) auf einem einzelnen Qubit dar – und durch deren Tensorierung erhalten wir Operationen auf mehreren Qubits. Als terminologischer Hinweis: Wenn wir von einer n-Qubit-Pauli-Operation sprechen, meinen wir ein Tensorprodukt beliebiger $n$ Pauli-Matrizen, wie die hier gezeigten Beispiele für $n=9$ .

\begin{gathered} \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \\[1mm] X \otimes X \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \\[1mm] X \otimes Y \otimes Z \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes X \otimes Y \otimes Z \end{gathered}

Oft bezieht sich der Begriff Pauli-Operation auf ein Tensorprodukt von Pauli-Matrizen zusammen mit einem Phasenfaktor, oder manchmal nur auf bestimmte Phasenfaktoren wie $\pm 1$ und $\pm i$ . Es gibt gute mathematische Gründe, solche Phasenfaktoren zuzulassen – aber um die Dinge so einfach wie möglich zu halten, verwenden wir den Begriff Pauli-Operation in diesem Kurs, um auf ein Tensorprodukt von Pauli-Matrizen ohne die Möglichkeit eines Phasenfaktors verschieden von 1 zu verweisen.

Das Gewicht einer $n$ -Qubit-Pauli-Operation ist die Anzahl der nicht-identischen Pauli-Matrizen im Tensorprodukt. Das erste obige Beispiel hat zum Beispiel Gewicht $0$ , das zweite Gewicht $2$ und das dritte Gewicht $6$ . Intuitiv ist das Gewicht einer $n$ -Qubit-Pauli-Operation die Anzahl der Qubits, auf denen sie nicht-trivial wirkt. Typischerweise werden quantenfehlerkorrigierende Codes so entworfen, dass sie Fehler erkennen und korrigieren können, die durch Pauli-Operationen dargestellt werden, solange deren Gewicht nicht zu hoch ist.

Pauli-Operationen als Erzeuger

Es ist manchmal nützlich, Kollektionen von Pauli-Operationen als Erzeuger von Mengen (genauer gesagt, Gruppen) von Operationen im algebraischen Sinne zu betrachten, den du vielleicht kennst, wenn du mit Gruppentheorie vertraut bist. Wenn du nicht mit Gruppentheorie vertraut bist, ist das in Ordnung – sie ist für die Lektion nicht unbedingt erforderlich. Grundkenntnisse der Gruppentheorie sind jedoch für diejenigen sehr empfehlenswert, die die Quantenfehlerkorrektur eingehender erkunden möchten.

Seien $P_1, \ldots, P_r$ $n$ -Qubit-Pauli-Operationen. Wenn wir von der erzeugten Menge von $P_1, \ldots, P_r$ sprechen, meinen wir die Menge aller Matrizen, die durch Multiplikation dieser Matrizen erhalten werden können, in beliebiger Kombination und Reihenfolge, wobei jede so oft wie gewünscht genommen werden kann. Die Notation für diese Menge ist $\langle P_1, \ldots, P_r \rangle.$

Zum Beispiel ist die von den drei nicht-identischen Pauli-Matrizen erzeugte Menge wie folgt.

\langle X, Y, Z \rangle = \bigl\{\alpha P\,:\,\alpha\in\{1,i,-1,-i\},\; P\in\{\mathbb{I},X,Y,Z\} \bigr\}

Das kann durch die zuvor aufgelisteten Multiplikationsregeln begründet werden. Es gibt 16 verschiedene Matrizen in dieser Menge, die gemeinhin als die Pauli-Gruppe bezeichnet wird.

Als zweites Beispiel, wenn wir $Y$ entfernen, erhalten wir die Hälfte der Pauli-Gruppe.

\langle X, Z\rangle = \{ \mathbb{I}, X, Z, -iY, -\mathbb{I}, -X, -Z, iY \}

Hier ist ein letztes Beispiel (vorerst), diesmal mit $n=2$ .

\langle X \otimes X, Z \otimes Z\rangle = \{ \mathbb{I}\otimes\mathbb{I}, X\otimes X, Z\otimes Z, -Y\otimes Y \}

In diesem Fall erhalten wir nur vier Elemente, da $X\otimes X$ und $Z\otimes Z$ kommutieren:

\begin{aligned} (X\otimes X)(Z\otimes Z) & = (XZ) \otimes (XZ)\\ & = (-ZX)\otimes (-ZX)\\ & = (ZX)\otimes (ZX)\\ & = (Z\otimes Z)(X\otimes X). \end{aligned}

Pauli-Observablen

Pauli-Matrizen und $n$ -Qubit-Pauli-Operationen im Allgemeinen sind unitär und beschreiben daher unitäre Operationen auf Qubits. Aber sie sind auch hermitesche Matrizen, und aus diesem Grund beschreiben sie auch Messungen, wie jetzt erläutert wird.

Hermitesche Matrizen als Observablen

Betrachte zunächst eine beliebige hermitesche Matrix $A$ . Wenn wir $A$ als Observable bezeichnen, verbinden wir damit eine bestimmte eindeutig definierte projektive Messung. Die möglichen Ergebnisse sind die verschiedenen Eigenwerte von $A$ , und die Projektionen, die die Messung definieren, sind diejenigen, die auf die Räume projizieren, die von den entsprechenden Eigenvektoren von $A$ aufgespannt werden. Die Ergebnisse einer solchen Messung sind daher reelle Zahlen – aber da Matrizen nur endlich viele Eigenwerte haben, gibt es für eine gegebene Wahl von $A$ nur endlich viele verschiedene Messergebnisse.

Genauer gesagt: Nach dem Spektralsatz ist es möglich, zu schreiben

A = \sum_{k = 1}^m \lambda_k \Pi_k

für verschiedene reelle Eigenwerte $\lambda_1,\ldots,\lambda_m$ und Projektionen $\Pi_1,\ldots,\Pi_m$ mit

\Pi_1 + \cdots + \Pi_m = \mathbb{I}.

Ein solcher Ausdruck einer Matrix ist bis auf die Reihenfolge der Eigenwerte eindeutig. Alternativ: Wenn wir darauf bestehen, dass die Eigenwerte in absteigender Reihenfolge $\lambda_1 > \lambda_2 > \cdots > \lambda_m$ geordnet sind, gibt es nur eine Möglichkeit, $A$ in der obigen Form zu schreiben.

Auf der Grundlage dieses Ausdrucks ist die Messung, die wir mit der Observablen $A$ verbinden, die durch die Projektionen $\Pi_1,\ldots,\Pi_m$ beschriebene projektive Messung, wobei die Eigenwerte $\lambda_1,\ldots,\lambda_m$ als Messergebnisse verstanden werden, die diesen Projektionen entsprechen.

Messungen aus Pauli-Operationen

Schauen wir uns an, wie Messungen der gerade beschriebenen Art für Pauli-Operationen aussehen – beginnend mit den drei nicht-identischen Pauli-Matrizen. Diese Matrizen haben Spektralzerlegungen wie folgt.

\begin{gathered} X = \vert {+} \rangle\langle {+} \vert - \vert {-} \rangle\langle {-} \vert\\ Y = \vert {+i} \rangle\langle {+i} \vert - \vert {-i} \rangle\langle {-i} \vert\\ Z = \vert {0} \rangle\langle {0} \vert - \vert {1} \rangle\langle {1} \vert \end{gathered}

Die durch $X,$ $Y$ und $Z$ als Observablen definierten Messungen sind daher die projektiven Messungen, die durch die folgenden Mengen von Projektionen definiert werden.

\begin{gathered} \bigl\{\vert {+} \rangle\langle {+} \vert, \vert {-} \rangle\langle {-} \vert \bigr\} \\ \bigl\{\vert {+i} \rangle\langle {+i} \vert, \vert {-i} \rangle\langle {-i} \vert\bigr\} \\ \bigl\{\vert {0} \rangle\langle {0} \vert, \vert {1} \rangle\langle {1} \vert\bigr\} \end{gathered}

In allen drei Fällen sind die zwei möglichen Messergebnisse die Eigenwerte $+1$ und $-1$ . Solche Messungen werden üblicherweise als $X$ -Messungen, $Y$ -Messungen und $Z$ -Messungen bezeichnet. Wir sind diesen Messungen in der Lektion „Allgemeine Messungen" des Kurses „Allgemeine Formulierung der Quanteninformation" begegnet, wo sie im Kontext der Quantenzustandstomographie auftraten.

Natürlich ist eine $Z$ -Messung im Wesentlichen nur eine Standardbasismessung und eine $X$ -Messung eine Messung bezüglich der Plus-/Minus-Basis eines Qubits – aber wie diese Messungen hier beschrieben werden, nehmen wir die Eigenwerte $+1$ und $-1$ als die eigentlichen Messergebnisse.

Dasselbe Verfahren kann für Pauli-Operationen auf $n\geq 2$ Qubits angewendet werden, wobei jedoch betont werden muss, dass es auch dann nur zwei mögliche Ergebnisse für die auf diese Weise beschriebenen Messungen gibt: $+1$ und $-1$ , die einzigen möglichen Eigenwerte von Pauli-Operationen. Die zwei entsprechenden Projektionen haben in diesem Fall daher einen Rang größer als eins. Genauer gesagt: Bei jeder nicht-identischen $n$ -Qubit-Pauli-Operation teilt sich der $2^n$ -dimensionale Zustandsraum immer in zwei Eigenvektorteilräume gleicher Dimension auf, sodass die beiden Projektionen, die die entsprechende Messung definieren, beide den Rang $2^{n-1}$ haben.

Die durch eine $n$ -Qubit-Pauli-Operation als Observable beschriebene Messung ist daher nicht dasselbe wie eine Messung bezüglich einer Orthonormalbasis von Eigenvektoren dieser Operation, noch ist sie dasselbe wie das unabhängige Messen jeder der entsprechenden Pauli-Matrizen unabhängig als Observablen auf $n$ Qubits. Beide Alternativen würden $2^n$ mögliche Messergebnisse erfordern, aber hier haben wir nur die zwei möglichen Ergebnisse $+1$ und $-1$ .

Betrachten wir zum Beispiel die 2-Qubit-Pauli-Operation $Z\otimes Z$ als Observable. Wir können effektiv das Tensorprodukt der Spektralzerlegungen nehmen, um eine für das Tensorprodukt zu erhalten.

\begin{aligned} Z\otimes Z & = (\vert 0\rangle\langle 0\vert - \vert 1\rangle\langle 1\vert) \otimes (\vert 0\rangle\langle 0\vert - \vert 1\rangle\langle 1\vert)\\ & = \bigl( \vert 00\rangle\langle 00\vert + \vert 11\rangle\langle 11\vert \bigr) - \bigl( \vert 01\rangle\langle 01\vert + \vert 10\rangle\langle 10\vert \bigr) \end{aligned}

Das heißt, wir haben $Z\otimes Z = \Pi_0 - \Pi_1$ für

\Pi_0 = \vert 00\rangle\langle 00\vert + \vert 11\rangle\langle 11\vert \quad\text{und}\quad \Pi_1 = \vert 01\rangle\langle 01\vert + \vert 10\rangle\langle 10\vert,

und das sind die zwei Projektionen, die die Messung definieren. Wenn wir beispielsweise einen $\vert\phi^+\rangle$ -Bell-Zustand zerstörungsfrei mit dieser Messung messen würden, wären wir sicher, das Ergebnis $+1$ zu erhalten, und der Zustand würde durch die Messung unverändert bleiben. Insbesondere würde der Zustand nicht auf $\vert 00\rangle$ oder $\vert 11\rangle$ kollabieren.

Zerstörungsfreie Implementierung durch Phasenschätzung

Für jede $n$ -Qubit-Pauli-Operation können wir die mit dieser Observablen verbundene Messung zerstörungsfrei mithilfe von Phasenschätzung durchführen.

Hier ist ein auf Phasenschätzung basierender Schaltkreis, der für jede Pauli-Matrix $P$ funktioniert, wobei die Messung auf dem oberen Qubit durchgeführt wird. Die Ergebnisse $0$ und $1$ der Standardbasismessung im Schaltkreis entsprechen den Eigenwerten $+1$ und $-1$ , genau wie wir es normalerweise bei Phasenschätzung mit einem Kontroll-Qubit haben. (Man beachte, dass das Kontroll-Qubit in diesem Diagramm unten liegt, während in der Lektion „Phasenschätzung und Faktorisierung" des Kurses „Grundlagen der Quantenalgorithmen" die Kontroll-Qubits oben gezeichnet wurden.)

Schaltkreis zur Messung einer Pauli-Observablen mittels Phasenschätzung

Eine ähnliche Methode funktioniert für Pauli-Operationen auf mehreren Qubits. Das folgende Schaltkreisdiagramm zeigt zum Beispiel eine zerstörungsfreie Messung der $3$ -Qubit-Pauli-Observablen $P_2\otimes P_1\otimes P_0$ für jede Wahl von $P_0,P_1,P_2 \in \{X,Y,Z\}$ .

Schaltkreis zur Messung einer 3-Qubit-Pauli-Observablen mittels Phasenschätzung

Dieser Ansatz verallgemeinert sich auf natürliche Weise auf $n$ -Qubit-Pauli-Observablen für beliebiges $n$ . Natürlich müssen bei der Implementierung solcher Messungen mit diesem Ansatz nur kontrollierte unitäre Gates für nicht-identische Tensorfaktoren von Pauli-Observablen aufgenommen werden; kontrollierte Identitätsgates sind einfach Identitätsgates und können daher weggelassen werden. Das bedeutet, dass Pauli-Observablen mit niedrigerem Gewicht kleinere Schaltkreise für die Implementierung durch diesen Ansatz benötigen.

Man beachte, dass diese Phasenschätzungsschaltkreise unabhängig von $n$ nur ein einziges Kontroll-Qubit haben, was damit übereinstimmt, dass für diese Messungen nur zwei mögliche Messergebnisse gibt. Die Verwendung von mehr Kontroll-Qubits würde keine zusätzlichen Informationen liefern, da diese Messungen mit einem einzigen Kontroll-Qubit bereits perfekt sind. (Eine Möglichkeit, das einzusehen, ergibt sich direkt aus dem allgemeinen Verfahren der Phasenschätzung: die Annahme $U^2 = \mathbb{I}$ macht jedes weitere Kontroll-Qubit über das erste hinaus nutzlos.)

Hier ist ein spezifisches Beispiel einer zerstörungsfreien Implementierung einer $Z\otimes Z$ -Messung, die für die Beschreibung des 3-Bit-Wiederholungscodes als Stabilisator-Code relevant ist, die wir gleich sehen werden.

Schaltkreis zur Messung einer ZZ-Observablen mittels Phasenschätzung

In diesem Fall und für Tensorprodukte von mehr als zwei $Z$ -Observablen im Allgemeinen kann der Schaltkreis vereinfacht werden.

Vereinfachter Schaltkreis zur Messung einer ZZ-Observablen

Diese Messung entspricht also dem zerstörungsfreien Messen der Parität (oder des XOR) der Standardbasiszustände zweier Qubits.

Grundlagen der Pauli-Operationen​

Eigenschaften der Pauli-Matrizen​

Pauli-Operationen auf mehreren Qubits​

Pauli-Operationen als Erzeuger​

Pauli-Observablen​

Hermitesche Matrizen als Observablen​

Messungen aus Pauli-Operationen​

Zerstörungsfreie Implementierung durch Phasenschätzung​