Zum Hauptinhalt springen

Pauli-Operationen und Observablen

Pauli-Matrizen spielen eine zentrale Rolle im Stabilisatorformalismus. Wir beginnen die Lektion mit einer Diskussion der Pauli-Matrizen, einschließlich einiger ihrer grundlegenden algebraischen Eigenschaften, und wir werden auch besprechen, wie Pauli-Matrizen (und Tensorprodukte von Pauli-Matrizen) Messungen beschreiben können.

Grundlagen der Pauli-Operationen

Hier sind die Pauli-Matrizen, einschließlich der 2×22\times 2-Identitätsmatrix und der drei nicht-identischen Pauli-Matrizen.

I=(1001)X=(0110)Y=(0ii0)Z=(1001)\mathbb{I} = \begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix} \qquad X = \begin{pmatrix} 0 & 1\\ 1 & 0 \end{pmatrix} \qquad Y = \begin{pmatrix} 0 & -i\\ i & 0 \end{pmatrix} \qquad Z = \begin{pmatrix} 1 & 0\\ 0 & -1 \end{pmatrix}

Eigenschaften der Pauli-Matrizen

Alle vier Pauli-Matrizen sind sowohl unitär als auch hermitesch. Früher in der Reihe wurden die Namen σx,\sigma_x, σy,\sigma_y, und σz\sigma_z für die nicht-identischen Pauli-Matrizen verwendet, aber es ist konventionell, im Kontext der Fehlerkorrektur stattdessen die Großbuchstaben X,X, Y,Y, und ZZ zu verwenden. Diese Konvention wurde in der vorherigen Lektion eingeführt und wir werden sie für die verbleibenden Lektionen beibehalten.

Verschiedene nicht-identische Pauli-Matrizen antikommutieren miteinander.

XY=YXXZ=ZXYZ=ZYXY = -YX \qquad XZ = -ZX \qquad YZ = -ZY

Diese Antikommutationsrelationen sind einfach und lassen sich leicht durch Durchführen der Multiplikationen verifizieren, aber sie sind von entscheidender Bedeutung – im Stabilisatorformalismus und anderswo. Wie wir sehen werden, entsprechen die Minuszeichen, die entstehen, wenn die Reihenfolge zweier verschiedener nicht-identischer Pauli-Matrizen in einem Matrizenprodukt umgekehrt wird, genau der Erkennung von Fehlern im Stabilisatorformalismus.

Wir haben auch die hier aufgelisteten Multiplikationsregeln.

XX=YY=ZZ=IXY=iZYZ=iXZX=iYXX = YY = ZZ = \mathbb{I} \qquad XY = iZ \qquad YZ = iX \qquad ZX = iY

Das heißt: Jede Pauli-Matrix ist ihre eigene Inverse (was für jede Matrix gilt, die sowohl unitär als auch hermitesch ist), und das Multiplizieren zweier verschiedener nicht-identischer Pauli-Matrizen ist immer ±i\pm i mal die verbleibende nicht-identische Pauli-Matrix. Insbesondere ist YY bis auf einen Phasenfaktor äquivalent zu XZX Z, was unseren Fokus auf XX- und ZZ-Fehler und die scheinbare Vernachlässigung von YY-Fehlern bei der Quantenfehlerkorrektur erklärt; XX stellt einen Bit-Flip dar, ZZ stellt einen Phasen-Flip dar, und so stellt YY (bis auf einen globalen Phasenfaktor) beide dieser Fehler dar, die gleichzeitig auf demselben Qubit auftreten.

Pauli-Operationen auf mehreren Qubits

Die vier Pauli-Matrizen stellen alle Operationen (die Fehler sein könnten) auf einem einzelnen Qubit dar – und durch deren Tensorierung erhalten wir Operationen auf mehreren Qubits. Als terminologischer Hinweis: Wenn wir von einer n-Qubit-Pauli-Operation sprechen, meinen wir ein Tensorprodukt beliebiger nn Pauli-Matrizen, wie die hier gezeigten Beispiele für n=9n=9.

IIIIIIIIIXXIIIIIIIXYZIIIXYZ\begin{gathered} \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \\[1mm] X \otimes X \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \\[1mm] X \otimes Y \otimes Z \otimes \mathbb{I} \otimes \mathbb{I} \otimes \mathbb{I} \otimes X \otimes Y \otimes Z \end{gathered}

Oft bezieht sich der Begriff Pauli-Operation auf ein Tensorprodukt von Pauli-Matrizen zusammen mit einem Phasenfaktor, oder manchmal nur auf bestimmte Phasenfaktoren wie ±1\pm 1 und ±i\pm i. Es gibt gute mathematische Gründe, solche Phasenfaktoren zuzulassen – aber um die Dinge so einfach wie möglich zu halten, verwenden wir den Begriff Pauli-Operation in diesem Kurs, um auf ein Tensorprodukt von Pauli-Matrizen ohne die Möglichkeit eines Phasenfaktors verschieden von 1 zu verweisen.

Das Gewicht einer nn-Qubit-Pauli-Operation ist die Anzahl der nicht-identischen Pauli-Matrizen im Tensorprodukt. Das erste obige Beispiel hat zum Beispiel Gewicht 00, das zweite Gewicht 22 und das dritte Gewicht 66. Intuitiv ist das Gewicht einer nn-Qubit-Pauli-Operation die Anzahl der Qubits, auf denen sie nicht-trivial wirkt. Typischerweise werden quantenfehlerkorrigierende Codes so entworfen, dass sie Fehler erkennen und korrigieren können, die durch Pauli-Operationen dargestellt werden, solange deren Gewicht nicht zu hoch ist.

Pauli-Operationen als Erzeuger

Es ist manchmal nützlich, Kollektionen von Pauli-Operationen als Erzeuger von Mengen (genauer gesagt, Gruppen) von Operationen im algebraischen Sinne zu betrachten, den du vielleicht kennst, wenn du mit Gruppentheorie vertraut bist. Wenn du nicht mit Gruppentheorie vertraut bist, ist das in Ordnung – sie ist für die Lektion nicht unbedingt erforderlich. Grundkenntnisse der Gruppentheorie sind jedoch für diejenigen sehr empfehlenswert, die die Quantenfehlerkorrektur eingehender erkunden möchten.

Seien P1,,PrP_1, \ldots, P_r nn-Qubit-Pauli-Operationen. Wenn wir von der erzeugten Menge von P1,,PrP_1, \ldots, P_r sprechen, meinen wir die Menge aller Matrizen, die durch Multiplikation dieser Matrizen erhalten werden können, in beliebiger Kombination und Reihenfolge, wobei jede so oft wie gewünscht genommen werden kann. Die Notation für diese Menge ist P1,,Pr.\langle P_1, \ldots, P_r \rangle.

Zum Beispiel ist die von den drei nicht-identischen Pauli-Matrizen erzeugte Menge wie folgt.

X,Y,Z={αP:α{1,i,1,i},  P{I,X,Y,Z}}\langle X, Y, Z \rangle = \bigl\{\alpha P\,:\,\alpha\in\{1,i,-1,-i\},\; P\in\{\mathbb{I},X,Y,Z\} \bigr\}

Das kann durch die zuvor aufgelisteten Multiplikationsregeln begründet werden. Es gibt 16 verschiedene Matrizen in dieser Menge, die gemeinhin als die Pauli-Gruppe bezeichnet wird.

Als zweites Beispiel, wenn wir YY entfernen, erhalten wir die Hälfte der Pauli-Gruppe.

X,Z={I,X,Z,iY,I,X,Z,iY}\langle X, Z\rangle = \{ \mathbb{I}, X, Z, -iY, -\mathbb{I}, -X, -Z, iY \}

Hier ist ein letztes Beispiel (vorerst), diesmal mit n=2n=2.

XX,ZZ={II,XX,ZZ,YY}\langle X \otimes X, Z \otimes Z\rangle = \{ \mathbb{I}\otimes\mathbb{I}, X\otimes X, Z\otimes Z, -Y\otimes Y \}

In diesem Fall erhalten wir nur vier Elemente, da XXX\otimes X und ZZZ\otimes Z kommutieren:

(XX)(ZZ)=(XZ)(XZ)=(ZX)(ZX)=(ZX)(ZX)=(ZZ)(XX).\begin{aligned} (X\otimes X)(Z\otimes Z) & = (XZ) \otimes (XZ)\\ & = (-ZX)\otimes (-ZX)\\ & = (ZX)\otimes (ZX)\\ & = (Z\otimes Z)(X\otimes X). \end{aligned}

Pauli-Observablen

Pauli-Matrizen und nn-Qubit-Pauli-Operationen im Allgemeinen sind unitär und beschreiben daher unitäre Operationen auf Qubits. Aber sie sind auch hermitesche Matrizen, und aus diesem Grund beschreiben sie auch Messungen, wie jetzt erläutert wird.

Hermitesche Matrizen als Observablen

Betrachte zunächst eine beliebige hermitesche Matrix AA. Wenn wir AA als Observable bezeichnen, verbinden wir damit eine bestimmte eindeutig definierte projektive Messung. Die möglichen Ergebnisse sind die verschiedenen Eigenwerte von AA, und die Projektionen, die die Messung definieren, sind diejenigen, die auf die Räume projizieren, die von den entsprechenden Eigenvektoren von AA aufgespannt werden. Die Ergebnisse einer solchen Messung sind daher reelle Zahlen – aber da Matrizen nur endlich viele Eigenwerte haben, gibt es für eine gegebene Wahl von AA nur endlich viele verschiedene Messergebnisse.

Genauer gesagt: Nach dem Spektralsatz ist es möglich, zu schreiben

A=k=1mλkΠkA = \sum_{k = 1}^m \lambda_k \Pi_k

für verschiedene reelle Eigenwerte λ1,,λm\lambda_1,\ldots,\lambda_m und Projektionen Π1,,Πm\Pi_1,\ldots,\Pi_m mit

Π1++Πm=I.\Pi_1 + \cdots + \Pi_m = \mathbb{I}.

Ein solcher Ausdruck einer Matrix ist bis auf die Reihenfolge der Eigenwerte eindeutig. Alternativ: Wenn wir darauf bestehen, dass die Eigenwerte in absteigender Reihenfolge λ1>λ2>>λm\lambda_1 > \lambda_2 > \cdots > \lambda_m geordnet sind, gibt es nur eine Möglichkeit, AA in der obigen Form zu schreiben.

Auf der Grundlage dieses Ausdrucks ist die Messung, die wir mit der Observablen AA verbinden, die durch die Projektionen Π1,,Πm\Pi_1,\ldots,\Pi_m beschriebene projektive Messung, wobei die Eigenwerte λ1,,λm\lambda_1,\ldots,\lambda_m als Messergebnisse verstanden werden, die diesen Projektionen entsprechen.

Messungen aus Pauli-Operationen

Schauen wir uns an, wie Messungen der gerade beschriebenen Art für Pauli-Operationen aussehen – beginnend mit den drei nicht-identischen Pauli-Matrizen. Diese Matrizen haben Spektralzerlegungen wie folgt.

X=++Y=+i+iiiZ=0011\begin{gathered} X = \vert {+} \rangle\langle {+} \vert - \vert {-} \rangle\langle {-} \vert\\ Y = \vert {+i} \rangle\langle {+i} \vert - \vert {-i} \rangle\langle {-i} \vert\\ Z = \vert {0} \rangle\langle {0} \vert - \vert {1} \rangle\langle {1} \vert \end{gathered}

Die durch X,X, YY und ZZ als Observablen definierten Messungen sind daher die projektiven Messungen, die durch die folgenden Mengen von Projektionen definiert werden.

{++,}{+i+i,ii}{00,11}\begin{gathered} \bigl\{\vert {+} \rangle\langle {+} \vert, \vert {-} \rangle\langle {-} \vert \bigr\} \\ \bigl\{\vert {+i} \rangle\langle {+i} \vert, \vert {-i} \rangle\langle {-i} \vert\bigr\} \\ \bigl\{\vert {0} \rangle\langle {0} \vert, \vert {1} \rangle\langle {1} \vert\bigr\} \end{gathered}

In allen drei Fällen sind die zwei möglichen Messergebnisse die Eigenwerte +1+1 und 1-1. Solche Messungen werden üblicherweise als XX-Messungen, YY-Messungen und ZZ-Messungen bezeichnet. Wir sind diesen Messungen in der Lektion „Allgemeine Messungen" des Kurses „Allgemeine Formulierung der Quanteninformation" begegnet, wo sie im Kontext der Quantenzustandstomographie auftraten.

Natürlich ist eine ZZ-Messung im Wesentlichen nur eine Standardbasismessung und eine XX-Messung eine Messung bezüglich der Plus-/Minus-Basis eines Qubits – aber wie diese Messungen hier beschrieben werden, nehmen wir die Eigenwerte +1+1 und 1-1 als die eigentlichen Messergebnisse.

Dasselbe Verfahren kann für Pauli-Operationen auf n2n\geq 2 Qubits angewendet werden, wobei jedoch betont werden muss, dass es auch dann nur zwei mögliche Ergebnisse für die auf diese Weise beschriebenen Messungen gibt: +1+1 und 1-1, die einzigen möglichen Eigenwerte von Pauli-Operationen. Die zwei entsprechenden Projektionen haben in diesem Fall daher einen Rang größer als eins. Genauer gesagt: Bei jeder nicht-identischen nn-Qubit-Pauli-Operation teilt sich der 2n2^n-dimensionale Zustandsraum immer in zwei Eigenvektorteilräume gleicher Dimension auf, sodass die beiden Projektionen, die die entsprechende Messung definieren, beide den Rang 2n12^{n-1} haben.

Die durch eine nn-Qubit-Pauli-Operation als Observable beschriebene Messung ist daher nicht dasselbe wie eine Messung bezüglich einer Orthonormalbasis von Eigenvektoren dieser Operation, noch ist sie dasselbe wie das unabhängige Messen jeder der entsprechenden Pauli-Matrizen unabhängig als Observablen auf nn Qubits. Beide Alternativen würden 2n2^n mögliche Messergebnisse erfordern, aber hier haben wir nur die zwei möglichen Ergebnisse +1+1 und 1-1.

Betrachten wir zum Beispiel die 2-Qubit-Pauli-Operation ZZZ\otimes Z als Observable. Wir können effektiv das Tensorprodukt der Spektralzerlegungen nehmen, um eine für das Tensorprodukt zu erhalten.

ZZ=(0011)(0011)=(0000+1111)(0101+1010)\begin{aligned} Z\otimes Z & = (\vert 0\rangle\langle 0\vert - \vert 1\rangle\langle 1\vert) \otimes (\vert 0\rangle\langle 0\vert - \vert 1\rangle\langle 1\vert)\\ & = \bigl( \vert 00\rangle\langle 00\vert + \vert 11\rangle\langle 11\vert \bigr) - \bigl( \vert 01\rangle\langle 01\vert + \vert 10\rangle\langle 10\vert \bigr) \end{aligned}

Das heißt, wir haben ZZ=Π0Π1Z\otimes Z = \Pi_0 - \Pi_1 für

Π0=0000+1111undΠ1=0101+1010,\Pi_0 = \vert 00\rangle\langle 00\vert + \vert 11\rangle\langle 11\vert \quad\text{und}\quad \Pi_1 = \vert 01\rangle\langle 01\vert + \vert 10\rangle\langle 10\vert,

und das sind die zwei Projektionen, die die Messung definieren. Wenn wir beispielsweise einen ϕ+\vert\phi^+\rangle-Bell-Zustand zerstörungsfrei mit dieser Messung messen würden, wären wir sicher, das Ergebnis +1+1 zu erhalten, und der Zustand würde durch die Messung unverändert bleiben. Insbesondere würde der Zustand nicht auf 00\vert 00\rangle oder 11\vert 11\rangle kollabieren.

Zerstörungsfreie Implementierung durch Phasenschätzung

Für jede nn-Qubit-Pauli-Operation können wir die mit dieser Observablen verbundene Messung zerstörungsfrei mithilfe von Phasenschätzung durchführen.

Hier ist ein auf Phasenschätzung basierender Schaltkreis, der für jede Pauli-Matrix PP funktioniert, wobei die Messung auf dem oberen Qubit durchgeführt wird. Die Ergebnisse 00 und 11 der Standardbasismessung im Schaltkreis entsprechen den Eigenwerten +1+1 und 1-1, genau wie wir es normalerweise bei Phasenschätzung mit einem Kontroll-Qubit haben. (Man beachte, dass das Kontroll-Qubit in diesem Diagramm unten liegt, während in der Lektion „Phasenschätzung und Faktorisierung" des Kurses „Grundlagen der Quantenalgorithmen" die Kontroll-Qubits oben gezeichnet wurden.)

Schaltkreis zur Messung einer Pauli-Observablen mittels Phasenschätzung

Eine ähnliche Methode funktioniert für Pauli-Operationen auf mehreren Qubits. Das folgende Schaltkreisdiagramm zeigt zum Beispiel eine zerstörungsfreie Messung der 33-Qubit-Pauli-Observablen P2P1P0P_2\otimes P_1\otimes P_0 für jede Wahl von P0,P1,P2{X,Y,Z}P_0,P_1,P_2 \in \{X,Y,Z\}.

Schaltkreis zur Messung einer 3-Qubit-Pauli-Observablen mittels Phasenschätzung

Dieser Ansatz verallgemeinert sich auf natürliche Weise auf nn-Qubit-Pauli-Observablen für beliebiges nn. Natürlich müssen bei der Implementierung solcher Messungen mit diesem Ansatz nur kontrollierte unitäre Gates für nicht-identische Tensorfaktoren von Pauli-Observablen aufgenommen werden; kontrollierte Identitätsgates sind einfach Identitätsgates und können daher weggelassen werden. Das bedeutet, dass Pauli-Observablen mit niedrigerem Gewicht kleinere Schaltkreise für die Implementierung durch diesen Ansatz benötigen.

Man beachte, dass diese Phasenschätzungsschaltkreise unabhängig von nn nur ein einziges Kontroll-Qubit haben, was damit übereinstimmt, dass für diese Messungen nur zwei mögliche Messergebnisse gibt. Die Verwendung von mehr Kontroll-Qubits würde keine zusätzlichen Informationen liefern, da diese Messungen mit einem einzigen Kontroll-Qubit bereits perfekt sind. (Eine Möglichkeit, das einzusehen, ergibt sich direkt aus dem allgemeinen Verfahren der Phasenschätzung: die Annahme U2=IU^2 = \mathbb{I} macht jedes weitere Kontroll-Qubit über das erste hinaus nutzlos.)

Hier ist ein spezifisches Beispiel einer zerstörungsfreien Implementierung einer ZZZ\otimes Z-Messung, die für die Beschreibung des 3-Bit-Wiederholungscodes als Stabilisator-Code relevant ist, die wir gleich sehen werden.

Schaltkreis zur Messung einer ZZ-Observablen mittels Phasenschätzung

In diesem Fall und für Tensorprodukte von mehr als zwei ZZ-Observablen im Allgemeinen kann der Schaltkreis vereinfacht werden.

Vereinfachter Schaltkreis zur Messung einer ZZ-Observablen

Diese Messung entspricht also dem zerstörungsfreien Messen der Parität (oder des XOR) der Standardbasiszustände zweier Qubits.