量子力学、統計力学、熱力学における天才物理学者たちの神学的な形象について

スポンサーリンク

Accel Brain; Console×

派生問題:前期量子力学における量子論の意味論

古典力学観察してきたのは、日常的に観察される物体のマクロな物理現象に過ぎない。19世紀以降、ミクロな粒子が物理学の研究対象となると、古典力学的な観察では説明の付かない事象が観測されることになる。このマクロミクロ区別が導入されることによって、もはや古典力学に対する期待外れを隠蔽し続けることができなくなった。ボルツマンらによる熱力学の功績が認知的に期待されたのは、専らミクロな事象とマクロな事象との間の接続可能性との関連からである。

古典力学では長らく、エネルギーは連続的であると想定されてきた。しかし1900年にマックス・プランクは、黒体放射の観測結果から、エネルギーが不連続な値を取り得ることを示した。不連続なエネルギーの単位は、光子が有するエネルギー振動数の比例定数hとして、$$h = 6.62607004 ☓ 10^{-34} m2 kg / s$$となる。このhは「プランク定数(Planck constant)」と呼ばれている。

1905年になると、アルバート・アインシュタインが、光電効果現象を説明するためには、古典電磁気学においては電磁「波」として想定されていた光を、$$E = hv$$のエネルギーを有する「粒子」または「光子」として記述しなければならないことを示している。ここで、vは光を波と考えた場合の振動数を意味する。しかし光の回析や干渉は、波動論的には説明が付いても、粒子説では説明の付かない。古典力学における光の観察は、粒子性と波動性の矛盾を派生させていることになる。

これに付随してニールス・ボーアは、1913年に、原子中の電子が原子核の周囲で軌道を描きながら保持するエネルギーを求めた。こうした電子が一定のエネルギーを保持して軌道を描いているのは、そもそも不連続的なエネルギー存在するためである。その不連続的なエネルギーを$$E_1, E_2, …, E_i, …, E_j$$とするなら、j番目の準位の電子がi番目の準位に移行する時、$$E_i – E_j = hv$$が成り立つ。ここで、j番目よりもi番目のエネルギーの方が高い場合、hvの振動数に該当する光の吸収が伴っている。逆にj番目のエネルギーの方が高い場合は、hvの振動数に該当する光の放出が伴っている。

アインシュタインやボーアの観測は、それまで波として想定されていた光に粒子性を認める観察となっている。逆に、電子のように、それまで粒子として想定されていた対象に波動性を見出したのが、ド・ブロイである。1924年に提唱されたド・ブロイ説によれば、一般的に運動している物体には粒子性と波動性の双方が伴っている。そして、粒子としての運動量pと波としての波長λとの間には、次のような関係がある。

$$p = \frac{h}{\lambda}$$

これを特に「ド・ブロイの関係(de broglie relationship)」という。p = mvとするなら、質量mが大きいマクロな物体においては、λが無視できるほど小さくなるため、波動性は顕在化しない。mが微小のミクロな粒子となる場合には、波動性は逆に顕在化する。ヴェルナー・カール・ハイゼンベルクの「不確定性関係(Unschärferelation)」も、この粒子と波動の二重性を説明している。粒子は波動性を兼ね備えているからこそ、その位置と運動量を同時に正確に測定することができないのである。

ハイゼンベルクが定式化した「不確定性関係(Unbestimmtheitsrelationen; Uncertainty relations)」、あるいは俗に言う「不確定性原理(Uncertainty principle)」は、粒子の位置と速度の両方を同時に完全な正確性を以って決定することが不可能であることを示している。無論これらの量のいずれか一方を必要に応じて正確に測定することは可能である。しかし、一方を正確にすればするほど、他方の不確定度は高まる。より厳密に言えば、座標$$x$$とそれに共役な運動量$$P_x$$は、同時にその不確定性を任意に小さくした値$$x’$$と$$P_x’$$を取ることができない。これらの不確定性をそれぞれ$$\Delta x$$と$$\Delta P_x$$と表すならば、次の不等式が成立する。

$$\Delta x \Delta P_x \geqq \frac{h}{4 \pi}$$

ここでいうhはプランク定数(Planck constant)に他ならない。すなわち、

$$h = 6.62607004 × 10^{-34} m^2 kg / s$$となる。この値は非常に小さいために、我々の多くの日常生活の経験には何の影響も及ぼさないように思える。例えばミサイルの位置と速度に対する観測においては、如何にサイバネティクス的に緻密な弾道計算においても、全く問題とはならない。

不確定性関係は、正準共役関係にある一対の力学変数に対してのみ適用される。互いに相補的に結び付けられていない変数間ではこの制約は成立しないということである。

この不確定性関係において特筆すべきなのは、ある系を観測する際には、観測装置とその系との間でエネルギー運動量を交換する必要があるということである。この交換は、対象それ自体の観測直前の性質を変異させる。その結果、これらの性質の測定の正確性は喪失するのである。例えば顕微鏡による観測では、粒子を観測するために、対象に光子を当てることになる。そのために対象の運動量は不確定になる。

問題解決策:シュレディンガー方程式

ハイゼンベルクは1925年、このミクロな粒子の運動を記述するために、「行列力学(Matrix mechanics)」を創始している。時を同じくしてエルヴィン・シュレーディンガーは1926年に、粒子性を伴わせた波の存在に関するド・ブロイ説を展開することで、波の運動を記述する「波動方程式(Wave equation)」を提唱している。その後の観察により、ハイゼンベルクの行列力学とシュレディンガーの波動方程式は同一の物理現象に対する異なる記述形式であることが証明された。

行列力学

意味論的に言えば、行列力学と波動方程式の差異は、ミクロな物理現象が突き付けた古典力学に対する期待外れに対して、如何にして認知的な期待構造化するのかという二者の観点の差異として表れている。ハイゼンベルクの行列力学の観点は、観測可能性と観測不可能性区別から出発している。電子の位置や周期などのような観測不可能な量については、観測しようと期待するのは懸命ではない。その代わりとして、彼は観測可能な量にのみ焦点を当てることで、古典力学との整合性を担保した理論量子力学を創始することの方がより筋が通っているという。

それ故にハイゼンベルクの記述は、それまで古典力学で観測されていた物理量に向けられる。ハイゼンベルクは位置と運動量を行列として再記述するのみならず、順番が異なるだけの2つの値の積は互いに等価であるという前提を覆す。そしてその差異から物理量の情報を抽出することで、彼は複雑な行列計算展開した。

波動力学

一方、シュレディンガーの波動方程式は、古典力学から演繹できる発想ではない。しかし多くの仮定の導入を必要としている行列力学に比して、波動力学の原理を成しているのは、波動方程式のみである。抽象化すれば、波動力学問題解決策は、観測の対象となる物理現象の位置と運動量のハミルトン関数を直交座標上で記述した上で、量子化を施すところから始まる。量子化とは以下のように、運動量を微分演算子として再記述することを指す。ここで重要となるのはシュレディンガーの波動方程式それ自体ではなく、量子化という手続きとハミルトニアンの関連に他ならない。シュレディンガー方程式機能は、この量子化の手続きとハミルトン関数アルゴリズムによって左右される。

時間に依存しないポテンシャルV(x)で運動する質量mの一個の粒子のハミルトン関数として記述すると、シュレディンガーの波動方程式は以下のようになる。

$$ih\frac{\partial}{\partial t}\psi(x, t) = H\psi(x, t) = [-\frac{h^2}{2m}\frac{\partial^2}{\partial x^2} + V(x)]\psi(x, t)$$

マクロ事象を扱う古典力学では、粒子のエネルギーは、時間に依存しないV(x)に基づいて保存される。一方、ミクロな事象を扱う量子力学では、時間に依存しない場合の方程式は、波動関数時間依存性を次のように分離することで表現される。

$$\psi(x, t) = f(t)\mu(x)$$

これを上記の波動方程式に代入すると、

$$ih\frac{\partial}{\partial t}f(t)\mu(x) = Hf(t)\mu(x) = [-\frac{h^2}{2m}\frac{\partial^2}{\partial x^2} + V(x)]f(t)\mu(x)$$

ここで、左辺の時間微分はf(t)にのみ作用する。右辺のxによる微分はμ(x)にのみ作用する。したがって、

$$\mu(x)ih\frac{d}{dt}f(t) = f(t)[-\frac{h^2}{2m}\frac{d^2}{dx^2}\mu(x) + V(x)\mu(x)]$$

両辺をf(t)μ(x)で割れば、$$\frac{ih}{f(t)}\frac{d}{dt}f(t) = \frac{1}{\mu(x)}[-\frac{1}{2m}\frac{d^2}{dx^2}\mu(x) + V(x)\mu(x)]$$

となり、時間tのみの関数となる左辺と位置座標xのみの関数となる右辺を分離することが可能になる。左辺はxには依存せず、右辺はtに依存しない。この両辺が等号で結ばれるということは、両辺はxにもtにも依存しない定数にならざるを得ない。この定数を仮にEと置くなら、

$$\frac{ih}{f(t)}\frac{d}{dt}f(t) = E$$

$$ih\frac{d}{dt}f(t) = Ef(t)$$

積分定数をCとするなら、$$f(t) = Ce^{-\frac{iEt}{h}}$$となる。

一方、$$\frac{1}{\mu(x)}[-\frac{1}{2m}\frac{d^2}{dx^2}\mu(x) + V(x)\mu(x)] = E$$から、$$-\frac{h^2}{2m}\frac{d^2}{dx^2}\mu(x) + V(x)\mu(x) = E\mu(x)$$となる。これがμ(x)に対する「時間に依存しないシュレディンガー方程式(time-independent Schrödinger equation)」と呼ばれる定式である。

ハミルトン関数時間に依存しない場合、波動関数時間依存性はf(t)のみで表現される。一方、ポテンシャルが時間に依存する場合、つまりV(x, t)の場合には、「時間に依存するシュレディンガー方程式(time-dependent Schrödinger equation)」が導入されなければならない。V(x, t)の場合におけるハミルトン関数は、以下のようになる。

$$H = \frac{p^2}{2m} + V(x, t)$$

これをシュレディンガー方程式に適用するなら、$$ih\frac{\partial}{\partial t}\psi(x, t) = H\psi(x, t)$$が得られる。

上記のハミルトン関数は粒子が一個の場合を想定している。これをN個の粒子の場合に一般化するなら、各粒子の質量と運動量を$$m_i$$と\$$p_i$$として、ハミルトン関数は、$$H = \sum_{i=1}^{N}\frac{p_i^2}{2m_i} + V(r_1, r_2, .., r_N, t) \ \ r_i = \{x_i, y_i, z_i\}$$となる。ただしここでのVは、N粒子系のポテンシャルエネルギーとなる。

問題解決策:エネルギー固有関数

波動関数は、量子系を構成する粒子の位置変数と運動量変数の量子確率分布を表す。量子力学の参照問題はこの波動関数を求めることである。だが量子確率分布は、古典力学でも利用されるような確率分布の一種に過ぎない。単に分布の形式が異なるだけだ。ミクロの水準では確率的に変動しているはずの粒子のエネルギーをはじめとする物理量は、マクロの水準では確定的な値を取る。量子力学主題は、この矛盾が如何にして可能になっているのかである。マクロの水準での観測であっても、実際上その粒子の定常状態には微小な「ゆらぎ」が伴っている。粒子がある定常状態から別の定常状態へと移行する時、光の放出や吸収が生じているのである。エネルギー期待値が確定的な値として観測されるのは、この「ゆらぎ」が盲点となる場合である。

粒子のこの定常状態は、単一とは限らない。多くの場合、一つの量子系は複数の定常状態の重ね合わせとして構成されている。定常状態を実現する幾つかの量子的状態を記述する部分集合の各粒子は、その集団のエネルギー期待値に近いエネルギーの状態で振動している。その最中に光が吸収・放出されることによって、ある定常状態から別の定常状態への移行が成り立つ。スペクトルとして観測されるのは、この時に吸収・放出される光である。

電子は各エネルギー準位に対応した軌道を描く訳ではなく、それぞれの平均エネルギー状態間を運動するだけである。軌道そのものが複数個あるのではない。運動の平均エネルギー状態が複数個あるのである。そしてこのエネルギーの分布を規定するのが、波動関数である。電子の位置や運動量は、波動関数に準拠した上で変動する。電子は位置や運動量の分布を変異させる。スペクトル線の放出や吸収の原因となるのは、この平均エネルギーの状態変化である。

古典力学であれ量子力学であれ、系の全エネルギーが常に保存される物理量であるということに変わりは無い。この物理量は恣意的な値を取り得ない。量子力学においては、このエネルギーの取り得る値を「エネルギー固有値(Energy eigenvalue)」と呼ぶ。上述した「時間に依存しないシュレディンガー方程式」の解は、エネルギー固有値とそれに対応する「エネルギー固有関数(Energy eigenfunctions)」に関する重要な性質を指し示している。例えば一次元の長さLの箱の中に一個の自由粒子が存在する場合、箱の長さをx軸方向に取れば、箱の左端をx=0とし、箱の右端をx=Lとして表現できる。自由粒子であるため、箱の中でのポテンシャルVは0である。また、設定上粒子は箱の外には出られないため、箱の外のポテンシャルVは∞である。このポテンシャルは時間に依存しない。したがって、「時間に依存しないシュレディンガー方程式」が導入される。

$$-\frac{h^2}{2m}\frac{d^2}{dx^2}\mu(x) + V(x)\mu(x) = E\mu(x)$$より、$$\frac{d^2\mu}{dx^2} + \frac{2m}{h^2}(E – V)\mu = 0$$

ここで、μが箱の境界上で連続であるという条件を仮定するなら、エネルギー固有関数は、

$$
\begin{eqnarray}
\left\{
\begin{array}{l}
\mu_n(x) = 0 \ (x \leq 0, x \geq L)\\
\mu_n(x) = \sqrt{\frac{2}{L}}\sin \frac{n\pi}{L}x \ (0 < x < L) \end{array} \right. \end{eqnarray} (n = 1, 2, ...) $$ として規格化され、エネルギー固有値としては、$$E_n = \frac{\pi^2h^2n^2}{2mL^2} \ (n = 1, 2, …)$$が得られる。粒子のエネルギーは、古典力学の観測結果とは異なり、量子数nの増加と共に不連続的に増大していく。また、最小エネルギーは$$E_1 \neq 0$$であって、有限値を取る。

問題解決策:固有状態と一般状態の区別

量子力学では、エネルギー固有値$$E_i$$は、系のエネルギーの測定値ではない。それは系の可能なエネルギーの測定値である。観測した系のエネルギーを測定した場合、それによって認識可能になるのは、$$E_i$$の一つに過ぎない。言い換えれば、系がエネルギー固有関数によって表現される状態にある場合、そのエネルギーを測定すると、$$E_i$$が測定値の一つとして得られる。この測定による観測が実行された時、系はi番目の固有状態にあると認識される。

したがって、系の固有状態は、観測によって規定される。観測は時間に依存する訳ではない。観測者は任意の時間に観測を実行することができる。これに連動するように、シュレディンガー方程式も、「時間に依存しないシュレディンガー方程式」が用いられる。つまり、$$\hat{H}\psi = E\psi$$を解けば、エネルギー固有値$$E_i$$とその固有関数$$\psi_i (i = 1, 2, …)$$が求められるのである。

一方、これに対して系の一般状態は、「時間に依存するシュレディンガー方程式」を解くことで求められる。つまり系の一般状態は、$$\hat{H}\Psi = \frac{ih\partial \Psi}{\partial t}$$の解となる波動関数$$\Psi(\bf{r}, t)$$によって得られる。ここで、$$\bf{r} = \{r_1, r_2, …, r_n \}$$のn粒子系を表す。

この系の一般状態は、系の固有状態の一次結合によって表現される。

$$\Psi(\bf{r}, t) = \sum_{i}^{}c_i(t)\psi_i(\bf{r})$$

言い換えれば、系の一般状態は系の固有状態の重ね合わせによって成立していることになる。固有状態が既知の場合は、$$\hat{H}\Psi = \frac{ih\partial \Psi}{\partial t}$$から、係数$$c_i(t)$$を算出することで、系の一般状態を規定することが可能になる。そしてこの一般状態にある系に対してエネルギーの測定を実行すれば、測定値となる$$E_i (i=1, 2, …)$$が、$$|c_i(t)|^2 (i=1, 2, …)$$の確率で得られる。一方、もし系が固有状態にある場合には、$$\Psi(\bf{r}, t) = \psi_i(\bf{r})(|c_i(t)|^2=1)$$から、系についてのエネルギーを測定することにより、$$E_i$$が確定的な値として得られる。

問題解決策:形式としての量子ビット

磁性体の微小リング構造のように、量子論的な微小世界の系は、互いに異なる二つの状態を同時に重ね合わせて実現している。この量子状態の最小単位を特に「量子ビット(quantum bit)」という。従来の古典的なビット(bit)が「0か1か」の状態を表しているのに対して、量子ビットは「0でもあり得て1でもあり得る」、もしくは単純に「0でもあり1でもある」状態を言い表している。

イジングモデル

量子ビットで表される状態は確率論的に規定される。具体的には、この状態遷移を記述する都合上、「マルコフ確率場(Markov random field; MRF)」に類する概念が頻繁に参照される。マルコフ確率場の最も単純な一例は「イジングモデル(Ising model)」として知られている。イジングモデルは強磁性体の相転移(Phase transition)を分析するために設計された確率モデルである。強磁性体とは、磁石として機能する物質を意味する。その特徴は温度によって不連続に変異する。臨界温度以上であれば、外部から磁場を外場として加えない限りは、磁化は生じない。だが臨界温度以下では、外場をどれほど0に近付けても、磁化が弱まることが無い。この微弱な磁化を特に「自発的磁化(spontaneous magnetization)」という。相転移という現象は、この磁化の作用のように、外部環境のパラメタが変化することで物質の巨視的な特徴が変化することを指す。

Mezard, M., & Montanari, A. (2009). Information, physics, and computation. Oxford University Press., p35より掲載。

Mezard, M., & Montanari, A. (2009). Information, physics, and computation. Oxford University Press., p35より掲載。

イジングモデルは強磁性体の構成要素となる原子・分子水準の「スピン(spin)」と呼ばれる弱い磁石の性質に着目した確率モデルである。強磁性という特徴は、このスピンの向きに対する巨視的な観点によって区別される。

通常、磁気における「クーロンの法則(Coulomb’s Law)」によれば、一般に粒子上の磁力は次のようになる。

$$\vec{F}_{msg} = q\vec{v}\vec{B}$$

ここで、qは粒子の電荷を意味する。vベクトルは粒子の速度意味する。そしてBベクトルは、以下の「ビオ・サバールの法則(Biot–Savart Law)」によって得られる周辺磁場(ambient magnetic field)である。

$$\vec{B} = \frac{\mu_0}{4 \pi}\int_{C}^{}\frac{Id\vec{l}\vec{r}}{|\vec{r}|^3}$$

ここで、$$\mu_0 \approx 1.25663706 × 10^{-6} m \ kg \ s^{-2} \ A^{-2}$$は、真空の透磁率を意味する。Iは背景電流(background electric current)で、周辺磁場を生成する。Cは電流経路を意味する。$$d\vec{l}$$は経路の長さの要素を表す。rベクトルは経路上の点からの変位を意味する。しかし、とりわけ周辺磁場が非真空媒体において「磁気双極子モーメント(a magnetic dipole moment)」を発生させる場合、あるいは「スピン(spin)」を生じさせる場合に、この関連は複合化する。通常の強磁性体は鉄やニッケルで構成されているが、周辺磁場が存在する必要が無いという点では特殊である。強磁性体の各スピンは、互いにその隣接するスピンと同一の方向を志向する。自発的磁化が生じるのは、このスピンが整序された場合である。

とはいえイジングモデルにおけるスピンのモデルは単純化されている。それはある軸に準拠した格子状の量として記述されており、それぞれ平行を表す+1か反平行を表す-1の二値しか取り得ない。だが隣接するスピンは互いに影響を与え合う。また、各スピンは外場の影響も受容する。こうした特徴は、ハミルトニアン(Hamiltonian)のエネルギー関数により、次のように定式化される。

$$H(x) = -J\sum_{(ij)}x_ix_j – h\sum_{i}x_i$$

ただしJ>0となる。(ij)は格子状で隣接する接格子点の対を意味する。Jは隣接する対の相互作用を表すのに対して、hは外場の強さを表している。Jが正の値であることが、強磁性に対応している。熱力学的に言えば、エネルギー保存則により、仕事が介在しない限り、物質はエネルギーの低い状態を好む。外場の発生していない状況がh = 0とするなら、J > 0であれば、スピンの対の積となる$$x_ix_j$$が正の値となる場合にエネルギーは低下する。つまり、エネルギーが最も下がるのは、全てのスピンが+1になっている場合か、全てのスピンが-1になっている場合となる。したがって、ハミルトニアンのエネルギー関数エネルギー保存則を前提とすれば、J > 0の場合、$$x_i$$と$$x_j$$は同値になる確率が高まる。逆にJ < 0の場合は異なる値を取る確率が高まる。また、h > 0の場合は$$x_i$$が1となる確率が高まる。

量子ビットの行列表現

こうしたイジングモデル確率論を前提とすれば、量子ビット構成する方法が明確になってくる。例えば超伝導状態にある金属の回路を利用するのは、量子ビット構成する方法の一つとして挙げられる。超伝導状態とは、極低温になることで電流を抵抗無しに流すことを可能にしている状態を指す。実際、ニオブで造られた微小な大きさの閉じた回路を超伝導状態にすると、時計回りの電流と反時計回りの電流が同時存在するようになる。時計回りの電流をイジングモデルの上向きに、反時計回りの電流をその下向きに、それぞれ対応付けると、+1と-1の二つの状態が回路内に同時存在することが可能になる。この二つの電流は互いに打ち消し合う訳ではない。電流を観測すれば、実にほぼ0.5の確率で、いずれか一方の状態が測定される。二つの状態は、同時存在しているものの、測定してみるまでは、最終的にどちらの方向に流れているのかは知り得ないのである。

時計回りの状態と反時計回りの状態をそれぞれ次のベクトルで表現する。

$$\left(\begin{array}{c}1\\0\end{array}\right),\left(\begin{array}{c}0\\1\end{array}\right)$$

先述したイジングモデルで表されているように、電子にはスピンと呼ばれる性質がある。上記の二つの状態は、上向きと下向きのスピンを表している。双方は直交しているため、その内積が0となる点にも矛盾しない。問題は、この二つの状態が同時存在するという確率論的な状態遷移が如何にして可能になるのかである。その解は、物理学者ヴォルフガング・パウリが提唱したスピン角運動量の記述形式である「パウリ行列(Pauli matrices)」によって可能になる。

$$
\begin{align}
\sigma_x&= \left(\begin{array}{cc}0&1\\1&0\end{array}\right),&
\sigma_y&= \left(\begin{array}{cc}0&-i\\i&0\end{array}\right),&
\sigma_z&= \left(\begin{array}{cc}1&0\\0&-1\end{array}\right)
\end{align}
$$

ここで、パウリ行列のz成分を上述した二つの状態のベクトルに作用させると、次のように変異する。

$$
\left(\begin{array}{cc}1&0\\0&-1\end{array}\right)
\left(\begin{array}{c}1\\0\end{array}\right)
= \left(\begin{array}{c}1\\0\end{array}\right)
$$

$$
\left(\begin{array}{cc}1&0\\0&-1\end{array}\right)
\left(\begin{array}{c}0\\1\end{array}\right)
= – \left(\begin{array}{c}0\\1\end{array}\right)
$$

したがって、二つの状態は、パウリ行列のz成分に対して、それぞれ固有値1の固有ベクトルと固有値-1の固有ベクトルであるということになる。この双方をそれぞれ時計回りのスピンと反時計回りのスピンに対応付けると、次のような線形結合構成することが可能になる。

$$\frac{1}{\sqrt{|a|^2 + |b|^2}}\left(a\left(\begin{array}{cc}1\\0\end{array}\right) + b\left(\begin{array}{cc}0\\1\end{array}\right)\right) = \frac{1}{\sqrt{|a|^2 + |b|^2}}\left(\begin{array}{cc}a\\b\end{array}\right)$$

ここで、aとbはスピンの向きの確率の変数を表す。それぞれの絶対値の二乗$$\frac{|a|^2}{|a|^2 + |b|^2} , \frac{|b|^2}{|a|^2 + |b|^2}$$が、それぞれ実際に測定された際の確率を表す。また、二つのスピンの向きの確率が等価となるのは、$$a = b = 1$$の場合となる。この場合、状態は$$\frac{1}{\sqrt{2}}\left(\begin{array}{cc}1\\1\end{array}\right)$$となる。

同時存在する二つの状態の静的な設計は以上の通りである。次に考えるべきなのは、これらの状態の遷移が如何にして可能になるのかである。物理的には、上述した超伝導回路に別の小さな超伝導回路を結合させることで、電流が反転するように設計していくことが要求される。これを数学的に可能にするのが、パウリ行列のx成分による作用である。この作用を二つの状態に加えると、状態は次のように変異する。

$$\sigma_x = \left(\begin{array}{cc}0&1\\1&0\end{array}\right)$$

$$\left(\begin{array}{cc}0&1\\1&0\end{array}\right)\left(\begin{array}{minus}1\\0\end{array}\right) = \left(\begin{array}{minus}0\\1\end{array}\right)$$

$$\left(\begin{array}{cc}0&1\\1&0\end{array}\right)\left(\begin{array}{minus}0\\1\end{array}\right) = \left(\begin{array}{minus}1\\0\end{array}\right)$$

ここで、パウリ行列x成分の固有ベクトルは次のようになる。

$$\left(\begin{array}{cc}0&1\\1&0\end{array}\right)\left(\begin{array}{minus}1\\1\end{array}\right) = \left(\begin{array}{minus}1\\1\end{array}\right)$$

$$\left(\begin{array}{cc}0&1\\1&0\end{array}\right)\left(\begin{array}{minus}1\\-1\end{array}\right) = -\left(\begin{array}{minus}1\\-1\end{array}\right)$$

これらは共に二つの状態を表す$$\left(\begin{array}{minus}1\\0\end{array}\right), \left(\begin{array}{minus}0\\1\end{array}\right)$$を同じ絶対とを持つ係数で加えた値であるため、上向きと下向きが等確率で重ね合わせられた状態を表現している。

このように、パウリ行列z成分は重ね合わせられた二つの状態の静的な特徴表現しているのに対して、パウリ行列x成分はこれらの動的な特徴表現している。この動的な特徴を持つ二つの状態は、時間と共に遷移する。この時系列的な動的特徴表現することは、時間に依存するシュレディンガー方程式機能の一つであると考えられる。

上向きのスピンと下向きのスピンの線形結合と関連するシュレディンガー方程式を記述する上で、ここでは次のようなポール・ディラックのブラケット記法(bra-ket notation)で表記を単純化しておく。

$$\mid \uparrow \rangle \to \left(\begin{array}{c}1\\0\end{array}\right),~\mid \downarrow \rangle \to\left(\begin{array}{c}0\\1\end{array}\right)$$

二つの状態を取る一つのスピン系に関して、時間に依存するシュレディンガー方程式は次のように記述しておこう。

$$ih\frac{\partial \mid \psi \rangle}{\partial t} = H\mid \psi \rangle$$

ここで、hはプランク定数である。tは時間意味する。そしてψは、$$H\mid \psi \rangle = a\mid \uparrow \rangle + b\mid \downarrow \rangle$$で、二つのスピンの線形結合を表す。ハミルトニアンHは、$$H = -\hat{h}\sigma^z – \Gamma \sigma^x$$となり、パウリ行列のxとzの成分による線形結合の行列となる。

したがって、二つのスピンの線形結合と関連するシュレディンガー方程式は次のように再記述できる。

$$ih\frac{\partial (a\mid \uparrow \rangle + b\mid \downarrow \rangle)}{\partial t} = (-\hat{h}\sigma^z – \Gamma \sigma^x)(a\mid \uparrow \rangle + b\mid \downarrow \rangle)$$

故に、

$$i\frac{da}{dt} = -\hat{h}a – \Gamma b$$
$$i\frac{db}{dt} = -\Gamma a + \hat{h}b$$

となる。これを解くことで、上向きのスピンに対応する状態と下向きのスピンに対応する状態が時間と共に如何にして遷移し得るのかがわかる。

これらを前提とすれば、二つのスピンの線形結合と関連するシュレディンガー方程式は、状態の結合係数となるaとbの時間依存性を規定する連立方程式として機能する。尤もこのことは、$$\bar{h}$$と$$\Gamma$$の時間依存性が具体的に規定されることが条件となる。

ハミルトニアンが時間に依存しない場合には、時間に依存しないシュレディンガー方程式が導入される。$$\psi_0$$を時間に依存しない2成分のベクトルとするなら、

$$\psi = \psi_0 e^{-iEt}$$

と置くことができる。すると二つの状態を取る一つのスピン系に関して、時間に依存しないシュレディンガー方程式は、$$H\psi_0 = E\psi_0$$となる。

派生問題:量子系の基底状態探索問題

シュレディンガー方程式が導入されるまで、量子力学における量子論意味論は、専ら量子状態の基礎付けを主題にしてきた。こうした量子論意味論に接してきた物理学者たちは、長らく支配的であったニュートン力学とは辻褄の合わない微小な世界の事象を何とかして物理学的に表現できるようにするという問題意識に突き動かされていたように思える。

一方、シュレディンガー方程式が導入されてからは、その工学的な応用面も活発に主題化されるようになった。例えば「組み合わせ最適化問題(combinatorial optimization problem)」への応用は、典型的な例となる。最適化問題とは、実数値や整数値の関数に関して、その値が最小あるいは最大となる状態を求める問題である。組み合わせ最適化問題は、専らこの最小値あるいは最大値を与える変数が複数存在する場合に要求される。

この問題設定自体は、主にアルゴリズム理論計算複合性理論との関連から導入される傾向が強い。これに対して量子論意味論は、この組み合わせ最適化問題を、イジングモデルにおける基底状態の探索問題として再設定する傾向にある。例えばエドワーズ・アンダーソンのスピングラス理論(Theory of spin glasses)では、ハミルトニアンが$$H_0 = – \sum_{\langle ij \rangle}^{}J_{i,j}\sigma^z_i\sigma^z_j$$によって規定されるエネルギーのコスト関数を最小化する問題として再設定されている。スピングラスにおいて、$$J_{i, j}$$には正負のアトランダムな値が代入される。それ故にスピンの場合の数やスピン同士の組み合わせの数は膨大となる。この計算複合性ゆえに、スピングラス基底状態を求めることは一般的に困難とされている。

スピングラス基底状態探索問題の解決が一般的に困難とされているのは、エネルギーが系の状態の関数としてはあまりにも高い複合性を有しているためである。このことは、諸変数の数をNとして、全ての状態を総当りで探索した場合を想定してみればわかる。全てのスピンの組み合わせを探索することになるため、実に$$2^N$$回の試行が必要になってしまう。確かに、スピンの組み合わせを恣意的に決めてしまうことで、単純にエネルギーを降下させていくことも不可能ではない。だがこの場合、局所最適解(local optimal solution)に落ちてしまう危険がある。

イジングモデル基底状態探索問題における計算複合性は、組み合わせ最適化問題における計算複合性と論理的に等価である。したがって形式的に言い換えれば、原理的に如何なる組み合わせ最適化問題イジングモデル基底状態探索問題として再設定することが可能であることが示せる。組み合わせ最適化アルゴリズムで参照される諸離散変数は、全て有限の長さの2進数で表現することができる。2進変数$$q = 0, 1$$の和の代数は、イジングモデルの変数$$\sigma = \pm 1$$の積の代数と、関係式$$\sigma = (-1)^q$$により等価である。そこで、Nを適当な自然数とした上で、離散諸変数の組み合わせをイジング変数の組み合わせ$$\mathbb{v} = \{v_1, v_2, v_3, …, v_N\}$$で表現していく。するとコスト関数は$$H(\mathbb{v})$$と置くことができる。各イジング変数の値は+1か-1であるため、$$v_i^2 = 1$$となる。故にこのコスト関数は最大でN次のモデルで記述できる。

ここで、$$c_{ij…}^{(n)}$$は各和に現れる項の数に対応している。この総和は、

$$1 + N + \left(\begin{array}{cc}N\\2\end{array}\right) + \left(\begin{array}{cc}N\\3\end{array}\right) + … + \left(\begin{array}{cc}N\\N-2\end{array}\right) + \left(\begin{array}{cc}N\\N-1\end{array}\right) + 1 = 2^N$$

となる。尚、N次を超える数で多項式を展開しても、N個の変数のいずれか一つが必ず2回以上参照されることになる。だが$$v_i^2 = 1$$となるため、次数がNを超えることはあり得ない。

イジングモデル基底状態探索機能を付加させるためには、次のように、通常のイジングモデルのハミルトニアンに一つの項を追加する必要がある。

ここで、$$\Gamma \sum_{i=1}^{N}\sigma_i^x$$は、固有値±1を有するパウリ行列のx成分の和に比例する値となる。Γは「アニーリング係数(Annealing coefficient)」と呼ばれるハイパーパラメタで、一般に非常に大きな値を持つ。この項が複数の状態の間での遷移を引き起こすことで、最適解の探索を駆動させる。z軸を縦の向きとした場合、x軸は横の向きになるため、こうして機能的に拡張されたイジングモデルは特に「横磁場イジングモデル( transverse field Ising model)」と呼ばれている。そして、この横磁場イジングモデルのハミルトニアンを活用した組み合わせ最適化アルゴリズムを特に「量子アニーリング(Quantum annealing)」もしくは「量子シミュレーテッドアニーリング(Quantum simulated annealing)」と呼ぶ。以下では、この量子アニーリングアルゴリズム設計が如何にして可能になっているのかを確認していく。

問題解決策:量子ゼノン効果

量子アニーリングは、「量子ゼノン効果(quantum Zeno effect)」を言わば用(exploits)することで成立している。量子ゼノン効果という概念は、いわゆる「ゼノンのパラドックス(Zeno’s Paradoxes)」に由来する。それは、ある量子系に対する反復的な状態の測定によって、状態遷移を引き起こされたその量子系の振る舞いを表している。その振る舞いは、観測、すなわち量子力学的な測定が波動関数の崩壊(collapse)、あるいは縮減(reduction)を引き起こすが故に生起する。言い換えれば量子系は、自らに対する短い時間感覚Δtにおける測定の影響を被ることで、$$Q = \mathcal{O}(\frac{1}{\Delta t})$$となった後に、総確率$$1 – \mathcal{Q}(\Delta t)$$で基底状態へ向けてその状態を崩壊させていくのである。

反復的な測定は、量子的な系の発展(evolution)を遅延させる。量子的な測定は、初期状態とは異なる状態への遷移を妨げる。量子ゼノン効果は、短期間の生存確率の二次的な振る舞いを生じさせるシュレディンガー方程式の一般的な特徴の結果である。

ある量子系を、時刻t = 0で純粋状態である$$|\psi_0\rangle$$において、ヒルベルト空間となる$$\mathcal{H}$$で正規化されたベクトルによって導入しよう。この系は、総ハミルトニアン$$\it{H}$$の振る舞いのもとで進化する。

次の量は、生存の振幅とその確率(survival amplitude and probability)を表す。

$$\mathcal{A}(t) = \langle \psi_0|\psi_t\rangle = \langle \psi_0|e^{-i\it{H}t}|\psi_0\rangle$$

$$p(t) = |\mathcal{A}(t)|^2 = |\langle \psi_0|e^{-i\it{H}t}|\psi_0\rangle|^2$$

これらの量は、時刻tにおける初期状態$$\psi_0\rangle$$にて、量子系が発見される振幅確率を表している。

時間での基礎的な展開は、次のような二次的な振る舞いを生じさせる。

$$p(t) = 1 – \frac{t^2}{\tau_{\boldsymbol{Z}}^2} + …$$

$$\tau_{\boldsymbol{Z}}^{-2} \equiv \langle \psi_0|\it{H}^2|\psi_0\rangle – \langle \psi_0|\it{H}|\psi_0 \rangle^2$$

ここで、$$\tau_{\boldsymbol{Z}}$$は「ゼノン時間(Zeno time)」と呼ばれている。この値は、時折非常に不正確(inaccurate)になるが、短時間の二次的挙動の持続時間の定量的な推定値を表す。ハミルトニアンの全体を自由な部分と相互作用の部分に分解するなら、次のように再記述できる。

$$\it{H} = \it{H}_0 + \it{H}_{int}$$

$$\it{H}_0 = \it{PHP} + \it{QHQ}$$

$$\it{H}_{int} = \it{PHP} + \it{QHP}$$

$$\it{P} = |\psi_0 \rangle \langle \psi_0|$$

$$\it{Q} = 1 – \it{P}$$

初期状態は自由なハミルトニアンの固有状態となる。これは、相互作用に対しては完全に非対角である。したがって、

$$\it{H}_0|\psi_0 \rangle = \omega_0|\psi_0 \rangle$$

$$\langle \psi_0|\it{H}_{int}|\psi_0 \rangle = 0$$

ここから、ゼノン時間は次のようになる。

$$\tau_{\boldsymbol{Z}}^{-2} = \langle \psi_0|\it{H}_{int}^2|\psi_0 \rangle$$

これは、相互作用のハミルトニアンの正方にのみ依存する。ゼノン時間は、時間エネルギー不確定性関係に一致するという条件下で、次の完全性の関係によって、全ての可能な中間状態(intermediate state)を言わば探索(explores)する。

$$\langle \psi_0|\it{H}_{int}^2|\psi_0 \rangle = \langle \psi_0|\it{H}_{int}\it{Q}\it{H}_{int}|\psi_0 \rangle = \sum_{n \neq 0}^{}\langle \psi_0|\it{H}_{int}|n \rangle \langle n|\it{H}_{int}|\psi_0 \rangle$$

ここで、$$|n \rangle$$は、自由なハミルトニアン$$\it{H}_0$$の固有基底(eigenbasis)を意味し、$$|0\rangle = |\psi_0 \rangle$$となる。

ここで、測定対象となる量子系がまだ初期状態にあるか否かを検証するために、$$\tau = \frac{t}{N}$$の時間間隔で、N回その量子系を測定する場合を想定する。もし、どの時点での測定でも肯定的な結果を出し、その量子系が初期状態にあると見出されたのならば、その波動関数は「崩壊(collapses)」する。そして、その量子系の進化は$$|\psi_0 \rangle$$から新たに始まる。N回の測定後の生存確率は次のようになる。

$$p^{(N)}(t) = p(\tau)^N = p(\frac{t}{N})^N \xrightarrow{N \ learge} [1 – (\frac{t}{N_{\tau_{\boldsymbol{Z}}}})^2]^N \sim \exp (-\frac{t^2}{N_{\tau_{\boldsymbol{Z}}^2}}) \xrightarrow{N \to \infty} 1$$

この$$t = N\tau (< \infty)$$は、実験の総持続時間を表す。Nが無限回までなのは、無限に反復的に測定した場合に、量子力学的な時間発展が停止することで、初期状態で系が凍結(freeze)する関連からである。Nを無限にすれば、測定対象となる量子系が時刻tになるまで生存している確率は1になる。したがって、連続的に観測されている状態は、決して減衰しない。ここでいう連続的な観測とは、すなわち無限に細分化された各時点に無限回観測し続けることを意味する。しかし、この効果を一時的な減衰において観測することは困難であった。何故なら、その確率が二次関数的に増大する時間間隔は、測定を成立させるまでに必要となる時間に比して、極めて短いためである。時間エネルギーにおける不確定性関係に基づけば、生存時間の測定頻度に対する依存性は、原理的に指し示されているものの、極端なほどに観測することが困難であったのだ。

これが、量子ゼノン効果の由来が「ゼノンのパラドックス」とされる所以である。飛んでいるにも拘らず止まっている矢は、ここでは波動関数意味する。それはハミルトニアンによって指し示された力学的な振る舞いを示すはずだ。しかし、それが連続的に観測される場合、その波動関数は動かないのである。量子系は、崩壊せずに存続しているから観測され続けるのではなく、観測され続けられるからこそ崩壊せずに存続し続けていることになる。

尤も、それが「ゼノンのパラドックス」に由来するとはいえ、量子ゼノン効果それ自体はパラドックスとして認識されていない。量子論意味論において、この効果は量子論的な時間発展の法則の結果であると認識されている。量子ゼノン効果が言い表しているのは、量子力学的な測定によって観測されている系の状態が、量子力学的な測定によって誘導(induced)されているということである。

問題解決策:量子アニーリング

量子ゼノン効果を前提とすれば、量子アニーリングもまた量子力学的な測定によって誘導されている量子系の状態に関わっている。量子アニーリングアルゴリズムは、横磁場イジングモデルのハミルトニアンにおいて、第一項が第二項に比べて無視できるほど小さいという初期設定から始まる。時間t = 0では、ハミルトニアンは第二項である横磁場項のみで構成される。

$$H = – \Gamma \sum_{i=1}^{N}\sigma_i^x$$

横磁場項だけのハミルトニアンの基底状態を$$\mid \psi_0 \rangle$$と置けば、この値は$$\sigma_i^x$$の固有値1の固有状態の積となる。すなわち、

$$\sigma_i^x \mid + \rangle_i = \mid + \rangle_i = (\mid \uparrow \rangle_i + \mid \downarrow \rangle_i)$$

$$\mid \psi_0 \rangle = \prod_{i=1}^{N}\mid + \rangle_i = \left( \frac{1}{2}\right)^{\left(\frac{N}{2}\right)}\prod_{i=1}^{N}(\mid \uparrow \rangle_i + \mid \downarrow \rangle_i)$$

$$\mid \psi_0 \rangle = \frac{1}{2^{\frac{N}{2}}}(\mid \uparrow \uparrow … \uparrow \rangle + \mid \uparrow \uparrow … \downarrow \rangle + … + \mid \uparrow \downarrow … \downarrow \rangle + \mid \downarrow \downarrow … \downarrow \rangle)$$

$$\mid \psi_0 \rangle = 2^{-\frac{N}{2}}(\mid \uparrow \uparrow … \uparrow \rangle + \mid \uparrow \uparrow … \downarrow \rangle + … + \mid \uparrow \downarrow … \downarrow \rangle + \mid \downarrow \downarrow … \downarrow \rangle)$$

ここで、例えば$$\mid \uparrow \uparrow … \uparrow \rangle$$と表記した場合は、$$\mid \uparrow \rangle_1 \mid \uparrow \rangle_2 … \mid \uparrow \rangle_N$$を意味する。

これを前提とすれば、$$\mid \psi_0 \rangle$$においては、$$2^N$$個の状態が係数$$2^{-\frac{N}{2}}$$で重ね合わせられていることになる。この係数は言わば、同時存在している各状態の重みを意味する。初期状態において、各状態がどの程度の分布で重ね合わせられているのかは、一般に未知である。そのためここでは、全ての状態に対して等価な重み付けを与えている。

量子アニーリングでは、Γを時間関数Γ(t)として設定する。理論的には、$$\Gamma (0) = \infty$$で、$$\Gamma(\infty) = 0$$となる。初期の時点t = 0におけるΓは非常に大きな値を示す。そして、Γの値を時間の経過と共に徐々に減少させていくことで、系の状態が時間に依存するシュレディンガー方程式

$$i\frac{\partial}{\partial t}\mid \psi(t)\rangle = H(t)\mid \psi (t)\rangle$$

に従って遷移していく。

一方、Γ(t)の時間発展が十分に長い時間を掛けて進む場合、状態$$\mid \psi(t)\rangle$$は、各時点のハミルトニアンに対する時間に依存しないシュレディンガー方程式

$$H(t)\mid \phi_t\rangle = E_0(t) \mid \phi_t\rangle$$

における基底状態$$\mid \phi_t\rangle$$に近付く。すなわち、これらの内積が1に十分近いということになる。

$$\left| \langle \psi_t \mid \phi(t)\rangle \right|^2 = 1 – \epsilon \ \ (0 < \epsilon \ll 1)$$ このことが意味するのは、系の状態遷移が、各瞬間の基底状態をほぼ正確に辿っていくということである。

問題解決策:量子断熱計算

このように、量子アニーリングは十分に長い時間を掛けた時間発展を前提としている。しかし現実的に最適化問題を解くには、有限時間の中で計算を遂行しなければならない。この経過時間をτとするなら、系はt = 0からt = τまでの時間発展を前提とすることになる。ハミルトニアンをH(s)と書き換え、$$s = \frac{t}{\tau}$$と書き直すなら、

$$H(t) = \frac{t}{\tau}H_0 – (1 – \frac{t}{\tau})\sum_{i}^{}\sigma_i^x$$

の場合に、

$$H(s) = sH_0 – (1 – s)\sum_{i}^{}\sigma_i^x$$

となる。t = sτであるため、シュレディンガー方程式は次のようになる。

$$i\frac{d}{ds}\mid\psi(s)\rangle = \tau H(s)\mid \psi(s)\rangle$$

これにより、τを大きく設定することによって、十分に長い時間の状態変化を制御することが可能になる。このような十分に長い時間を確保することで最適化アルゴリズムの確実性を保つ方法を、特に「量子断熱計算(quantum adiabatic computation)」、もしくは「断熱量子計算(adiabatic quantum computation)」と呼ぶ。

量子断熱計算における量子系のエネルギー準位を時系列的に測定してみると、基底状態励起状態エネルギー準位が近接する時点があることがわかる。接近していれば、それだけ励起確率が高まる。つまり基底状態を保持することができなくなるということだ。そこで、励起確率を低く保つことが量子断熱計算を成立させる条件となる。τが十分に大きい場合、時刻tにおける波動関数$$\mid \psi (t)\rangle$$は、その時点の基底状態$$\mid 0(t)\rangle$$に近い。したがって、量子断熱計算を成立させる上で求めるべきなのは、$$\mid \langle 0(t) \mid \psi (t) \rangle \mid \approx 1$$となる条件である。

量子断熱定理

この条件を求めるには、量子系の断熱発展に関する「量子断熱定理(quantum adiabatic theorem)」を確認しておかなければならない。物理学者アルバート・ミサイヤが記述した量子断熱定理によれば、ハミルトニアンが十分な時間を掛けて発展した場合に、開始状態がそのハミルトニアンの固有状態ならば、その後の時点でも固有状態を維持する。固有状態から発展し始める系の初期設定が基底状態であるならば、その後の時点tにおける系が励起状態存在する確率は、この定理によって条件付けられることになる。

以下からは量子断熱定理を記述していく。この記述では、正確を期するために、鈴木正(2008)の断熱定理の記述をほぼそのまま踏襲していくこととする。

t=0からt=τまでの$$s = \frac{t}{\tau} \tag{1}$$に依存しているハミルトニアンに関するシュレディンガー方程式

$$i\frac{d}{ds}\mid \psi_{\tau}(s)\rangle = \tau H(s) \mid \psi_{\tau}(s)\rangle \tag{2}$$

に対して、時間発展演算子$$U_{\tau}(s)$$を導入すると、シュレディンガー方程式は次のようになる。

$$i\frac{d}{ds}U_{\tau}(s) = \tau H(s)U_{\tau}(s) \tag{3}$$

ただし時間発展演算子は、次の条件を満たさなければならない。

$$\mid \psi_{\tau}(s)\rangle = U_{\tau}\mid \psi_{\tau}(0)\rangle \tag{4}$$

H(s)の固有エネルギーを$$\epsilon_{l}(s)$$、H(s)の固有状態に対する射影演算子を$$P_{l}(s)$$、任意の状態ベクトルを$$\mid \phi \rangle$$、そしてクロッカーのデルタ(Kronecker delta)を$$\sigma_{ij}$$とすると、

$$H(s)P_{l}(s)\mid \phi\rangle = \epsilon_{l}(s)P_l(s)\mid \phi \rangle \tag{5}$$

$$P_l(s)P_m(s) = \sigma_{lm}P_l(s) \tag{6}$$

となる。

ただし、クロネッカーのデルタは次のように定義される。

$$\begin{align}
\delta_{ij} \ =\
\begin{cases}
1 & (i=j) \\
0 & (i \neq j )
\end{cases}
\end{align} \tag{7}$$

そして確率の条件から、

$$\sum_{l}^{}P_l(s) = 1 \tag{8}$$

したがってハミルトニアンH(s)は、

$$H(s) = \sum_{l}^{}\epsilon_l(s)P_l(s) \tag{9}$$

射影演算子の射影軸をt = 0からt = sへと回転させる軸回転演算子をA(s)とすると、

$$P_l(s) = A(s)P_l(0)A^{\dagger}(s) \tag{10}$$

ここで、A(s)はユニタリー演算子であるため、

$$A(s)A^{\dagger}(s) = 1 \tag{11}$$
$$A^{\dagger}(s)A(s) = 1 \tag{12}$$

これらをsで微分すると、

$$\frac{dA(s)}{ds}A^{\dagger} + A\frac{dA^{\dagger}(s)}{A} = 0 \tag{13}$$

$$\frac{dA^{\dagger}(s)}{ds}A(s) + A^{\dagger}(s)\frac{dA(s)}{A} = 0 \tag{14}$$

$$\left\{i\frac{dA(s)}{ds}A^{\dagger}(s)\right\}^{\dagger} = \left\{-iA(s)\frac{dA^{\dagger}(s)}{ds}\right\}^{\dagger} = i\frac{dA(s)}{ds}A^{\dagger} = -iA\frac{dA^{\dagger}(s)}{ds} \tag{15}$$

K(s)をエルミート演算子として、

$$i\frac{dA(s)}{ds}A^{\dagger}(s) = -iA(s)\frac{dA^{\dagger}(s)}{ds} = K(s) \tag{16}$$

と置くと、軸回転演算子の運動方程式が得られる。

$$i\frac{d}{ds}A(s) = K(s)A(s)\tag{17}$$

$$-i\frac{d}{ds}A^{\dagger}(s) = A^{\dagger}K(s) \tag{18}$$

ここから射影演算子の運動方程式は次のようになる。

$$\frac{d}{ds}P_l(s) = -i (K(s)P_l(s) – P_l(s)K(s)) \tag{19}$$

K(s)の対角行列要素はこれら二つの運動方程式から導かれない。そのためこの運動方程式は任意のエルミート演算子$$\mathcal{O}_l$$による変換

$$K(s) \mapsto K(s) + \sum_{l}^{}P_l(s)\mathcal{O}_l(s)P_l(s) \tag{20}$$

において不変である。そこで対角行列要素を定義するために、全てのlに対して次のような条件を追加する。

$$P_l(s)K(s)P_l(s) = 0 \tag{21}$$

軸回転演算子による軸回転表示は、次のようになる。

$$H^A(s) \equiv A^{\dagger}(s)H(s)A(s) = \sum_{l}^{}\epsilon_l(s)A^{\dagger}(s)P_l(s)A(s) = \sum_{l}^{}\epsilon_l(s)P_l(0) \tag{22}$$

この軸回転表示における時間発展演算子は

$$U_{\tau}^A(s) = A^{\dagger}(s)U_{\tau}(s) \tag{23}$$

となり、次の運動方程式を満たす。

$$i\frac{d}{ds}U_{\tau}^A(s) = i\frac{dA^{\dagger}(s)}{ds}U_{\tau}(s) + iA^{\dagger}(s)\frac{dU_{\tau}(s)}{ds} = (\tau H^A(s) – K^A(s))U_{\tau}^A(s) \tag{24}$$

ここで、$$K^A(s) \equiv A^{\dagger}(s)K(s)A(s) \tag{25}$$である。

$$H^A(s)$$と$$K^A(s)$$は、τから独立している。したがってτが極限になる場合には、

$$i\frac{d}{ds}U_{\tau}^A(s) \approx \tau H^A(s)U_{\tau}^A(s) \tag{26}$$

ここから、$$i\frac{d}{ds}V_{\tau}^A(s) = \tau H^A(s)V_{\tau}^A(s) \tag{27}$$を満たす演算子$$V_{\tau}^A(s)$$を展開することで、

$$V_{\tau}^A(s) = \sum_{l}^{}\eta_{\tau, l}(s)P_l(0) \tag{28}$$を得る。軸回転表示との関連から、

$$i\frac{d}{ds}\eta_{\tau, l}(s) = \tau \epsilon_l(s)\eta_{\tau, l}(s) \tag{29}$$

これを積分すると次のようになる。

$$\eta_{\tau, l}(s) = \exp (-i\tau \phi_l(s)) \tag{30}$$

$$\phi_l(s) \equiv \int_0^s ds’\epsilon_l(s’) \tag{31}$$

したがって、$$V_{\tau}^A(s) = \sum_{l}^{}e^{-i\tau\phi_l(s)}P_l(0) \tag{32}$$

τが∞になると、$$U_{\tau}^A(s) \approx V_{\tau}^A(s) \tag{33}$$

すなわち、

$$U_{\tau}(s) \approx A(s)V_{\tau}^A(s) \tag{34}$$

そこで、$$U_{\tau}^A(s)$$と$$V_{\tau}^A(s) \tag{35}$$の差異と同一性を計算するために、

$$W(s) = V_{\tau}^{A^{\dagger}}(s)U_{\tau}^A(s) = V_{\tau}^{A^{\dagger}}(s)A^{\dagger}(s)U_{\tau}(s) \tag{36}$$

と置くなら、(26)と(28)から、W(s)の運動方程式は次のようになる。

$$i\frac{d}{ds}W(s) = i\frac{d}{ds}V_{\tau}^{A^{\dagger}}(s)U_{\tau}^A(s) + iV_{\tau}^{A^{\dagger}}(s)\frac{d}{ds}U_{\tau}^A(s)$$

$$= -V_{\tau}^{A^{\dagger}}(s)K^A(s)U_{\tau}^{A}(s)$$

$$= -\sum_{l, m}^{}e^{i\tau(\phi_l(s) – \phi_m(s))}P_l(0)K^A(s)P_m(0)W(s)$$

$$= -\sum_{l, m}^{}e^{i\tau (\phi_l(s) – \phi_m(s))}K_{lm}^A(s)W(s) \tag{37}$$

ここで、$$k_{lm}^A(s) \equiv P_l(0)K^A(s)P_m(0)$$

$$= P_l(0)A^{\dagger}(s)K(s)A(s)P_m(0)$$

$$= A^{\dagger}(s)P_l(s)K(s)P_m(s)A(s)\tag{38}$$

$$P_l(s)K(s)P_k(s) = 0 \tag{39}$$より、$$K_{ll}^A(s) = 0 \tag{40}$$となる。

これに対して、次のように積分を施す。

$$F_{\tau, lm}(s) = \int_0^s ds’ e^{i\tau(\phi_l(s’) – \phi_m(s’))}K_{lm}^A(s’)$$

$$= \frac{
\left[e^{i\tau(\phi_l(s’) – \phi_m(s’))}\frac{K_{lm}^A(s’)}{\epsilon_l(s’) – \epsilon_m(s’)} \mid_0^s – \int_0^s ds’ e^{i\tau (\phi_l(s’) – \phi_m(s’))}\frac{d}{ds’}\left[\frac{K_{lm}^A(s)}{\epsilon_l(s’) – \epsilon_m(s’)}\right]\right]}{i\tau} \tag{41}$$

W(s)の運動方程式を積分方程式として再記述すると、

$$W(s) = 1 + i \sum_{i,m}^{}\int_0^sds’e^{i\tau(\phi_l(s’) – \phi_m(s’))}K_{lm}^A(s’)W(s’) \tag{42}$$

これを$$F_{\tau, lm}(s)$$について級数展開すると、

$$W(s) = 1 + i\sum_{l, m}^{}F_{\tau, lm}(s) + \frac{1}{2!}\left(i\sum_{l,m}^{}F_{\tau, lm}(s)\right)^2 + … \tag{43}$$

断熱近似により、

$$W(s) \approx 1 + i\sum_{l, m}^{}F_{\tau, lm} \tag{44}$$

したがって時間発展演算子は次のように再記述できる。

$$U_{\tau}(s) \approx A(s)V_{\tau}^A(s) \left(1 + i\sum_{l, m}^{}F_{\tau, lm}\right) \tag{45}$$

τ → ∞の場合に、$$F_{\tau, lm} \to 0 \tag{46}$$となる。これにより、断熱の諸条件が担保された。

この断熱の諸条件を前提とした上で、ハミルトニアンH(0)の基底状態に対応する状態の時間発展を記述していく。ハミルトニアンの各時点における固有状態を$$\mid n(s)$$とするなら、初期状態は$$\mid \phi_{\tau}(0)\rangle = \mid 0(0)\rangle \tag{47}$$となる。t = τsの時点のハミルトニアンの固有状態とt = 0の時点の固有状態の関係は、$$\mid n(s)\rangle = A(s)V_{\tau}^A(s)\mid n(0)\rangle \tag{48}$$となる。

初期状態からT = τsまでの時間発展を前提とした状態の基底状態からの差異は次のように記述できる。

$$\eta = \sum_{n > 0}^{}\mid \langle n(s)\mid U_{\tau}(s)\mid 0(0)\rangle\mid^2$$

$$= \sum_{n>0}^{}\langle 0(0)\mid U_{\tau}^{\dagger}(s)A(s)V_{\tau}^A(s)\mid n(0)\rangle \langle n(0)\mid V_{\tau}^{A\dagger}(s)A^{\dagger}(s)U_{\tau}(s)\mid 0(0)\rangle$$

$$=\sum_{n>0}^{}\langle 0(0)\mid W^{\dagger}(s)\mid n(0)\rangle\langle n(0)\mid W(s)\mid 0(0)\rangle \tag{49}$$

この差異は、時間発展した状態の中に、基底状態とは異なる励起状態が含まれている割合に対応している。

$$U_{\tau}(s) \approx A(s)V_{\tau}^A(s) \left(1 + i\sum_{l, m}^{}F_{\tau, lm}\right)$$より、$$\frac{1}{\tau} \tag{50}$$までの近似として、

$$\eta \approx \sum_{n \neq 0}^{}\langle 0(0)\mid F_{\tau 0 n}^{*}(s)\mid n(0)\rangle \langle n(0) \mid F_{\tau n0}(s)\mid 0(0)\rangle \tag{51}$$

が得られる。

(41)より、(25)の定義を前提に、(10)〜(15)から、次のような再記述が可能になる。

$$\langle n(0)\mid F_{\tau n0}(s)\mid 0(0)\rangle$$

$$=\int_0^sds’e^{i\tau (\phi_n(s’)-\phi_0(s’))}\langle n(0)\mid P_n(0)A^{\dagger}(s’)K(s’)A(s’)P_0(0)\mid 0(0)\rangle$$

$$=\int_0^sds’e^{i\tau (\phi_n(s’)-\phi_0(s’))}\langle n(0)\mid A^{\dagger}(s’)i\sum_{l}^{}\frac{dP_l(s’)}{ds’}P_l(s’)A(s’)\mid 0(0)\rangle$$

$$=i\left(\int_0^sds’e^{i\tau (\phi_n(s’)-\phi_0(s’))}\langle n(0)\mid A^{\dagger}(s’)\sum_{l}^{}\frac{dP_l(s’)}{ds’}A(s’)P_l(0)\mid 0(0)\rangle\right)$$

$$=i\left(\int_0^sds’e^{i\tau (\phi_n(s’)-\phi_0(s’))}\langle n(0)\mid A^{\dagger}(s’)\frac{dP_0(s’)}{ds’}A(s’)\mid 0(0)\rangle\right) \tag{52}$$

ただし、(17)〜(19)より、

$$i\sum_{l}^{}\frac{dP_l(s)}{ds}P_l(s) = \sum_{l}^{}(K(s)P_l(s)^2 – P_l(s)K(s)P_l(s)) = K(s) \tag{53}$$

$$-i\sum_{l}^{}\frac{dP_l(s)}{ds}P_l(s) = -\sum_{l}^{}(K(s)P_l(s)^2 – P_l(s)K(s)P_l(s)) = K(s) \tag{54}$$

(53)と(54)から、

$$P_l(s)K(s)P_m(s) = i\sum_{n}^{}P_l(s)\frac{dP_n(s)}{ds}P_n(s)P_m(s) = iP_l(s)\frac{dP_m(s)}{ds}P_m(s) \tag{55}$$

$$P_l(s)K(s)P_m(s) = -i\sum_{n}^{}P_l(s)P_n(s)\frac{dP_n(s)}{ds}P_m(s) =-iP_l(s)\frac{dP_l(s)}{ds}P_m(s)\tag{56}$$

(55)と(56)から、

$$P_l(s)\frac{dP_m(s)}{ds}P_m(s) = -P_l(s)\frac{dP_l(s)}{ds}P_m(s) \tag{57}$$

(9)のハミルトニアンに$$P_l(s) = P_l(s)^2$$を代入して微分すると、

$$\frac{dH(s)}{ds} = \sum_{l}^{}\frac{d\epsilon_l(s)}{ds}P_l(s) + \sum_{l}^{}\epsilon_l(s)\left(\frac{dP_l(s)}{ds}P_l(s) + P_l(s)\frac{dP_l(s)}{ds}\right) \tag{58}$$

となる。(58)の行列要素は、

$$P_l(s)\frac{dH(s)}{ds}P_m(s) = \sum_{n}^{}\epsilon_n(s)P_l(s)\left(\frac{dP_n(s)}{ds}P_n(s) + P_n(s)\frac{dP_n(s)}{ds}\right)P_m(s) + \sum_{n}^{}\frac{\epsilon_n(s)}{ds}P_l(s)P_n(s)P_m(s)$$

$$=\epsilon_m(s)P_l(s)\frac{dP_m(s)}{ds}P_m(s) + \epsilon_l(s)P_l(s)\frac{dP_l(s)}{ds}P_m(s) + \sigma_{lm}\frac{d\epsilon_l(s)}{ds}$$

$$=(\epsilon_m(s) – \epsilon_l(s))P_l(s)\frac{dP_m(s)}{ds}P_m(s) + \sigma_{lm}\frac{d\epsilon_l(s)}{ds} \tag{59}$$

となる。(52)と(59)から、

$$\langle n(0)\mid A^{\dagger}(s)\frac{dP_0(s)}{ds}A(s)\mid 0(0)\rangle$$

$$= e^{-i\tau (\phi_n(s) – \phi_0(s))}\langle n(s)\mid P_n(s)\frac{dP_0(s)}{ds}P_0(s)\mid 0(s)\rangle$$

$$=e^{-i\tau (\phi_n(s) – \phi_0(s))}\frac{-\left(\langle n(s) \mid \frac{dH(s)}{ds}\mid 0(s)\rangle\right)}{\epsilon_n(s) – \epsilon_0(s)}$$

$$=\frac{-\left(\langle \bar{n}(s)\mid\frac{dH(s)}{ds}\mid \bar{0}(s)\rangle\right)}{\epsilon_n(s) – \epsilon_0(s)} \tag{60}$$

ここで、$$\mid \bar{n}(s)\rangle \equiv e^{i\tau\phi_n(s)}\mid n(s)\rangle$$は$$\mid n(s)\rangle$$における$$\mid n(0) \rangle$$からの相対的な位相を消去した状態となる。

エネルギー固有値差異を$$\omega_{lm}(s) \equiv \epsilon_l(s) – \epsilon_{m}(s)$$と置くと、(52)は次のように再記述できる。

$$\langle n(0) \mid F_{\tau, n0}(s)\mid 0(0)\rangle = \int_0^s ds’ e^{i\tau(\phi_n(s’) – \phi_0(s’)}\frac{- \left(\langle \bar{n}(s’)\mid \frac{dH(s’)}{ds}\mid \bar{0}(s’)\rangle\right)}{\omega_{n0}(s’)} \tag{61}$$

この(61)の積分が実行できるのは、$$\omega_{n0}(s)$$と$$\frac{dH(s)}{ds}$$の行列要素が共に時間に依存しない場合である。この場合、

$$\mid \langle n(0)\mid F_{\tau, n0}(s)\mid 0(0)\rangle\mid^2 = \frac{1}{\tau^2}\frac{2}{\omega_{n0}^4}\mid \langle n(s)\mid \frac{dH(s)}{ds}\mid 0(s)\rangle \mid^2(1 – \cos \omega_{n0}\tau s) \tag{62}$$

となる。一方、$$\omega_{n0}(s)$$と$$\frac{dH(s)}{ds}$$が時間に依存する場合には、十分な時間で系が発展する時、つまり時間変化が緩やかである場合に、(61)の積分は評価できるようになる。

$$\mid \langle n(0)\mid F_{\tau, n0}(s)\mid 0(0)\mid^2 \lesssim \frac{1}{\tau^2}\frac{\max \left[\mid \langle \bar{n}(s)\mid \frac{dH(s)}{ds}\mid \bar{0}(s)\rangle \mid \right]^2}{\min [\omega_{n0}(s)]^4} \tag{63}$$

(63)を前提とすれば、(43)から(44)への断熱近似が成立するのは、次の条件が満たされる場合である。

$$\frac{1}{\tau^2}\frac{\max \left[\mid \langle \bar{n}(s)\mid \frac{dH(s)}{ds}\mid \bar{0}(s)\rangle \mid \right]^2}{\min [\omega_{n0}(s)]^4} \lll 1 \tag{64}$$

したがって、断熱近似が正当化されるための十分な経過時間τの条件は、次のようになる。

$$\tau \gg \frac{\max \left[\mid \langle \bar{1}(s)\mid \frac{dH(s)}{ds}\mid \bar{0}(s)\rangle \right]}{\min [\omega_{10}(s)]^2} \tag{65}$$

ここで、$$\langle \bar{1}(s) \mid$$は、各時点tにおける第一励起状態に対応している。そして$$\omega_{10}(s)$$は基底状態と第一励起状態の「エネルギーギャップ(energy gap)」に対応している。(64)を念頭に置けば、エネルギーギャップの最小値は次のように見積もることができる。

$$\tau \thicksim \frac{1}{\min [\omega_{10}(s)]^2} \tag{66}$$

この関係は、量子断熱計算における断熱性が、基底状態と第一励起状態の間のエネルギーギャップと逆比例していることを言い表している。

問題解決策:量子相転移

上述した断熱定理を前提とすれば、組み合わせ最適化問題を解くために必要となる時間τは、エネルギーギャップ計算することで評価できる。エネルギーギャップが小さければ、組み合わせ最適化に必要となる経過時間τは長くなる。この関係は、系のサイズが極限となる場合にとりわけ重要となる。何故なら、エネルギーギャップの分布は、「量子相転移(quantum phase transition)」の有無と関わるためである。相転移が温度の「ゆらぎ(Fluctuations)」によって生み出されるのに対して、量子相転移量子系の「ゆらぎ(Fluctuations)」によって生み出される。量子相転移とは、絶対零度の温度において、磁場や圧力などのような外部環境の変化によって量子系の基底状態に伴う相転移意味する。

量子相転移点においては、一般的にエネルギーギャップが極めて小さくなることが知られている。問題のサイズをNとするなら、熱力学的な極限N → ∞ では、エネルギーギャップが0になる。Nが大きな有限の値である場合、エネルギーギャップが0へと近接していく過程を二つの種別に区別することができる。

エネルギーギャップΔがNのべきに比例している場合、すなわち$$\delta \propto N^{-a}, \ a > 0$$の場合には、経過時間τはNの多項式に比例して増大する。こうした状況では、組み合わせ最適化は困難ではない。一方、ΔがNの指数関数に比例している場合、すなわち$$\delta \propto e^{-bN}, \ b > 0$$の場合には、τはNの指数関数に比例して増大していくことになる。したがって、この状況では組み合わせ最適化が困難となる。

ランダムエネルギーモデル

この関連から量子論意味論は、この組み合わせ最適化が困難となる具体例も主題としている。その制約可能性の一例として挙げられるのは、「ランダムエネルギーモデル(Random energy model)」に対する量子断熱計算を実行した場合である。ランダムエネルギーモデルのハミルトニアンは次のようになる。

$$H_0 = -\sum_{i_p}^{}J_{i_1, i_2, …j_p}\sigma_{i_1}\sigma{i_2}…\sigma{i_3}$$

ここで、右辺の和はN個の中からp個のスピンを選択する組み合わせを示している。相互作用を表現している$$J_{i_1, i_2, …j_p}$$は、ガウス分布に従うアトランダムな値となる。ランダムエネルギーモデルは、この極限の条件で、そのエネルギー固有値が独立なガウス分布に従うことが知られている。この系に横磁場機能を導入することで、エネルギーギャップを解析すると、エネルギーギャップは次のようになる。

$$\min \Delta(t) \propto \exp (-bN) \ \ (b > 0)$$

エネルギーギャップをΔとするなら、断熱定理により、経過時間τとの関係は以下のようになる。

$$\tau \thicksim \frac{1}{\min [\Delta]^2}$$

したがって、組み合わせ最適化の経過時間はサイズNに対して指数関数的に増大していくことがわかる。

問題解決策:量子断熱計算と量子アニーリングの区別

それ故に、古典的なアルゴリズムでは解決困難な問題の全てが量子断熱計算で解決可能になるとは限らない。これはある意味量子断熱計算量子アニーリングに対する期待外れとなっている。しかし、量子論意味論は、この期待外れに対して量子断熱計算量子アニーリング差異を強調することによって、認知的な期待構成している。その期待によれば、量子アニーリングアルゴリズムは、量子断熱計算のように、各時点の瞬間的な基底状態を辿る断熱変化を自明化している訳ではない。断熱定理に準拠した量子アニーリングは、あくまで偶発的な選択肢の一つに過ぎないのである。

量子ジャルジンスキー・アニーリング

2018年に大関真之が提案した量子アニーリングの特殊なアルゴリズムは、断熱定理に準拠していない量子アニーリングの一種として例示できる。それは、1997年にクリス・ジャルジンスキーによって提唱された統計力学の「ジャルジンスキー等式(Jarzynski equality; JE)」を応用した量子アニーリングである。ジャルジンスキー等式とは、熱平衡状態間の非平衡仕事量Wとその操作によるヘルムホルツの自由エネルギーFの変化量ΔFの間に成立する恒等式である。

$$\langle e^{-\beta W} \rangle = \frac{Z_{\tau}(\beta)}{Z_0(\beta)} \tag{1}$$

ここで、ブラケット表記は、初期平衡状態から開始する所定の過程における全ての実現化に対するアンサンブル平均を示す。初期状態と最終状態のハミルトニアンにおける分配関数は、それぞれ逆温度βを伴わせた$$Z_0(\beta)$$と$$Z_{\tau}(\beta)$$で表記した。以下ではこの等式を古典的な系である熱浴(a heat bath)に適用した上で、それを量子論意味論に対応付けていく。

有限時間0 ≤ t ≤ τにおける非熱平衡過程を想定しよう。温度の変動はマスター方程式に従うと見做せる。この変動の過程を離散時間で表すなら、$$t_{k+1} – t_{k} = \sigma t, \ t_0 = 0, \ t_n = \tau$$となる。時刻$$t_k$$に系が状態$$\sigma_k$$になる確率は、$$P(\sigma_k; t_k)$$となる。単位時間$$\sigma t$$ごとの遷移確率は$$M(\sigma_{k+1}\mid \sigma_k; t_k)$$とする。(1)の等式によれば、ハミルトニアンの変化に付属したエネルギー差異だけが仕事として定義される。しかしこの等式は以下のように仕事を定義した場合の逆温度に関しても同様に成り立つ。

$$-\beta W(\sigma_k; t_k) = -(\beta(t_{k+1} – \beta(t_k))E(\sigma_k) \tag{2}$$

ここで、$$E(\sigma)$$は特定の状態$$\sigma$$におけるコスト関数の値となる。古典的なハミルトニアンの$$H_0$$を意味する。この逆温度の関連から観れば、ジャルジンスキー等式の左辺は次のように再記述できる。

$$\langle e^{\beta W}\rangle = \sum_{\sigma_k}^{}\prod_{k=0}^{n-1}\{e^{-\beta W(\sigma_{k+1};t_k)}e^{\sigma t M(\sigma_{k+1}\mid \sigma_k;t_k)}\} \times \tilde{P}(\sigma_0; t_0) \tag{3}$$

ここで、$$\tilde{P}(\sigma_0; t_0)$$は初期の平衡分布を表す。初期条件は平衡分布として設定される。もし遷移を表す$$\exp (\sigma t M(\sigma_{k+1}\mid \sigma_k;t_k))$$が除去されれば、ジャルジンスキー等式が成り立つ。何故なら、$$-\beta W(\sigma_{k+1};t_k)$$のkに対する総和は、$$-(\beta (t_n) – \beta(t_0))E(\sigma_0)$$となるためだ。だがここに遷移を示す表記が加わると、上記の等式は単純なジャルジンスキー等式以上の機能を持つ。

一見すれば、ジャルジンスキー等式は古典的な熱力学的な系に適用できるに過ぎない。この等式と量子アニーリングとの間には、まだ乖離がある。そこで大関は、古典的なd次元の系の熱力学的な特性をd次元の量子系における基底状態の特性へと対応付けるために、ローランド・ソンマらの古典的な統計力学に対する量子論的なアプローチを援用している。これにより、上述した確率的な力学系の瞬間的な平衡状態がある種の基底状態として説明できる、ある特殊な量子系を記述することが可能になる。そうした特殊な量子系におけるハミルトニアンの一般的な形式は次のようになる。

$$H_q(\sigma ‘ \mid \sigma ;t) = \delta_{\sigma ‘, \sigma} – e^{\frac{\beta (t)H_0(\sigma ‘)}{2}}M(\sigma ‘ \mid\sigma ;t)e^{-\frac{\beta (t) H_0(\sigma)}{2}} \tag{4}$$

このハミルトニアンは次のような基底状態を有している。

$$\mid\mathbb{\Psi}_{eq}(t)\rangle = \frac{\sum_{\sigma}^{}e^{-\frac{\beta (t) H_0(\sigma)}{2}}\mid \sigma \rangle}{\sqrt{Z(t)}} \tag{5}$$

物理量A(σ)の量子的な期待値は、$$\mid\mathbb{\Psi}_{eq}(t)\rangle$$であって、同じ物理量に関する熱力学的な期待値に等しい。基底状態エネルギーはゼロとなる。このことは、「詳細釣り合いの条件(detailed-balance condition)」に照応している。つまり、熱平衡におけるミクロな状態変化を想定した場合に、その系によるどの過程の生起頻度も、その逆過程の起こる頻度と等しいことと照応しているのである。一方で励起状態は、その要素が正である実正方行列には唯一の最大実固有値存在し、それに対応する固有ベクトルの諸要素は厳密に正であるという「ペロン=フロベニウス定理(Perron–Frobenius theorem)」により、正定値の固有値となる。

上記の特殊な量子系によって、疑似的な平衡状態確率過程を量子アニーリングの断熱的な量子力学系として扱うことが可能になる。温度T → ∞、β → ∞に対応するパラメタを設定することで、上述した特殊な量子系を量子アニーリングとの関連から再記述してみよう。この条件は、通常の量子アニーリングと同様に、一様な線形結合を伴う些細な基底状態を与える。もしT → 0の調節が非常に緩やかであるなら、$$H_q$$における基底状態を得ることができる。それは$$H_0$$における非常に低い温度の平衡状態で、解決しようとしている最適化問題のコスト関数指し示している。注意しなければならないのは、このアルゴリズムでは、ジャルジンスキー等式の通常の定式化で想定されているアンサンブルではなく、単一の量子状態を利用しているということだ。

この特殊な量子系を利用することで、ジャルジンスキー等式と同じ観点からアルゴリズム設計していくことになる。最初に、通常の量子アニーリングと同じように、一様な線形結合を利用することで単純な基底状態構成する。古典力学量子力学を対応付ける観点から観れば、この初期状態は高温の平衡状態$$\beta (t_0) \ll 1$$において、$$\mid \mathbb{\Psi}_{eq}(t_0)\rangle \propto e^{-\frac{\beta (t_0) H_0(\sigma)}{2}}\mid \sigma \rangle \tag{6}$$ を表している。もし波動関数$$\mid \mathbb{\Psi}_{eq}(t_k)\rangle$$に$$W(\sigma_k ; t_k)$$を適用するなら、状態は逆温度$$\beta(t_{k+1})$$を付随させた平衡分布に対応した状態へと変異する。時間発展演算子$$U(\sigma ‘ \mid \sigma ; t_{k+1}) = \exp \frac{(-i\delta tH_q(\sigma ‘ \mid \sigma ; t_{k+1})}{h} \tag{7}$$を導入するなら、$$H_q(\sigma ‘ \mid \sigma ; t_{k+1})$$の基底状態となるため、この状態は変化しない。上記の手順を反復することで得られる状態は、次のようになる。

$$\mid \mathbb{\Psi}(t_n)\rangle \propto \prod_{k=0}^{n-1}\{W(\sigma_{k+1};t_k)U_{k+1}(\sigma_{k+1}\mid \sigma_k ; t_k)\}\mid \mathbb{\Psi}_{eq}(t_0)\rangle \tag{8}$$

(8)は、指数行列$$\delta t M(\sigma_{k+1}\mid \sigma_k ;t_k)$$が時間発展演算子$$U(\sigma_{k+1}\mid\sigma_k ; t_k)$$に置換されているだけで、他の部分は(3)と等価である。系が状態$$\mid \mathbb{\Psi}(t_n)\rangle$$に達した後、状態σ’への投影によって、得られた状態を測定することが可能になる。その確率は$$\mid \sigma ‘\mid \mathbb{\Phi}(t_n)\rangle\mid ^2$$となる。このことが意味するのは、$$\mid \mathbb{\Psi}(t_n)\rangle \propto \mid \mathbb{\Psi}_{eq}(t_n)\rangle$$であるために、探索している基底状態もまた$$\exp(-\beta (t_n)H_0)$$に比例しているということである。もし$$\beta(t_n) \gg 1$$とするならば、$$H_0$$の基底状態を効率的に得ることができる。

確かに、上記の時間発展演算子$$U(\sigma_{k+1}\mid \sigma_k ; t_k)$$は導入する必要が無いようにも思える。だがこの演算子は、量子的なゆらぎによる状態変化を指し示している。時間発展演算子の機能は、人工的な制御を指し示すことではない。そうではなく、量子計算過程の量子的な性質による変化を記述することこそが、この演算子の機能となる。

このように、ジャルジンスキー等式を採り入れた量子アニーリングは、量子断熱計算に依存することなく、量子アニーリング計算を可能にしている。そのため、計算時間エネルギーギャップに左右されない。断熱定理から独立しているこのアルゴリズム量子アニーリング設計するのならば、パラメタτの調節にも悩まされないで済む。こうして量子アニーリング機能的に拡張させて観ると、もはや量子断熱計算量子アニーリングを同一視する理由は何も無いことが明確化する。

プロトタイプの開発:アニーリング

ここに来て我々は、量子論意味処理規則を方向付けているのが、必ずしも量子力学的な理論方法プログラムによる期待構造だけではないということに気付くことになる。方法プログラムにおいては確かに、量子力学の科学・学問的なコミュニケーションは、それ固有の測定や観測の技法を踏襲し続けている。量子ゼノン効果を観測するためには、やはり量子力学的に形式化された測定方法を採用することが要求されるであろう。しかしこれに対して理論プログラムにおいては、むしろ量子論意味論は開放的となっている。先に観たように、量子断熱計算量子アニーリング区別を導入する上では、統計力学熱力学意味論として主題化されていたジャルジンスキー等式の理論が多分に有用となっていた。統計力学熱力学意味論の中では、機能的に等価主題が、別のあり方でもあり得る形式で貯蓄されているはずである。それ故に、量子論意味論期待外れが観察された場合に、尚も統計力学熱力学に対する認知的な期待構成されるというのは、何も不思議なことではない。

量子力学統計力学、そして熱力学における理論プログラムに対して、機能的に等価なモデルを観察することは、実り多き発見を可能にする。そうした等価機能主義的な観察によって、実務的な比較の観点を設定できるようになるのである。統計力学熱力学では計算速度計算コストの関連から期待外れに終わっていたアルゴリズムであっても、量子力学的な拡張へと認知的に期待することによって、この問題を解消することが可能になる場合もある。逆に、「量子コンピュータ(Quantum computer)」での実装を想定した量子力学的に記述されたアルゴリズムであっても、統計力学熱力学による機能的に等価アルゴリズムの中に落とし込むことによって、量子論意味論による恩恵を受けたアルゴリズムをソフトウェア工学だけで模倣することも可能になる。

シミュレーテッドアニーリングのアルゴリズム

統計力学熱力学のモデルとしては、時にはその性能面で期待外れに終わっていた過去アルゴリズムが、量子力学的なアルゴリズムとの比較対象として再認される場合がある。例えば、量子のゆらぎを利用するのが量子アニーリングならば、熱のゆらぎを利用するのが「シミュレーテッドアニーリング(Simulated Annealing)」だ。シミュレーテッドアニーリングモンテカルロ法の一種として位置付けできる。それは通常のイジングモデルによる確率過程のシミュレーションで、温度をモンテカルロ・ステップ数としての時間関数として、徐々に高温状態から低温状態に移行させていく。

シミュレーテッドアニーリングは、統計力学ボルツマン分布の生成方法を利用することにより、状態の確率的な探索を可能にする。熱力学第ゼロの法則に倣い、初期においては乱雑であった分布が、熱平衡状態を迎えることで、一定の状態に落ち着いていくような確率分布を生成する。ここでいう「初期においては乱雑」は、「等確率の原理(principle of equal a priori probabilities)」を前提としている。この原理においては、孤立したマクロな系では、十分に長い時間で観測すると、ミクロ事象として可能な全ての量子状態が等価な確率で実現していると仮定される。

熱平衡状態を迎えるのは、一般にマクロ事象で観測される物体が、高いエネルギーから中間状態を経て徐々に低いエネルギーへと状態遷移していくことで成り立つ。シミュレーテッドアニーリングは、以上のような熱力学のシミュレーションによって、最初はほぼアトランダムに近い判断基準で満遍なく探索し、徐々に的を絞りながら探索を反復していくアルゴリズムになる。

シミュレーテッドアニーリングの探索アルゴリズムにおける初期状態は次のようになる。有限集合をSとして、Sにおいて定義される実数のコスト関数をJと置く。$$S^{*} \subset S$$をコスト関数Jの大域最小の集合とする。これは S の適切な部分集合として想定される。どの$$i \in S$$においても、iの近傍としての集合と呼べる$$S(i) \subset S – \{ i \}$$が存在する。各iにおいて、正の係数$$q_{ij}, \ j \in S(i)$$が存在する。この時、$$\sum_{j \in S(i)}^{}q_{ij} = 1$$となる。$$i \in S(j)$$である限りにおいて、$$j \in S(i)$$であると想定される。いわゆる「冷却スケジュール(cooling schedule)」として、非増加関数$$T: N \rightarrow (0, \infty)$$を想定する。このNは、正の数値を意味する。そしてT(t)は、時点tにおける温度Tを意味する。最後に、状態を初期化する。これにより、$$x(0) \in S$$となる。

上記の概念の各要素を前提とすれば、シミュレーテッドアニーリングアルゴリズムは離散時間の非均質的なマルコフ連鎖x(t)を構成する。もし現在の状態x(t)がiと等価であれば、アトランダムに、iの近傍jを選択することになる。この場合の確率は、選択されたどの特定の$$j \in S(i)$$においても、$$q_{ij}$$となる。一度jが選択されれば、次回の状態x(t+1)は、次のように規定される。

$$\begin{eqnarray}
\left\{
\begin{array}{l}
x(t+1) = j \ (J(j) \leq J(i)) \\
x(t+1) = j \ \left(with \ \ probability \ \ \exp \left\{-\frac{(J(i) – J(j))}{T(t)} \right\}\right) \\
x(t+1) = i \ (otherwise)
\end{array}
\right.
\end{eqnarray}$$

シミュレーテッドアニーリング確率分布を定式化すれば、次のようになる。

$$P[x(t + 1) = j|x(t) = i] = q_{ij} \exp \left[-\frac{1}{T(t)} \max \{0, J(j) – J(i) \} \right] \ if \ j \neq i, j \in S(i)$$

また、もし$$j \neq i$$かつ$$j \notin S(i)$$の場合、$$P[x(t + 1) = j|x(t) = i] = 0$$となる。シミュレーテッドアニーリングアルゴリズムの判断根拠の背景にあるのは、温度T(t)が定数値Tを保った非均質的なマルコフ連鎖$$x_T(t)$$として想定できる。もしマルコフ連鎖を規約かつ非周期的であると仮定し、全てのiと全てのjにおいて、$$q_{ij} = q_{ji}$$が成り立つなら、$$x_T(t)$$は可逆なマルコフ連鎖となる。そしてこの確率分布は次のようになる。

$$\pi_{T}(i) = \frac{1}{Z_T} \exp \left[- \frac{J(i)}{T}\right], \ i \in S$$

これは統計力学一般で「ギブス分布(Gibss distribution)」として知られている。ここで、$$Z_T$$は規格化定数に他ならない。Tがゼロに近付けば、この確率分布$$\pi_{T}$$はコスト関数Jの大域最小となる集合$$S^{*}$$に集約される。このことは、$$q_{ij} = q_{ji}$$という条件が平常に成り立つ場合に妥当となる。

組み合わせ最適化問題の関連で言えば、非常に小さなTにおいて、分布$$\pi_{T}$$に追従したデータポイントのサンプルを生成することによって、高い確率集合Sの最適な要素を生成することが可能になる。このアルゴリズムにおいて困難となるのは、Tが非常に小さい時、マルコフ連鎖$$x_T(t)$$が熱平衡状態に到達するまでに要する時間が過大になるということである。ここでいうTは、一回の観測ごとに進捗する時間の進み具合を意味する。そのためTが非常に小さいということは、非常に細かい粒度で時点が区別されていることを意味する。

シミュレーテッドアニーリングアルゴリズムでは、この計算時間に対する対処療法(remedy)として、先述した「冷却スケジュール」という概念が導入される。この概念の機能は徐々にT(t)の値を下げていくことにある。単に自然現象として冷却されていくのを待つのではなく、人為的に温度を下げていくことによって、先の計算時間問題を解消していく。

量子コンピュータの古典的なシミュレーションとしての量子モンテカルロ法

量子アニーリングシミュレーテッドアニーリングの収束速度比較することは、量子論意味論においても、重要な主題となっている。何故なら、もし非量子力学的なモデルの収束速度量子力学的なモデルのそれを上回るなら、量子コンピュータの開発に投資する必然性が無いということが、露呈するためである。

実際、機能的等価性の観点から観れば、既に量子コンピュータの開発に挑戦することは偶発的な選択肢となっている。例えば「量子モンテカルロ法(Quantum Monte Carlo method)」は、古典的なコンピュータ量子アニーリングを実現するために、最も早期に提唱されたアルゴリズムの一つである。それは本来、熱平衡状態を調査するために設計されたアルゴリズムだ。しかしその横磁場時間と共に変化させていく際に、このアルゴリズム量子アニーリングの古典的なシミュレーションとして機能するようになる。

概要を確認しておこう。上述した横磁場イジングモデルのハミルトニアンをHとして、この系に関連するある物理量qの熱平衡量を

$$\langle q \rangle = \frac{\mathrm{Tr}qe^{-\beta H}}{\mathrm{Tr}e^{-\beta H}}$$

とするなら、Hが対角行列であった場合、$$e^{-\beta H}$$もまた対角行列となる。Hの対角要素を$$E_i$$とするなら、各行列要素は、$$(e^{-\beta H})_{ii} = e^{-\beta E_i}$$となる。しかしHが非対角要素を持つ場合には、$$(e^{-\beta H})_{ij} \neq e^{-\beta H_{ij}}$$となることが知られている。これは、任意の指数iに対して、$$e^{i} = \sum_{m=0}^{\infty}\frac{1}{m!}i^m$$と、行列の累乗を計算せざるを得なくなるためである。したがってHのサイズが大きければ、モンテカルロ法計算困難に陥る。

そこで量子モンテカルロ法では、「トロッタ・鈴木分解(Trotter-Suzuki decomposition)」による経路積分を採用している。これにより、分配関数は次のように得られる。

$$Z = \mathrm{Tr}e^{-\beta H} \equiv \mathrm{Tr}e^{-\beta(H_0 + H_{\tau})} = \sum_{\sigma}^{}\langle \sigma \mid e^{-\beta(H_0 + H_{\tau})} \mid \sigma \rangle$$

ここで、mを十分に大きな数とするなら、次のような関係が成り立つ。

$$\exp \left[ – \frac{1}{m} \beta H \right] \exp \left[- \frac{1}{m} \beta (H_0 + H_{\tau}) \right] e^{-\frac{1}{m}\beta H_0}e^{-\frac{1}{m}\beta H_{\tau}} + \mathcal{O}\left(\left(\frac{\beta}{m}\right) ^2 \right)$$

したがって分配関数Zは次のように再記述できる。

$$Z = \sum_{\sigma_k = \pm 1}^{}\langle \sigma_1 \mid e^{-\beta H_0 \frac{1}{m}} \mid \sigma ‘_1 \rangle \langle \sigma_1 ‘ \mid e^{-\beta H_{\tau}\frac{1}{m}}\mid \sigma_2\rangle \\
\times \langle \sigma_2 \mid e^{-\beta H_0 \frac{1}{m}} \mid \sigma ‘_2 \rangle \langle \sigma_2 ‘ \mid e^{-\beta H_{\tau}\frac{1}{m}}\mid \sigma_3\rangle \\
\times \langle \sigma_3 \mid e^{-\beta H_0 \frac{1}{m}} \mid \sigma ‘_3 \rangle \langle \sigma_3 ‘ \mid e^{-\beta H_{\tau}\frac{1}{m}}\mid \sigma_4\rangle \\
\times … \\
\times \langle \sigma_n \mid e^{-\beta H_0 \frac{1}{m}} \mid \sigma ‘_n \rangle \langle \sigma_n ‘ \mid e^{-\beta H_{\tau}\frac{1}{m}}\mid \sigma_1\rangle$$

ここで、$$\mid \sigma_k \rangle$$はL個のスピン系の直積空間で、

$$\mid \sigma_k \rangle = \mid \tilde{\sigma}_{1, k}\rangle \otimes \mid \tilde{\sigma}_{2, k}\rangle \otimes … \otimes \mid \tilde{\sigma}_{L, k}\rangle$$

となる。$$H_0$$が対角行列であることから、

$$\tilde{\sigma}_j^z \mid \sigma_k \rangle = \tilde{\sigma}_{j, k} \mid \sigma_k\rangle$$

したがって、

$$\langle \sigma_k \mid e^{-\beta H_0 \frac{1}{m}} \mid \sigma ‘_k \rangle = \exp \left(\frac{\beta J}{m}\sum_{j=1}^{n}\tilde{\sigma}_{j, k}\tilde{\sigma}_{j+1, k}\right)\prod_{j=1}^{n}\delta(\tilde{\sigma}_{j,k}\tilde{\sigma}’_{j,k})$$

$$\langle \sigma_k ‘ \mid e^{-\beta H_{\tau}\frac{1}{m}} \mid \sigma_{k+1}\rangle =
\left[
\frac{
\sinh \left(\frac{2\beta \Gamma}{m}\right)
}
{2}
\right]^{\frac{2}{n}}
\exp \left(
\frac{
\log \cosh \left(
\frac{\beta \Gamma}{m}\sum_{j=1}^{n}\tilde{\sigma}_{j,k}\tilde{\sigma}_{j, k+1}
\right)
}
{2}
\right)
$$

がそれぞれ成立することがわかる。これらを前提とすれば、分配関数Zはmをトロッタ数として、次のように再記述できる。

$$Z = \lim_{m \to \infty}^{}
\left[
\frac{
\sinh \left(\frac{2\beta \Gamma}{m}\right)
}
{2}
\right]^{\frac{2}{n}}
\sum_{\sigma_{j, k} = \pm 1}^{} \exp \left[
\sum_{j = 1}^{n} \sum_{k=1}^{m} \left(
\frac{\beta J}{m}\tilde{\sigma}_{j,k}\tilde{\sigma}_{j+1, k}
\right) + \frac{
\log \cosh \left(
\frac{
\beta \Gamma
}
{m}
\right)
\tilde{\sigma}_{j,k}\tilde{\sigma}_{j+1, k}
}
{2}
\right] $$

この記述が指し示しているのは、d次元の横磁場イジングモデル分配関数が、d+1次元の通常のイジングモデル分配関数と等価であるということだ。そのため、d次元の横磁場イジングモデルの状態を求めるには、d+1次元の通常のイジングモデルの状態を計算すれば良いということになる。つまり量子系の安定状態を、その量子系よりも1次元高い古典系の安定状態として近似できるのである。

もしこの量子モンテカルロ法機能で十分要求が満たされるのならば、量子コンピュータのような特殊な基盤は必要無くなる。ソフトウェアのアーキテクチャ設計が可能ならば、それで十分となる。

ただし、シミュレーテッドアニーリング量子モンテカルロ法における時間変数と量子アニーリングにおける時間変数との間には、無視できないほどの大きな差異がある。モンテカルロ法における確率過程の時間はモンテカルロ・ステップ数に過ぎないのに対して、量子アニーリングにおける計算過程の時間シュレディンガー方程式の物理的な時間意味している。そのため、シミュレーテッドアニーリングの収束速度量子アニーリングの収束速度比較する場合には、実験時に双方の時間変数の比較可能性を担保する別の指標を導入しなければならなくなる。一方、量子モンテカルロ法による量子アニーリングを実行する場合には、経過時間を極めて緩やかに設定しなければならない。つまり断熱条件を満たすほどの極めて遅い時間変化に制約しなければならなくなるため、量子モンテカルロ法の収束速度は最初から遅いことが推測できる。

アニーリングの実装

以上のような見立てから、このWebサイトでは、量子論意味論を見据えた上で、アニーリング関連のモデルを設計して実装している。コードは以下のリポジトリに配置している。

これにより、ソフトウェアで量子力学的なアルゴリズムをシミュレートすると共に、他の統計力学熱力学のモデルを前提としたアルゴリズムと、その収束速度比較していく。その上で、制限ボルツマンマシン深層ボルツマンマシン強化学習などのようなモンテカルロ法から影響を受けている統計力学的なモデルとの接続可能性も検証していく。

派生問題:<メディアとしての統計力学>は如何にして可能になっているのか

トロッタ・鈴木分解によって導入されている量子モンテカルロ法やジャルジンスキー等式を応用した量子アニーリング観察すれば明らかなように、量子論意味論においては、しばしば「古典-量子の対応付け(classical-quantum mapping)」が遂行されている。それは分配関数の処理に代表される計算複合性の縮減を志向した形式として導入されている。そしてその際、反復的に導入されるのが、マクスウェル-ボルツマン-ギブスの理念に連なる統計力学的な問題解決策である。

量子力学の観点から観れば、統計力学は古典的な物理学の一つとなる。だがボルツマンの思想史を念頭に置くのなら、統計力学意味論はニュートンにはじまる「古典」力学意味論から自らを区別した上で、熱に関する主題の下に、統計力学と「古典」力学の対応付けを遂行していた。それ故に統計力学は、歴史上、新奇の物理学と「古典」的な物理学の緩やかな結合を可能にするメディアとして、冗長的に出現していたことになる。この<メディアとしての統計力学>を参照すれば、アルゴリズムアーキテクチャ設計者たちは、計算複合性の縮減のために抽象性を獲得した様々な意味処理規則形式として導入することが可能になると、期待することができるはずだ。

そこで次のページからは、再びマクスウェル-ボルツマン-ギブスの理念に潜む歴史意味論に観点を戻すことで、<メディアとしての統計力学>が如何にして可能になっているのかを分析していく。

スポンサーリンク