変分法入門

タイトルは偉そうですが、英語資料を見て勉強したことのまとめです。

変分法を学ぶモチベーション

xy平面上に、PとQの2点をとろう。そして、PとQの間を結ぶ曲線の長さを考える。

PとQの間を結ぶ曲線をy(x)として、Pのx座標をa, Qのx座標をbとする。そして、曲線PQの長さは、次のように表される。

\int_a^b \sqrt{1+\left[y'(x)\right]^2} dx

曲線の長さの式を忘れた人は、次の図で思い出そう。

曲線y(x)は、どのような曲線のときにPQ間の長さが一番小さくなるだろう? PQ間が直線のとき、一番短くなるはずだ。つまり、曲線y(x)=○x+△のような形になるはずである。x軸が垂直になっている場合はこの式では表せないなどと突っ込まないように。

では、次の式を最小にするy(x)はどのような形をしているだろうか?

\int_a^b \sqrt{ \frac{1+\left[y'(x)\right]^2}{y(x)}} dx

………。直感だけに頼ってしまうと、このような積分を最小にするy(x)を求めることが出来ない。

そこで、関数y(x)を入力すると、これらの積分を計算する関数(汎関数)を作る。すなわち、

F[y(x)]= \int_a^b \sqrt{1+\left[y'(x)\right]^2} dx

とか、

F[y(x)]= \int_a^b \sqrt{ \frac{1+\left[y'(x)\right]^2}{y(x)}} dx

というように関数を変数とみなしてしまうのだ。もっと一般的に書くと、F[y(x)]は

F[y(x)]=\int_a^b f(x,y(x),y'(x))dx

とかける。関数y(x)を入力すると、そこから勝手にx, y(x), y'(x)を作り出して、勝手に積分を計算してくれるイメージだ。

上にも書いたが、このような関数を汎関数(functional)と呼ぶ(らしい)。y(x)をどのような式にすれば、最大・最小を求めることができるのかを考えていくことにしよう。

オイラー・ラグランジュ方程式

汎関数を最小にするyはオイラー・ラグランジュ方程式を満たす

次のような定理がある。

もしy(x)が汎関数

F[y(x)]=\int_a^b f(x,y(x),y'(x))dx

を最小にするなら、微分方程式(オイラー・ラグランジュ方程式)

\frac{\partial f }{\partial y} – \frac{d}{dx} \left( \frac{\partial f}{\partial y’} \right) = 0

が成り立つ。

定理が正しいことを曲線の長さの式を使って確かめてみよう

この定理を、曲線の長さ

F[y(x)]= \int_a^b \sqrt{1+\left[y'(x)\right]^2} dx

を使って確かめてみよう。関数f(x)は∫とdxの中にあるから

f(x) = \sqrt{1+\left[y'(x)\right]^2}

だ。

\begin{aligned} \frac{\partial f }{\partial y} – \frac{d}{dx}\left(\frac{\partial f}{\partial y’}\right) &= 0-\frac{d}{dx}\left( \frac{y'(x)}{\sqrt{1+[y'(x)]^2}} \right) \\ &=-\frac{ y"(x) \sqrt{ 1+[y'(x)]^2} – y'(x) \frac{d}{dx}\sqrt{1+[y'(x)]^2} }{ 1+[y'(x)]^2 } \\ &=-\frac{ y"(x) \sqrt{ 1+[y'(x)]^2} – y'(x) \frac{2y'(x)y"(x)}{2\sqrt{1+[y'(x)]^2}} }{ 1+[y'(x)]^2 }\\ &=-\frac{ y"(x) \sqrt{ 1+[y'(x)]^2} – \frac{[y'(x)]^2 y"(x)}{\sqrt{1+[y'(x)]^2}} }{ 1+[y'(x)]^2 }\\ &=-\frac{ y"(x) (1+[y'(x)]^2) – [y'(x)]^2 y"(x) }{ (1+[y'(x)]^2 )\sqrt{1+[y'(x)]^2} }\\ &=-\frac{y"(x)}{(1+[y'(x)]^2)^{\frac{3}{2}}} \end{aligned}

いろいろごちゃごちゃして見にくいが、結局は下の式が得られる。

\frac{\partial f }{\partial y} – \frac{d}{dx}\left(\frac{\partial f}{\partial y’}\right) =-\frac{y"(x)}{(1+[y'(x)]^2)^{\frac{3}{2}}}

ここで、y(x) を直線 y(x) = Ax+b とする。直線は汎関数を最小にするのだから、この式は0に等しい必要がある。y'(x) = A, y”(x) = 0 だから、

\frac{\partial f }{\partial y} – \frac{d}{dx}\left(\frac{\partial f}{\partial y’}\right) =-\frac{y"(x)}{(1+[y'(x)]^2)^{\frac{3}{2}}} = – \frac{0}{(1+A^2)^{\frac{3}{2}}}=0

となり、定理が成り立つ。

証明の前に補題を証明する

補題(変分法の基本補題)

区間[a, b]で連続な関数M(x)がある。xにaを入れてもbも入れても値がゼロになるような、どんな連続関数h(x)に対しても

\int_a^bM(x)h(x)dx=0

が成り立つなら、M(x)は区間[a, b]でいつも(=恒等的に)ゼロである。

証明の方針

背理法で示す。すなわち、「

xにaを入れてもbも入れても値がゼロになるようなどんな連続関数h(x)に対しても

\int_a^bM(x)h(x)dx=0

が成り立つなら、M(x)(の区間[a, b])にゼロでないところがある。

」という仮定から出発して、矛盾を引き出す。具体的には、M(x)にゼロでないところがあると

\int_a^bM(x)h(x)dx\neq0

となる関数が(1つでも)存在してしまうことを示して矛盾とする。

証明(?)

M(x)の区間(a,b)にゼロでないところがあるとする。

※M(x)は連続関数なので、x=aやx=bのピンポイントで非ゼロになることはありえない……はず。x=aやx=bで非ゼロならば、aよりも少し大きい箇所やbよりも少し小さい箇所もゼロでなくなる。そのため、M(x)の区間(a,b)としても一般性を失わない。

h(x)=-M(x)(x-a)(x-b)

を考えると、M(x)は連続なので明らかにh(x)は連続で、また、h(a)=h(b)=0を満たす。ここで

\int_a^b M(x)h(x)dx = \int_a^b (-[M(x)]^2(x-a)(x-b)) dx

を考えると、区間(a,b)で-(x-a)(x-b) \gt 0、M(x)がゼロでないxの範囲で [M(x)]^2 \gt 0 になる。

よって、「M(x)h(x)が0より大きい」ようなxの範囲を含めて積分するので、

\int_a^b M(x)h(x)dx > 0

となる。これは仮定と矛盾する。

汎関数を最小にするyはオイラー・ラグランジュ方程式を満たすことの証明

y(x)が汎関数Fを最小にする曲線であるとしよう。すなわち、他のどんな曲線g(x)に対しても、

F[y(x)]\le F[g(x)]

が成り立つということである。

証明の方針

  1. H(\epsilon)\epsilon = 0の近くで微分可能
  2. H(0)が極小値である

ようなH(\epsilon)を考え、2. の性質によりオイラーラグランジュ方程式を満たすことを導く。

証明

小数\epsilonを考え、y(x)にかわる新しい関数y_\epsilon(x)を次のように作る

y_\epsilon(x) = y(x)+\epsilon h(x) \hspace{10pt} (h(a)=h(b)=0)

また、汎関数を使ってHを次のように定義する。

H(\epsilon)=F[y_\epsilon(x)]

Fを最小にするのはy(x)=y_0(x)だから、H(\epsilon)\epsilon=0のとき最小になる。H(0)が最小値なら、H'(0)=0が成り立つ。H(\epsilon)\epsilonで微分すると、

\begin{aligned} \frac{d}{d\epsilon}H(\epsilon) &= \frac{d}{d\epsilon} \int_a^b f(x, y_\epsilon, y_\epsilon’)dx \\ &= \int_a^b \frac{\partial}{\partial \epsilon} f(x, y_\epsilon, y_\epsilon’) dx \\ &= \int_a^b \left( \frac{\partial f}{\partial x} \frac{\partial x}{\partial \epsilon} + \frac{\partial f}{\partial y_\epsilon}\frac{\partial y_\epsilon}{\partial \epsilon} + \frac{\partial f}{\partial y_\epsilon’}\frac{\partial y_\epsilon’}{\partial \epsilon} \right) dx \\ &=\int_a^b \left( \frac{\partial f}{\partial y_\epsilon} h(x) +\frac{\partial f}{\partial y_\epsilon’} h'(x) \right) dx \end{aligned}

H'(0)=0が成り立つから、

\begin{aligned} H'(0) = 0 &= \int_a^b \left( \frac{\partial f}{\partial y_0} h(x) +\frac{\partial f}{\partial y_0′} h'(x) \right) dx \\ &= \int_a^b \left( \frac{\partial f}{\partial y} h(x) +\frac{\partial f}{\partial y’} h'(x) \right) dx \\ &= \int_a^b \frac{\partial f}{\partial y} h(x)dx +\int_a^b \frac{\partial f}{\partial y’} h'(x) dx \\ &= \int_a^b \frac{\partial f}{\partial y} h(x)dx + \left[\frac{\partial f}{\partial y’} h(x)\right]^b_a – \int_a^b \frac{d}{dx} \frac{\partial f}{\partial y’} h(x) dx\\ &= \int_a^b \frac{\partial f}{\partial y} h(x)dx + \left[\frac{\partial f}{\partial y’} h(b) – \frac{\partial f}{\partial y’} h(a) \right] – \int_a^b \frac{d}{dx} \frac{\partial f}{\partial y’} h(x) dx \\ &= \int_a^b \frac{\partial f}{\partial y} h(x)dx + \left[\frac{\partial f}{\partial y’} \times 0 – \frac{\partial f}{\partial y’} \times 0 \right] – \int_a^b \frac{d}{dx} \frac{\partial f}{\partial y’} h(x) dx \\ &= \int_a^b \frac{\partial f}{\partial y} h(x)dx – \int_a^b \frac{d}{dx} \frac{\partial f}{\partial y’} h(x) dx \\ &= \int_a^b \left( \frac{\partial f}{\partial y} – \frac{d}{dx} \frac{\partial f}{\partial y’} \right)h(x)dx \end{aligned}

ここで、変分法の基本補題に登場した式

\int_a^bM(x)h(x)dx=0

を思い出すと、M(x) \frac{\partial f}{\partial y} – \frac{d}{dx} \frac{\partial f}{\partial y’} に相当するので

\frac{\partial f}{\partial y} – \frac{d}{dx} \frac{\partial f}{\partial y’} = 0

が成り立つ。

特定の場合は解が簡単になる(ベルトラミの恒等式)

被積分関数がxに直接依存しない \frac{df}{dx} = 0 場合は、次のような簡単な解が得られる。

f -y’\frac{\partial f}{\partial y’} = C

参考文献

March, J. (1999). Introduction to the Calculus of Variations.