Weierstrass の極値定理
なぜ多くの最適化問題において、「最大値は存在する」あるいは「必ず最小値がある」とほとんど当然のように前提されているのでしょうか。実際には、そのような結論を必ずしも保証するわけではありません。Weierstrass の定理こそがこの疑問を解決する欠けていた要素であり、閉かつ有界な区間上で定義された連続関数が有界であるだけでなく、その極値を実際に達成することを保証します。本稿では、定理の正確な記述を確認し、点ごとの連続性、コンパクト性、上限公理に基づく厳密な証明を丁寧に構築し、さらにコンパクト集合上の連続関数という現代的枠組みによる解釈についても論じます。読み終える頃には、単に定理を暗記するのではなく、なぜそれが成り立つのか、そしてなぜ解析学、最適化、応用モデルにおいて繰り返し現れるのかを理解できるようになることを目指します。
学習目標
- Weierstrass の定理の内容を理解する。
定理の前提(連続関数が閉かつ有界な区間 [a,b] 上で定義されていること)と主要結論である有界性および最大値・最小値の存在を正確に把握する。 - コンパクト性の観点から Weierstrass の定理を解釈する。
連続関数はコンパクト集合を極値が達成される集合へ写すという現代的表現を用いて、[a,b] の場合を実解析における一般的枠組みと結び付けて述べる。 - Weierstrass の定理と最適化問題の関係を理解する。
多くの一変数最適化問題において最大値・最小値の存在を保証する理論的基盤として、この定理が果たす役割を把握する(理論的状況・応用状況の双方を含む)。
目次:
序論
Weierstrass の定理の記述
証明
ステップ 1:[a,b] における点ごとの連続性
ステップ 2:連続性に対応する開被覆
ステップ 3:[a,b] のコンパクト性と有限部分被覆
ステップ 4:x_0 に依存しない \delta の構成(均等連続性)
ステップ 5:均等連続性から [a,b] における f の有界性へ
ステップ 6:最大値と最小値の存在
コンパクト性による解釈と結論
序論
Weierstrass の極値定理は、実解析の初期段階で登場するにもかかわらず、実は応用数学の広大な領域を静かに支えている結果の一つです。物理学、経済学、統計学などで、ある量を制約のもとで「最大化」あるいは「最小化」すると述べるとき、その背後ではこの定理が保証する考え方に非常に近いものが使われています。すなわち、閉かつ有界な区間上で定義された連続関数は単に有界であるだけでなく、その極値を実際に達成するという事実です。
直観的には、連続な曲線を[a,b]という線分上に描けば、最も高い点と最も低い点が存在するのは「当然」のように思えるかもしれません。しかし、仮定をわずかに変更するだけで、この直観は容易に崩壊します。区間を開けば、関数が連続でなければ、あるいは定義域が有界でなければ、最大値や最小値は容易に「存在しなくなる」のです。Weierstrass の定理は、この直観を明確に整理し、いつそれを信頼でき、なぜそうなのかを正確に述べています。
理論的観点から見ると、この定理はコンパクト性という概念との最初の本格的な出会いです。現代的表現では、連続関数はコンパクト集合をコンパクト集合へ写すということを述べています。実践的観点では、これは一次元の最適化問題に解が存在することへと直結し、後に続く平均値の定理や、最終的には微積分学の基本定理を落ち着いて理解するための重要な一部となります。
本節では Weierstrass の定理を述べ、[a,b]における連続性と上限公理の概念を用いて詳細な証明を構築します。本稿が、定理そのものの学習にも、他の定理を証明したり具体的な問題で最大値・最小値の存在を厳密に正当化したりするときに立ち返るための確かな参照資料となることを目指します。
Weierstrass の定理の記述
すべての関数 f が [a,b], 上で定義され連続であるとき、その関数は有界であり、最小値および最大値 m と M をもつ。さらに、x\in[a,b] であれば、f(x)\in[m,M] が成り立つ。 |
証明
f:[a,b]\to\mathbb{R} が閉かつ有界な区間 [a,b] 上で連続であると仮定します。このとき、f が有界であり、さらに [a,b] 上で最大値と最小値を達成することを示します。証明は以下の二つの主要部分に分けて進めます。
- まず、f の連続性が [a,b] 上での一様連続性を導くことを示し、そこから関数が有界であることを結論づけます。
- 次に、上限公理を用いて、f が区間内で最大値と最小値を実際に取ることを証明します。
ステップ 1: [a,b] における点ごとの連続性
仮定より、f は各点 x_0\in[a,b] において連続です。\epsilon–\delta による連続性の定義によれば、これは次を意味します。
\displaystyle (\forall x_0\in[a,b])(\forall \epsilon\gt 0)(\exists \delta(x_0)\gt 0) \big(|x-x_0|\lt\delta(x_0)\Rightarrow |f(x)-f(x_0)|\lt\epsilon\big).
ここで、数 \delta(x_0) は点 x_0 に依存してよいことに注意します。我々の最初の目標は、これらの \delta(x_0) から、点 x_0 に依存しない単一の数 \delta を構成し、区間全体で一度に機能するようにすることです。
ステップ 2: 連続性に関連する開被覆
任意の \epsilon\gt 0 を固定します。各点 x_0\in[a,b] について、f の連続性により、次を満たす \delta(x_0)\gt 0 を選ぶことができます。
\displaystyle |x-x_0|\lt\delta(x_0)\Rightarrow |f(x)-f(x_0)|\lt\frac{\epsilon}{2}.
これらの値を用いて、各 x_0\in[a,b] に対し次の開区間を定義します。
\displaystyle I_{x_0}=\left(x_0-\frac{\delta(x_0)}{2},\,x_0+\frac{\delta(x_0)}{2}\right).
各 I_{x_0} は \mathbb{R} における開集合であり、さらに族
\displaystyle \{I_{x_0}\}_{x_0\in[a,b]}
は [a,b] の開被覆を成します。実際、任意の点 y\in[a,b] について x_0=y と取れば、構成より y\in I_y が成り立ちます。したがって、区間内の各点は少なくとも一つの開集合 I_{x_0} に含まれます。
この開集合族は一般には無限集合です(x_0\in[a,b] ごとに一つ存在するため)。ここで [a,b] のコンパクト性が重要になります。
ステップ 3: [a,b] のコンパクト性と有限部分被覆
Heine–Borel の定理より、\mathbb{R} の部分集合がコンパクトであるのは、それが閉かつ有界であるときに限ります。区間 [a,b] は閉かつ有界であるためコンパクトです。コンパクト性の定義より、
どのような開被覆(たとえ無限個の集合から成っていても)からも、有限部分被覆を取り出すことができます。
この性質を開被覆 \{I_{x_0}\}_{x_0\in[a,b]} に適用すると、ある点 x_1,\dots,x_N\in[a,b] が存在して、対応する開区間
\displaystyle I_{x_1},\, I_{x_2},\,\dots,\,I_{x_N}
この有限部分被覆は区間全体を覆い続けます。
\displaystyle [a,b]\subset I_{x_1}\cup I_{x_2}\cup\cdots\cup I_{x_N}.
このように、無限個の開区間から成る族から、依然として [a,b] 全体を覆う有限個の開区間だけを抽出することができました。
ステップ 4: x_0 に依存しない \delta の構成(均等連続性)
有限部分被覆を用いて、次の数を定義します。
\displaystyle \delta=\min\left\{\frac{\delta(x_1)}{2},\frac{\delta(x_2)}{2},\dots,\frac{\delta(x_N)}{2}\right\}.
これは有限個の正の数の最小値なので、確かに \delta\gt 0 です。この \delta が、任意の点 x_0\in[a,b] に対して機能し、すなわち x_0 に依存しないことを示します。
ここで次を取ります。
- 任意の点 x_0\in[a,b]、
- |x-x_0|\lt\delta を満たす x\in[a,b]。
開区間 I_{x_1},\dots,I_{x_N} が [a,b] を覆っているため、点 x_0 はそのうち少なくとも一つ、例えばある j\in\{1,\dots,N\} に対し I_{x_j} に属します。定義より、これは次を意味します。
\displaystyle |x_0-x_j|\lt\frac{\delta(x_j)}{2}.
さらに、\delta の定義より \delta\le\frac{\delta(x_j)}{2} が成り立つため、|x-x_0|\lt\delta から次が従います。
\displaystyle |x-x_0|\lt\frac{\delta(x_j)}{2}.
三角不等式を用いると、
\displaystyle |x-x_j|\le |x-x_0|+|x_0-x_j| \lt \frac{\delta(x_j)}{2}+\frac{\delta(x_j)}{2} =\delta(x_j).
f の x_j における連続性(誤差 \epsilon/2 に対して)より、|x_0-x_j|\lt\delta(x_j) および |x-x_j|\lt\delta(x_j) は次を含意します。
\displaystyle |f(x_0)-f(x_j)|\lt\frac{\epsilon}{2} \quad\text{y}\quad |f(x)-f(x_j)|\lt\frac{\epsilon}{2}.
再び三角不等式を適用すると、
\displaystyle |f(x)-f(x_0)| \le |f(x)-f(x_j)| + |f(x_j)-f(x_0)| \lt \frac{\epsilon}{2}+\frac{\epsilon}{2} =\epsilon.
x_0 と x は任意であったため、最初に固定した \epsilon に対し、x_0 に依存しない \delta\gt 0 が存在し、
\displaystyle (\forall x_0\in[a,b])(\forall x\in[a,b]) \big(|x-x_0|\lt\delta\Rightarrow |f(x)-f(x_0)|\lt\epsilon\big).
ここで x_0 を y と書き換えると、次のようになります。
\displaystyle (\forall \epsilon\gt 0)(\exists \delta\gt 0)(\forall x,y\in[a,b]) \big(|x-y|\lt\delta\Rightarrow |f(x)-f(y)|\lt\epsilon\big),
これはまさに、f が [a,b] 上で一様連続であるという定義そのものです。以降では、この結果を \epsilon=1 の場合に適用するだけで十分です。
ステップ 5: 一様連続性から [a,b] における f の有界性へ
ここで一様連続性を \epsilon=1 に対して適用します。すると、ある数 \delta_1\gt 0 が存在して、任意の x,y\in[a,b] に対し次が成立します。
\displaystyle |x-y|\lt\delta_1\Rightarrow |f(x)-f(y)|\lt 1.
次に、区間 [a,b] を長さが \delta_1 より小さい有限個の部分区間に分割します。すなわち、整数 n と点列
\displaystyle a = x_0 \lt x_1 \lt \cdots \lt x_n = b
を取り、各 k=0,1,\dots,n-1 について
\displaystyle x_{k+1}-x_k\lt\delta_1.
次に有限集合
\displaystyle \{f(x_0),f(x_1),\dots,f(x_{n-1})\}.
を考えます。これは有限個の実数からなる集合なので、次を問題なく定義できます。
\displaystyle C = \max\{|f(x_k)| \;|\; k=0,1,\dots,n-1\}.
ここで C+1 が区間 [a,b] 全体にわたる f の絶対値の上界であることを示します。任意の x\in[a,b] に対し、ある k が存在して x\in[x_k,x_{k+1}] を満たします。特に、
\displaystyle |x-x_k|\le x_{k+1}-x_k\lt\delta_1.
\epsilon=1 に対する一様連続性より、|x-x_k|\lt\delta_1 ならば
\displaystyle |f(x)-f(x_k)|\lt 1.
三角不等式を用いると、
\displaystyle |f(x)|\le |f(x)-f(x_k)| + |f(x_k)| \lt 1 + |f(x_k)| \le 1 + C.
x\in[a,b] は任意であったため、次を結論します。
\displaystyle |f(x)|\le C+1 \quad \text{para todo } x\in[a,b],
すなわち、関数 f は区間 [a,b] 上で有界です。
ステップ 6: 最大値と最小値の存在
関数が区間で取る値の集合を次で定義します。
\displaystyle H=\{f(x)\;|\;x\in[a,b]\}\subset\mathbb{R}.
H は空でなく([a,b] が空でないため)、さらに有界なので、上限公理により次の実数が存在します。
\displaystyle M=\sup H,\qquad m=\inf H.
ここで M が実際に関数の値として達成される、すなわち x_1\in[a,b] が存在して f(x_1)=M となることを示します。背理法で証明します。
f(x) が決して M を取らないと仮定します。すなわち、
\displaystyle (\forall x\in[a,b])\big(f(x)\lt M\big).
この仮定の下で次の関数を定義します。
\displaystyle g(x)=\frac{1}{M-f(x)}
仮定より M-f(x)\gt 0 であるため、この関数は区間 [a,b] の全ての点で正に定義されます。また、f が連続であり M が定数であるため、g も連続です。証明の前半より、区間 [a,b] 上の任意の連続関数は有界であるため、ある数 N\gt 0 が存在し、
\displaystyle (\forall x\in[a,b])\big(g(x)\le N\big).
特に、すべての x\in[a,b] に対し次が成り立ちます。
\displaystyle \frac{1}{M-f(x)} = g(x)\le N,
これは次と同値です。
\displaystyle M-f(x)\ge \frac{1}{N} \quad\Rightarrow\quad f(x)\le M-\frac{1}{N}.
つまり、[a,b] 上のすべての f(x) の値は M-\frac{1}{N} 以下であることを意味します。特に、H の上限は
\displaystyle \sup H\le M-\frac{1}{N}\lt M,
となり、これは M が H の上限であるという定義に矛盾します。したがって、仮定は誤りであり、ある点 x_1\in[a,b] が存在して
\displaystyle f(x_1)=M.
全く同様の議論を下限 m=\inf H に適用すれば(例えば h(x)=-f(x) を考えることで)、ある点 x_2\in[a,b] が存在して
\displaystyle f(x_2)=m.
コンパクト性による解釈と結論
連続関数 f:[a,b]\to\mathbb{R} が有界であり、区間 [a,b] 上で最大値と最小値を達成することを示しました。現代的な解析の言葉では、これは \mathbb{R} において閉かつ有界な区間 [a,b] がコンパクトであり、連続写像はコンパクト集合をコンパクト集合へ写す、という事実として解釈されます。
特に、I がコンパクトであり、f が I 上で連続であるなら、像 f(I) は \mathbb{R} のコンパクト部分集合となります。これは、f(I) が有界であり、その中で最大値と最小値が実際に達成されることを保証します。すなわち、これこそが Weierstrass の定理の内容に他なりません。
