Теорема Вейерштрасса о наибольших и наименьших значениях

Почему во множестве задач оптимизации почти само собой разумеется, что «максимум существует» или что «всегда есть минимум» на некотором интервале, хотя на самом деле ничто не обязывает к такому исходу? Теорема Вейерштрасса является недостающим элементом этой головоломки: она гарантирует, что непрерывная функция, определенная на замкнутом и ограниченном интервале, не только является ограниченной, но и фактически достигает своих экстремальных значений. В этом материале мы рассматриваем ее формулировку, подробно строим строгую демонстрацию, основанную на точечной непрерывности, компактности и аксиоме супремума, а также обсуждаем современное толкование в рамках непрерывных функций на компактных множествах. Идея состоит в том, чтобы по завершении вы не просто помнили теорему как формулу, но и понимали, почему она верна и почему она вновь и вновь появляется в анализе, оптимизации и прикладных моделях.

Цели обучения

Понять формулировку теоремы Вейерштрасса.
Точно определить гипотезы теоремы (непрерывная функция на замкнутом и ограниченном интервале $[a,b]$ ) и ее основные выводы: ограниченность и существование максимального и минимального значений.
Интерпретировать теорему Вейерштрасса в терминах компактности.
Сформулировать результат в современном языке: непрерывные функции отображают компактные множества в множества, где экстремальные значения достигаются, связывая случай $[a,b]$ с общими принципами математического анализа.
Соотнести теорему Вейерштрасса с задачами оптимизации.
Распознать роль теоремы как теоретического основания существования максимумов и минимумов во многих задачах оптимизации одной переменной как в теоретическом, так и в прикладном контексте.

СОДЕРЖАНИЕ:
Введение
Формулировка теоремы Вейерштрасса
Доказательство
Шаг 1: Точечная непрерывность на $[a,b]$
Шаг 2: Открытое покрытие, связанное с непрерывностью
Шаг 3: Компактность [a,b] и конечное подпокрытие
Шаг 4: Построение $\delta$ , не зависящего от $x_0$ (равномерная непрерывность)
Шаг 5: От равномерной непрерывности к ограниченности $f$ на $[a,b]$
Шаг 6: Существование максимального и минимального значений
Интерпретация в терминах компактности и выводы

Введение

Теорема Вейерштрасса о наибольших и наименьших значениях относится к тем результатам, которые, хотя и появляются в первых разделах математического анализа, фактически незаметно поддерживают значительную часть прикладной математики. Каждый раз, когда в физике, экономике или статистике мы говорим о «максимизации» или «минимизации» некоторой величины при заданных условиях, мы в сущности опираемся на идею, близкую к утверждению этой теоремы: непрерывная функция, определенная на замкнутом и ограниченном интервале, не только является ограниченной, но и действительно достигает своих экстремальных значений.

Интуитивно может казаться «очевидным», что если мы рисуем непрерывную кривую на отрезке $[a,b]$ , то должны существовать точки с наибольшим и наименьшим значениями. Однако достаточно немного изменить предпосылки, чтобы эта интуиция разрушилась: если открыть интервал, если функция перестанет быть непрерывной или если область определения не будет ограниченной, максимумы и минимумы могут просто исчезнуть. Теорема Вейерштрасса упорядочивает эту интуицию и точно указывает, когда мы можем на нее опираться и почему.

С теоретической точки зрения эта теорема является первым серьезным знакомством с понятием компактности: на современном языке она утверждает, что непрерывная функция отображает компактные множества в компактные множества. С практической точки зрения это означает существование решений для многих задач оптимизации одной переменной и служит ключевым элементом для последующих результатов, таких как Теорема о среднем значении и, в конечном счете, для спокойного понимания Основной теоремы анализа.

В этом разделе мы сформулируем теорему Вейерштрасса и подробно разберем ее доказательство, опираясь на понятие непрерывности на $[a,b]$ и на аксиому супремума. Цель состоит в том, чтобы этот текст служил надежной справочной базой как для изучения самого результата, так и для возвращения к нему каждый раз, когда нужно использовать его при доказательстве других теорем или при строгом обосновании существования максимумов и минимумов в конкретных задачах.

Формулировка теоремы Вейерштрасса

Всякая функция $f$ , определенная и непрерывная на $[a,b],$ является ограниченной и имеет наименьшее и наибольшее значения, $m$ и $M$ , такие, что если $x\in[a,b]$ , то $f(x)\in[m,M]$ .

Доказательство

Докажем, что если $f:[a,b]\to\mathbb{R}$ непрерывна на замкнутом и ограниченном интервале $[a,b]$ , то $f$ является ограниченной и достигает максимального и минимального значений на $[a,b]$ . Мы разделим доказательство на две основные части:

Сначала покажем, что непрерывность $f$ на $[a,b]$ влечет равномерную непрерывность, и из этого выведем ее ограниченность.
Затем, используя аксиому супремума, докажем, что $f$ достигает своих максимального и минимального значений на интервале.

Шаг 1: Точечная непрерывность на $[a,b]$

По предположению, $f$ непрерывна в каждой точке $x_0\in[a,b]$ . Согласно определению непрерывности в терминах $\epsilon$ и $\delta$ , это означает:

$\displaystyle (\forall x_0\in[a,b])(\forall \epsilon\gt 0)(\exists \delta(x_0)\gt 0) \big(|x-x_0|\lt\delta(x_0)\Rightarrow |f(x)-f(x_0)|\lt\epsilon\big).$

На этом этапе число $\delta(x_0)$ может зависеть от точки $x_0$ . Наша ближайшая цель состоит в том, чтобы, исходя из этих значений $\delta(x_0)$ , построить одно число $\delta$ , которое не зависит от $x_0$ и подходит одновременно для всех точек интервала.

Шаг 2: Открытое покрытие, связанное с непрерывностью

Зафиксируем произвольное $\epsilon\gt 0$ . Для каждого $x_0\in[a,b]$ непрерывность $f$ позволяет выбрать число $\delta(x_0)\gt 0$ такое, что

$\displaystyle |x-x_0|\lt\delta(x_0)\Rightarrow |f(x)-f(x_0)|\lt\frac{\epsilon}{2}.$

Исходя из этих значений, для каждого $x_0\in[a,b]$ определим открытый интервал

$\displaystyle I_{x_0}=\left(x_0-\frac{\delta(x_0)}{2},\,x_0+\frac{\delta(x_0)}{2}\right).$

Каждое множество $I_{x_0}$ является открытым подмножеством $\mathbb{R}$ , и к тому же семейство

$\displaystyle \{I_{x_0}\}_{x_0\in[a,b]}$

образует открытое покрытие интервала $[a,b]$ . Действительно, для любой точки $y\in[a,b]$ достаточно взять $x_0=y$ ; по построению $y\in I_y$ . Таким образом, каждая точка интервала принадлежит по крайней мере одному открытому множеству $I_{x_0}$ .

Это семейство открытых множеств, вообще говоря, бесконечно (одно множество для каждого $x_0\in[a,b]$ ). Здесь и проявляется роль компактности $[a,b]$ .

Шаг 3: Компактность $[a,b]$ и конечное подпокрытие

Из теоремы Гейне–Бореля известно, что подмножество $\mathbb{R}$ компактно тогда и только тогда, когда оно является замкнутым и ограниченным. Интервал $[a,b]$ является замкнутым и ограниченным, следовательно, он компактен. По определению компактности это означает, что:

Из любого открытого покрытия $[a,b]$ (даже если оно бесконечно) можно выделить конечное подпокрытие.

Применяя это свойство к открытому покрытию $\{I_{x_0}\}_{x_0\in[a,b]}$ , получаем, что существуют точки $x_1,\dots,x_N\in[a,b]$ такие, что соответствующие интервалы

$\displaystyle I_{x_1},\, I_{x_2},\,\dots,\,I_{x_N}$

siguen recubriendo todo el intervalo:

$\displaystyle [a,b]\subset I_{x_1}\cup I_{x_2}\cup\cdots\cup I_{x_N}.$

Таким образом, мы перешли от бесконечного семейства открытых интервалов к подпокрытию, состоящему лишь из конечного числа интервалов, не теряя при этом свойства покрывать $[a,b]$ .

Шаг 4: Построение $\delta$ , не зависящего от $x_0$ (равномерная непрерывность)

Исходя из конечного подпокрытия, определим число

$\displaystyle \delta=\min\left\{\frac{\delta(x_1)}{2},\frac{\delta(x_2)}{2},\dots,\frac{\delta(x_N)}{2}\right\}.$

Поскольку это минимум конечного числа положительных значений, имеем $\delta\gt 0$ . Теперь покажем, что это $\delta$ подходит для любой точки $x_0\in[a,b]$ , то есть не зависит от выбора $x_0$ .

Рассмотрим теперь:

произвольную точку $x_0\in[a,b]$ , и
точку $x\in[a,b]$ такую, что $|x-x_0|\lt\delta$ .

Так как интервалы $I_{x_1},\dots,I_{x_N}$ покрывают $[a,b]$ , точка $x_0$ принадлежит хотя бы одному из них, скажем $I_{x_j}$ для некоторого $j\in\{1,\dots,N\}$ . По определению $I_{x_j}$ это означает, что

$\displaystyle |x_0-x_j|\lt\frac{\delta(x_j)}{2}.$

Кроме того, по определению $\delta$ имеем $\delta\le\frac{\delta(x_j)}{2}$ , так что из $|x-x_0|\lt\delta$ следует

$\displaystyle |x-x_0|\lt\frac{\delta(x_j)}{2}.$

Применяя неравенство треугольника,

$\displaystyle |x-x_j|\le |x-x_0|+|x_0-x_j| \lt \frac{\delta(x_j)}{2}+\frac{\delta(x_j)}{2} =\delta(x_j).$

По выбору $\delta(x_j)$ (непрерывность $f$ в точке $x_j$ для значения $\epsilon/2$ ) неравенства $|x_0-x_j|\lt\delta(x_j)$ и $|x-x_j|\lt\delta(x_j)$ влекут

$\displaystyle |f(x_0)-f(x_j)|\lt\frac{\epsilon}{2} \quad\text{и}\quad |f(x)-f(x_j)|\lt\frac{\epsilon}{2}.$

Снова используя неравенство треугольника, получаем

$\displaystyle |f(x)-f(x_0)| \le |f(x)-f(x_j)| + |f(x_j)-f(x_0)| \lt \frac{\epsilon}{2}+\frac{\epsilon}{2} =\epsilon.$

Так как $x_0$ и $x$ были произвольны, мы доказали, что для фиксированного $\epsilon$ существует $\delta\gt 0$ , не зависящее от $x_0$ , такое что

$\displaystyle (\forall x_0\in[a,b])(\forall x\in[a,b]) \big(|x-x_0|\lt\delta\Rightarrow |f(x)-f(x_0)|\lt\epsilon\big).$

Если переобозначить $x_0$ как $y$ , то это запишется так:

$\displaystyle (\forall \epsilon\gt 0)(\exists \delta\gt 0)(\forall x,y\in[a,b]) \big(|x-y|\lt\delta\Rightarrow |f(x)-f(y)|\lt\epsilon\big),$

что и есть точное определение равномерной непрерывности функции $f$ на $[a,b]$ . В дальнейшем нам потребуется применять этот результат только для случая $\epsilon=1$ .

Шаг 5: От равномерной непрерывности к ограниченности $f$ на $[a,b]$

Применим теперь равномерную непрерывность при $\epsilon=1$ . Существует число $\delta_1\gt 0$ такое, что для любых $x,y\in[a,b]$ выполняется

$\displaystyle |x-y|\lt\delta_1\Rightarrow |f(x)-f(y)|\lt 1.$

Разобьем теперь интервал $[a,b]$ на конечное число подынтервалов длины меньшей, чем $\delta_1$ . То есть выберем целое число $n$ и точки

$\displaystyle a = x_0 \lt x_1 \lt \cdots \lt x_n = b$

такие, что для каждого $k=0,1,\dots,n-1$ выполняется

$\displaystyle x_{k+1}-x_k\lt\delta_1.$

Рассмотрим теперь конечное множество значений

$\displaystyle \{f(x_0),f(x_1),\dots,f(x_{n-1})\}.$

Так как это конечное множество действительных чисел, можно корректно определить

$\displaystyle C = \max\{|f(x_k)| \;|\; k=0,1,\dots,n-1\}.$

Покажем, что $C+1$ является верхней оценкой по модулю для $f$ на всем интервале $[a,b]$ . Пусть $x\in[a,b]$ — произвольная точка. Тогда существует индекс $k$ такой, что $x\in[x_k,x_{k+1}]$ . В частности,

$\displaystyle |x-x_k|\le x_{k+1}-x_k\lt\delta_1.$

По равномерной непрерывности при $\epsilon=1$ из $|x-x_k|\lt\delta_1$ следует

$\displaystyle |f(x)-f(x_k)|\lt 1.$

Используя неравенство треугольника:

$\displaystyle |f(x)|\le |f(x)-f(x_k)| + |f(x_k)| \lt 1 + |f(x_k)| \le 1 + C.$

Так как $x\in[a,b]$ было произвольно, заключаем, что

$\displaystyle |f(x)|\le C+1 \quad \text{для всех } x\in[a,b],$

то есть функция $f$ является ограниченной на $[a,b]$ .

Шаг 6: Существование максимального и минимального значений

Определим множество значений функции на интервале:

$\displaystyle H=\{f(x)\;|\;x\in[a,b]\}\subset\mathbb{R}.$

Мы уже знаем, что $H$ непусто (поскольку $[a,b]$ непуст), и ограничено, поэтому по аксиоме супремума существуют действительные числа

$\displaystyle M=\sup H,\qquad m=\inf H.$

Докажем, что $M$ достигается как значение функции, то есть существует $x_1\in[a,b]$ такое, что $f(x_1)=M$ . Доказательство проведем от противного.

Предположим, что $f(x)$ никогда не достигает значения $M$ , то есть:

$\displaystyle (\forall x\in[a,b])\big(f(x)\lt M\big).$

При этом предположении функция

$\displaystyle g(x)=\frac{1}{M-f(x)}$

корректно определена и положительна для всех $x\in[a,b]$ , поскольку по гипотезе $M-f(x)\gt 0$ . Кроме того, поскольку $f$ непрерывна, а $M$ — константа, функция $g$ также непрерывна. По первой части доказательства всякая непрерывная функция на $[a,b]$ является ограниченной, поэтому существует число $N\gt 0$ такое, что

$\displaystyle (\forall x\in[a,b])\big(g(x)\le N\big).$

В частности, для любого $x\in[a,b]$ выполняется

$\displaystyle \frac{1}{M-f(x)} = g(x)\le N,$

что эквивалентно

$\displaystyle M-f(x)\ge \frac{1}{N} \quad\Rightarrow\quad f(x)\le M-\frac{1}{N}.$

Это означает, что все значения $f(x)$ на $[a,b]$ меньше либо равны $M-\frac{1}{N}$ . В частности, супремум множества $H$ удовлетворяет

$\displaystyle \sup H\le M-\frac{1}{N}\lt M,$

что противоречит определению $M$ как супремума $H$ . Следовательно, наше первоначальное предположение было ложным, и существует точка $x_1\in[a,b]$ , такая что

$\displaystyle f(x_1)=M.$

Совершенно аналогичное рассуждение, применённое к инфимуму $m=\inf H$ (например, рассмотрев функцию $h(x)=-f(x)$ ), показывает, что существует точка $x_2\in[a,b]$ , такая что

$\displaystyle f(x_2)=m.$

Интерпретация в терминах компактности и заключение

Мы доказали, что любая непрерывная функция $f:[a,b]\to\mathbb{R}$ является ограниченной и достигает своих максимального и минимального значений на $[a,b]$ . В современном языке анализа это интерпретируется следующим образом: в $\mathbb{R}$ замкнутые и ограниченные интервалы, такие как $[a,b]$ , являются компактными множествами, а непрерывные функции отображают компактные множества в компактные множества.

В частности, если $I$ является компактным множеством и $f$ непрерывна на $I$ , то образ $f(I)$ является компактным подмножеством $\mathbb{R}$ . Это гарантирует, что $f(I)$ ограничено и что на нём действительно достигаются максимальное и минимальное значения, что и составляет содержание теоремы Вейерштрасса.

Просмотры: 4

Теорема Вейерштрасса о наибольших и наименьших значениях

Введение

Формулировка теоремы Вейерштрасса

Доказательство

Шаг 1: Точечная непрерывность на [a,b]

Шаг 2: Открытое покрытие, связанное с непрерывностью

Шаг 3: Компактность [a,b] и конечное подпокрытие

Шаг 4: Построение \delta, не зависящего от x_0 (равномерная непрерывность)

Шаг 5: От равномерной непрерывности к ограниченности f на [a,b]