Теорема Вейерштрасса о наибольших и наименьших значениях
Почему во множестве задач оптимизации почти само собой разумеется, что «максимум существует» или что «всегда есть минимум» на некотором интервале, хотя на самом деле ничто не обязывает к такому исходу? Теорема Вейерштрасса является недостающим элементом этой головоломки: она гарантирует, что непрерывная функция, определенная на замкнутом и ограниченном интервале, не только является ограниченной, но и фактически достигает своих экстремальных значений. В этом материале мы рассматриваем ее формулировку, подробно строим строгую демонстрацию, основанную на точечной непрерывности, компактности и аксиоме супремума, а также обсуждаем современное толкование в рамках непрерывных функций на компактных множествах. Идея состоит в том, чтобы по завершении вы не просто помнили теорему как формулу, но и понимали, почему она верна и почему она вновь и вновь появляется в анализе, оптимизации и прикладных моделях.
Цели обучения
- Понять формулировку теоремы Вейерштрасса.
Точно определить гипотезы теоремы (непрерывная функция на замкнутом и ограниченном интервале [a,b]) и ее основные выводы: ограниченность и существование максимального и минимального значений. - Интерпретировать теорему Вейерштрасса в терминах компактности.
Сформулировать результат в современном языке: непрерывные функции отображают компактные множества в множества, где экстремальные значения достигаются, связывая случай [a,b] с общими принципами математического анализа. - Соотнести теорему Вейерштрасса с задачами оптимизации.
Распознать роль теоремы как теоретического основания существования максимумов и минимумов во многих задачах оптимизации одной переменной как в теоретическом, так и в прикладном контексте.
СОДЕРЖАНИЕ:
Введение
Формулировка теоремы Вейерштрасса
Доказательство
Шаг 1: Точечная непрерывность на [a,b]
Шаг 2: Открытое покрытие, связанное с непрерывностью
Шаг 3: Компактность [a,b] и конечное подпокрытие
Шаг 4: Построение \delta, не зависящего от x_0 (равномерная непрерывность)
Шаг 5: От равномерной непрерывности к ограниченности f на [a,b]
Шаг 6: Существование максимального и минимального значений
Интерпретация в терминах компактности и выводы
Введение
Теорема Вейерштрасса о наибольших и наименьших значениях относится к тем результатам, которые, хотя и появляются в первых разделах математического анализа, фактически незаметно поддерживают значительную часть прикладной математики. Каждый раз, когда в физике, экономике или статистике мы говорим о «максимизации» или «минимизации» некоторой величины при заданных условиях, мы в сущности опираемся на идею, близкую к утверждению этой теоремы: непрерывная функция, определенная на замкнутом и ограниченном интервале, не только является ограниченной, но и действительно достигает своих экстремальных значений.
Интуитивно может казаться «очевидным», что если мы рисуем непрерывную кривую на отрезке [a,b], то должны существовать точки с наибольшим и наименьшим значениями. Однако достаточно немного изменить предпосылки, чтобы эта интуиция разрушилась: если открыть интервал, если функция перестанет быть непрерывной или если область определения не будет ограниченной, максимумы и минимумы могут просто исчезнуть. Теорема Вейерштрасса упорядочивает эту интуицию и точно указывает, когда мы можем на нее опираться и почему.
С теоретической точки зрения эта теорема является первым серьезным знакомством с понятием компактности: на современном языке она утверждает, что непрерывная функция отображает компактные множества в компактные множества. С практической точки зрения это означает существование решений для многих задач оптимизации одной переменной и служит ключевым элементом для последующих результатов, таких как Теорема о среднем значении и, в конечном счете, для спокойного понимания Основной теоремы анализа.
В этом разделе мы сформулируем теорему Вейерштрасса и подробно разберем ее доказательство, опираясь на понятие непрерывности на [a,b] и на аксиому супремума. Цель состоит в том, чтобы этот текст служил надежной справочной базой как для изучения самого результата, так и для возвращения к нему каждый раз, когда нужно использовать его при доказательстве других теорем или при строгом обосновании существования максимумов и минимумов в конкретных задачах.
Формулировка теоремы Вейерштрасса
Всякая функция f, определенная и непрерывная на [a,b], является ограниченной и имеет наименьшее и наибольшее значения, m и M, такие, что если x\in[a,b], то f(x)\in[m,M]. |
Доказательство
Докажем, что если f:[a,b]\to\mathbb{R} непрерывна на замкнутом и ограниченном интервале [a,b], то f является ограниченной и достигает максимального и минимального значений на [a,b]. Мы разделим доказательство на две основные части:
- Сначала покажем, что непрерывность f на [a,b] влечет равномерную непрерывность, и из этого выведем ее ограниченность.
- Затем, используя аксиому супремума, докажем, что f достигает своих максимального и минимального значений на интервале.
Шаг 1: Точечная непрерывность на [a,b]
По предположению, f непрерывна в каждой точке x_0\in[a,b]. Согласно определению непрерывности в терминах \epsilon и \delta, это означает:
\displaystyle (\forall x_0\in[a,b])(\forall \epsilon\gt 0)(\exists \delta(x_0)\gt 0) \big(|x-x_0|\lt\delta(x_0)\Rightarrow |f(x)-f(x_0)|\lt\epsilon\big).
На этом этапе число \delta(x_0) может зависеть от точки x_0. Наша ближайшая цель состоит в том, чтобы, исходя из этих значений \delta(x_0), построить одно число \delta, которое не зависит от x_0 и подходит одновременно для всех точек интервала.
Шаг 2: Открытое покрытие, связанное с непрерывностью
Зафиксируем произвольное \epsilon\gt 0. Для каждого x_0\in[a,b] непрерывность f позволяет выбрать число \delta(x_0)\gt 0 такое, что
\displaystyle |x-x_0|\lt\delta(x_0)\Rightarrow |f(x)-f(x_0)|\lt\frac{\epsilon}{2}.
Исходя из этих значений, для каждого x_0\in[a,b] определим открытый интервал
\displaystyle I_{x_0}=\left(x_0-\frac{\delta(x_0)}{2},\,x_0+\frac{\delta(x_0)}{2}\right).
Каждое множество I_{x_0} является открытым подмножеством \mathbb{R}, и к тому же семейство
\displaystyle \{I_{x_0}\}_{x_0\in[a,b]}
образует открытое покрытие интервала [a,b]. Действительно, для любой точки y\in[a,b] достаточно взять x_0=y; по построению y\in I_y. Таким образом, каждая точка интервала принадлежит по крайней мере одному открытому множеству I_{x_0}.
Это семейство открытых множеств, вообще говоря, бесконечно (одно множество для каждого x_0\in[a,b]). Здесь и проявляется роль компактности [a,b].
Шаг 3: Компактность [a,b] и конечное подпокрытие
Из теоремы Гейне–Бореля известно, что подмножество \mathbb{R} компактно тогда и только тогда, когда оно является замкнутым и ограниченным. Интервал [a,b] является замкнутым и ограниченным, следовательно, он компактен. По определению компактности это означает, что:
Из любого открытого покрытия [a,b] (даже если оно бесконечно) можно выделить конечное подпокрытие.
Применяя это свойство к открытому покрытию \{I_{x_0}\}_{x_0\in[a,b]}, получаем, что существуют точки x_1,\dots,x_N\in[a,b] такие, что соответствующие интервалы
\displaystyle I_{x_1},\, I_{x_2},\,\dots,\,I_{x_N}
siguen recubriendo todo el intervalo:
\displaystyle [a,b]\subset I_{x_1}\cup I_{x_2}\cup\cdots\cup I_{x_N}.
Таким образом, мы перешли от бесконечного семейства открытых интервалов к подпокрытию, состоящему лишь из конечного числа интервалов, не теряя при этом свойства покрывать [a,b].
Шаг 4: Построение \delta, не зависящего от x_0 (равномерная непрерывность)
Исходя из конечного подпокрытия, определим число
\displaystyle \delta=\min\left\{\frac{\delta(x_1)}{2},\frac{\delta(x_2)}{2},\dots,\frac{\delta(x_N)}{2}\right\}.
Поскольку это минимум конечного числа положительных значений, имеем \delta\gt 0. Теперь покажем, что это \delta подходит для любой точки x_0\in[a,b], то есть не зависит от выбора x_0.
Рассмотрим теперь:
- произвольную точку x_0\in[a,b], и
- точку x\in[a,b] такую, что |x-x_0|\lt\delta.
Так как интервалы I_{x_1},\dots,I_{x_N} покрывают [a,b], точка x_0 принадлежит хотя бы одному из них, скажем I_{x_j} для некоторого j\in\{1,\dots,N\}. По определению I_{x_j} это означает, что
\displaystyle |x_0-x_j|\lt\frac{\delta(x_j)}{2}.
Кроме того, по определению \delta имеем \delta\le\frac{\delta(x_j)}{2}, так что из |x-x_0|\lt\delta следует
\displaystyle |x-x_0|\lt\frac{\delta(x_j)}{2}.
Применяя неравенство треугольника,
\displaystyle |x-x_j|\le |x-x_0|+|x_0-x_j| \lt \frac{\delta(x_j)}{2}+\frac{\delta(x_j)}{2} =\delta(x_j).
По выбору \delta(x_j) (непрерывность f в точке x_j для значения \epsilon/2) неравенства |x_0-x_j|\lt\delta(x_j) и |x-x_j|\lt\delta(x_j) влекут
\displaystyle |f(x_0)-f(x_j)|\lt\frac{\epsilon}{2} \quad\text{и}\quad |f(x)-f(x_j)|\lt\frac{\epsilon}{2}.
Снова используя неравенство треугольника, получаем
\displaystyle |f(x)-f(x_0)| \le |f(x)-f(x_j)| + |f(x_j)-f(x_0)| \lt \frac{\epsilon}{2}+\frac{\epsilon}{2} =\epsilon.
Так как x_0 и x были произвольны, мы доказали, что для фиксированного \epsilon существует \delta\gt 0, не зависящее от x_0, такое что
\displaystyle (\forall x_0\in[a,b])(\forall x\in[a,b]) \big(|x-x_0|\lt\delta\Rightarrow |f(x)-f(x_0)|\lt\epsilon\big).
Если переобозначить x_0 как y, то это запишется так:
\displaystyle (\forall \epsilon\gt 0)(\exists \delta\gt 0)(\forall x,y\in[a,b]) \big(|x-y|\lt\delta\Rightarrow |f(x)-f(y)|\lt\epsilon\big),
что и есть точное определение равномерной непрерывности функции f на [a,b]. В дальнейшем нам потребуется применять этот результат только для случая \epsilon=1.
Шаг 5: От равномерной непрерывности к ограниченности f на [a,b]
Применим теперь равномерную непрерывность при \epsilon=1. Существует число \delta_1\gt 0 такое, что для любых x,y\in[a,b] выполняется
\displaystyle |x-y|\lt\delta_1\Rightarrow |f(x)-f(y)|\lt 1.
Разобьем теперь интервал [a,b] на конечное число подынтервалов длины меньшей, чем \delta_1. То есть выберем целое число n и точки
\displaystyle a = x_0 \lt x_1 \lt \cdots \lt x_n = b
такие, что для каждого k=0,1,\dots,n-1 выполняется
\displaystyle x_{k+1}-x_k\lt\delta_1.
Рассмотрим теперь конечное множество значений
\displaystyle \{f(x_0),f(x_1),\dots,f(x_{n-1})\}.
Так как это конечное множество действительных чисел, можно корректно определить
\displaystyle C = \max\{|f(x_k)| \;|\; k=0,1,\dots,n-1\}.
Покажем, что C+1 является верхней оценкой по модулю для f на всем интервале [a,b]. Пусть x\in[a,b] — произвольная точка. Тогда существует индекс k такой, что x\in[x_k,x_{k+1}]. В частности,
\displaystyle |x-x_k|\le x_{k+1}-x_k\lt\delta_1.
По равномерной непрерывности при \epsilon=1 из |x-x_k|\lt\delta_1 следует
\displaystyle |f(x)-f(x_k)|\lt 1.
Используя неравенство треугольника:
\displaystyle |f(x)|\le |f(x)-f(x_k)| + |f(x_k)| \lt 1 + |f(x_k)| \le 1 + C.
Так как x\in[a,b] было произвольно, заключаем, что
\displaystyle |f(x)|\le C+1 \quad \text{для всех } x\in[a,b],
то есть функция f является ограниченной на [a,b].
Шаг 6: Существование максимального и минимального значений
Определим множество значений функции на интервале:
\displaystyle H=\{f(x)\;|\;x\in[a,b]\}\subset\mathbb{R}.
Мы уже знаем, что H непусто (поскольку [a,b] непуст), и ограничено, поэтому по аксиоме супремума существуют действительные числа
\displaystyle M=\sup H,\qquad m=\inf H.
Докажем, что M достигается как значение функции, то есть существует x_1\in[a,b] такое, что f(x_1)=M. Доказательство проведем от противного.
Предположим, что f(x) никогда не достигает значения M, то есть:
\displaystyle (\forall x\in[a,b])\big(f(x)\lt M\big).
При этом предположении функция
\displaystyle g(x)=\frac{1}{M-f(x)}
корректно определена и положительна для всех x\in[a,b], поскольку по гипотезе M-f(x)\gt 0. Кроме того, поскольку f непрерывна, а M — константа, функция g также непрерывна. По первой части доказательства всякая непрерывная функция на [a,b] является ограниченной, поэтому существует число N\gt 0 такое, что
\displaystyle (\forall x\in[a,b])\big(g(x)\le N\big).
В частности, для любого x\in[a,b] выполняется
\displaystyle \frac{1}{M-f(x)} = g(x)\le N,
что эквивалентно
\displaystyle M-f(x)\ge \frac{1}{N} \quad\Rightarrow\quad f(x)\le M-\frac{1}{N}.
Это означает, что все значения f(x) на [a,b] меньше либо равны M-\frac{1}{N}. В частности, супремум множества H удовлетворяет
\displaystyle \sup H\le M-\frac{1}{N}\lt M,
что противоречит определению M как супремума H. Следовательно, наше первоначальное предположение было ложным, и существует точка x_1\in[a,b], такая что
\displaystyle f(x_1)=M.
Совершенно аналогичное рассуждение, применённое к инфимуму m=\inf H (например, рассмотрев функцию h(x)=-f(x)), показывает, что существует точка x_2\in[a,b], такая что
\displaystyle f(x_2)=m.
Интерпретация в терминах компактности и заключение
Мы доказали, что любая непрерывная функция f:[a,b]\to\mathbb{R} является ограниченной и достигает своих максимального и минимального значений на [a,b]. В современном языке анализа это интерпретируется следующим образом: в \mathbb{R} замкнутые и ограниченные интервалы, такие как [a,b], являются компактными множествами, а непрерывные функции отображают компактные множества в компактные множества.
В частности, если I является компактным множеством и f непрерывна на I, то образ f(I) является компактным подмножеством \mathbb{R}. Это гарантирует, что f(I) ограничено и что на нём действительно достигаются максимальное и минимальное значения, что и составляет содержание теоремы Вейерштрасса.
