什么是常微分方程 (ODE)?
摘要:在本课程中,我们探讨了阶数为 k 的常微分方程(ODE),从其定义以及标准形式和一般形式的表示方法入手。通过雅可比矩阵和隐函数定理等概念,为理解这些方程的解及其相关性质(如定义域、显式解与隐式解)奠定了基础。
学习目标
完成本课程后,学生将能够:
- 记住常微分方程(ODE)的定义及其基本特征。
- 解释ODE 与其可能解之间的关系。
目录
阶数为 k 的常微分方程 (ODE)
隐函数定理
常微分方程的解
注意解的定义域
拓展解与最大解
显式解与隐式解
通过目前的学习,我们已经对微分方程的概念以及它们可能的多种应用有了相当清晰的理解。现在我们将暂停下来,研究一些定义与性质,以建立一个坚实的共同基础来继续深入学习。
阶数为 k 的常微分方程
常微分方程(ODE) 是一种包含一个自变量 x、一个函数 y(x) 以及该函数某些阶数的普通导数的方程。y(x) 的一阶导数可以记作 \frac{dy(x)}{dx} 或 y'(x),二阶导数可以记作 \frac{d^2y(x)}{dx^2} 或 y''(x),一般地,n 阶导数记作 \frac{d^ny(x)}{dx^n} 或 y^{(n)}(x)。若某个最大值 k 使得 y^{(k)}(x) 出现在方程中,则称该方程的阶数为 k。因此,阶数为 k 的常微分方程的一般形式为:
F\left(x,y(x),y'(x), \cdots, y^{(k)}(x)\right)=0.
当该方程可以将 y^{(k)}(x) 显式表示出来时,我们说该阶数为 k 的常微分方程是标准形式,即:
y^{(k)}(x) = f\left(x,y(x),y'(x), \cdots, y^{(k-1)}(x)\right).
通常情况下,函数 y 是一个函数 \mathbb{R} \longrightarrow \mathbb{R}^n,,意味着它及其导数在任意一点 x\in\mathbb{R} 上的值是 \mathbb{R}^n 中的向量。在此前提下,我们得出:描述阶数为 k 的常微分方程的函数 F 有 1+(k+1) 个变量,因此 \text{Dom}(F)\subset \mathbb{R}^{1+n(k+1)},而 \text{Rec}(F)\subset \mathbb{R};类似地,\text{Dom}(f) = \mathbb{R}^{1+nk} 且 \text{Rec}(f)\subset \mathbb{R}^n。
从阶数为 k 的常微分方程的一般形式转换为标准形式,是依赖于隐函数定理的。
隐函数定理
设 F 是定义在开集 U \subset \mathbb{R}^n 上的 \mathcal{C}^1 类函数,其取值为实数。设 (a_1,\cdots, a_n) \in U,且满足 F(a_1,\cdots, a_n) = 0 且
\displaystyle \frac{\partial F(a_1,\cdots, a_n)}{\partial x_n} \neq 0
那么存在一个邻域 V,使得 (a_1, \cdots, a_{n-1}) \in \mathbb{R}^{n-1},并存在一个函数 \varphi:V \longrightarrow \mathbb{R} 使得:
- V \times \varphi(V) \subset U
- F(x_1,\cdots,x_{n-1},x_n) = 0 \leftrightarrow x_n = \varphi(x_1,\cdots, x_{n-1})
- \varphi 可微,且
\displaystyle\dfrac{\partial \varphi (a_1,\cdots, a_{n-1})}{\partial x_i} = - \dfrac{ \dfrac{\partial F (a_1,\cdots, a_n)}{\partial x_i} }{ \dfrac{\partial F (a_1,\cdots, a_n)}{\partial x_n} }
隐函数定理的证明
从雅可比矩阵出发的推导
设 \psi(x_1,\cdots,x_{n-1}, x_n) = (x_1,\cdots,x_{n-1}, F(x_1,\cdots, x_n)). 若我们计算其雅可比矩阵,如下所示:
\displaystyle \left( \dfrac{\partial \psi(x_1,\cdots, x_n)}{\partial(x_1,\cdots, x_n)} \right) = \left( \begin{array}{cccc} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & \vdots \\ \vdots &\vdots & \ddots & \vdots \\ \displaystyle \dfrac{\partial F(x_1, \cdots, x_n)}{\partial x_1} & \dfrac{\partial F(x_1, \cdots, x_n)}{\partial x_2} & \cdots & \dfrac{\partial F(x_1, \cdots, x_n)}{\partial x_n} \end{array}\right),
我们可以看到该矩阵在点 (a_1,\cdots, a_n) 处的行列式不为零,正如我们一开始所设 \partial F(a_1,\cdots, a_n)/\partial x_n \neq 0. 基于此,我们可以得出 \psi 在包含 (a_1,\cdots, a_n) 的开集 W 上是可逆的。
解的构造
现在,考虑集合
\tilde{V}=\psi(W)\ni \psi(a_1,\cdots,a_{n}) = (a_1,\cdots,a_{n-1},F(a_1,\cdots,a_{n}))=(a_1,\cdots,a_{n-1},0).
据此我们可以定义另一个集合
V=\{(x_1,\cdots,x_{n-1}) \;|\; (x_1,\cdots,x_{n-1},0)\in \tilde{V}\}\ni (a_1,\cdots,a_{n-1})
集合 V 因此是一个包含 (a_1,\cdots,a_{n-1})\in\mathbb{R}^{n-1} 的开集。
此外,由于 \psi 在 W 上可逆,存在唯一的 (y_1,\cdots,y_n)\in W 使得 \psi(y_1,\cdots,y_n) = (x_1,\cdots,x_{n-1},0)。这意味着:
\begin{array}{rl} y_1 &= x_1 \\ \\ \vdots & \vdots \\ \\ y_{n-1} &= x_{n-1} \\ \\ F(x_1,\cdots,x_{n-1},y_n) &= 0 \end{array}
由此我们可以定义 \varphi(x_1,\cdots,x_{n-1}) = y_n,使得:
\psi^{-1}(x_1,\cdots,x_{n-1},0) = (x_1,\cdots,x_{n-1},\varphi(x_1,\cdots,x_{n-1}))
且
F(x_1,\cdots,x_{n-1},\varphi(x_1,\cdots,x_{n-1})) = 0
据此可知,\varphi(V)\ni a_n, 从而有 V\times\varphi(V) \subset U, 并且:
F(x_1,\cdots,x_{n-1},x_n) = 0 \leftrightarrow x_n = \varphi(x_1,\cdots,x_{n-1})
可微性
最后,\psi 的可微性意味着其逆函数 \psi^{-1} 也可微,从而函数 \varphi 在 V 上可微。在此基础上,我们定义一个函数 g 如下:
g(x_1, \cdots,x_{n-1}) = F(x_1,\cdots,x_{n-1},\varphi(x_1,\cdots,x_{n-1})) = 0
接着,利用链式法则我们有:
\displaystyle \frac{\partial g}{\partial x_i} = \frac{\partial F}{\partial x_i} + \frac{\partial F}{\partial x_n}\frac{\partial \varphi }{\partial x_i} = 0,
其中 i=1,\cdots, n-1. 由此可得:
\displaystyle \dfrac{\partial \varphi(a_1,\cdots,a_{n-1})}{\partial x_i} = - \dfrac{\dfrac{\partial F(a_1,\cdots,a_{n})}{\partial x_i}}{\dfrac{\partial F(a_1,\cdots,a_{n})}{\partial x_n}}
至此,所有需要证明的内容已完成 ■
常微分方程的解
y^{(n)} = f(x,y(x),y^\prime(x),\cdots,y^{(n-1)(x)})
那么,一个函数 \varphi : I_\phi \longmapsto \mathbb{R}^n,,其中 I_\phi 是 \mathbb{R} 中的一个区间,如果满足:
\left(\forall x \in I_\phi \right) \left(\varphi^{(n)}(x) = f(x,\varphi(x),\varphi^\prime(x),\cdots,\varphi^{(n-1)(x)}\right)
则称 函数是该常微分方程的一个解。
注意解的定义域
在这里必须特别强调 明确声明微分方程解的定义域的重要性。例如,在前一段中提到的函数 \phi 的定义域为区间 I_\phi. 这是重要的,因为在处理常微分方程时,一个常见错误是将两个解 \phi_1 和 \phi_2 视为相同,仅因为它们在公共区间内的函数值相等,即:
\left(\forall x \in I_{\phi_1}\cap I_{\phi_2}\right)\left(\phi_1(x) = \phi_2(x)\right),
尽管 I_{\phi_1}\neq I_{\phi_2}. 为了说明这一点,我们来看如下的微分方程:
y^\prime = -y^2.
该方程的一个可能解是函数 \psi_1 : ]0,+\infty[ \longrightarrow \mathbb{R}^+\setminus\{0\},其定义为 \psi_1(x)=1/x,,因为对任意 x\in]0,+\infty[ 都有:
\psi_1^{\prime} = -1/x^2 = -\psi_1^2
但如果我们不注意细节,通过代数技巧,可以构造出一个完全不同的解。例如:
\displaystyle \frac{1}{x} = \frac{1}{1 - (1-x)},
该等式右边实际上是几何级数的和:
\displaystyle \sum_{n=0}^{+\infty} (1-x)^n = \frac{1}{1 - (1-x)}
因此,对于不熟悉这些技巧的人来说,可能会错误地认为函数 \psi_1 与 \psi_2 = \sum_{n=0}^{+\infty} (1-x)^n 提供了相同的微分方程解,因为它们在某些点的函数值确实相同。但会忽略一个关键点:该几何级数仅在 |1-x| \lt 1,也就是当 x\in]0,2[ 时才收敛。而且,既然 ]0,2[\subset]0,+\infty[,我们有理由说 \psi_1 是 \psi_2 的延拓函数,因为 \psi_1 在 \psi_2 有定义的地方也有定义,甚至在更大的区间上也有定义。
拓展解与最大解
我们考虑两个函数 \phi_1 和 \phi_2,分别定义在区间 I_{\phi_1} 和 I_{\phi_2} 上,它们都是某个微分方程的解。如果 I_{\phi_1}\subset I_{\phi_2}, 那么我们说解 \phi_2 是对解 \phi_1 的拓展,或者说 \phi_2 是比 \phi_1 更一般的解。如果一个解 \phi 不存在其他非平凡方式可以将其拓展的情形,则称它为“最大解”。
显式解与隐式解
一个函数 \phi 被认为是阶数为 n 的常微分方程(以标准形式表示)的解:
y^{(n)}(x)=f(x,y(x),y^\prime(x),\cdots,y^{(n-1)}(x)),
若在区间 I 上满足:
(\forall x\in I)\left(\phi^{n}(x) = f(x,\phi(x),\phi^\prime(x),\cdots,\phi^{(n-1)}(x))\right)
我们在前面几段所讨论的就是所谓的该微分方程在区间 I 上的显式解。正如名称所示,也存在以隐式方式定义解的形式。我们称一个关系式 \Phi(x,y)=0 为该微分方程在区间 I 上的隐式解,如果它在 I 上定义了两个或多个隐式解。
结语
在本节课中,我们以严谨而易懂的方式剖析了常微分方程的概念,建立了形式化的基础,使我们不仅能够识别一个常微分方程,还能理解其解的背后逻辑。多亏了隐函数定理,我们得以清楚地解释从其一般形式到标准形式的转换,这对于处理具体问题是一项关键的技术能力。
此外,我们清楚地区分了解的不同类型:显式解与隐式解,拓展解与最大解,并特别强调了对定义域作出明确声明的重要性——这一点常常被低估。这些区别不仅是形式上的,更是操作上的;忽视它们,正如我们所见,可能导致严重的概念性错误。
通过这个结尾,我们已获得了一把锋利的工具。理解常微分方程不应仅仅停留在求解一个公式上:它需要批判性思维、对细节的关注,以及牢固的概念基础,从而使我们能持续前进,不迷失方向。而这,仅仅是个开始。
