欧几里得空间 {\mathbb{R}^n}
在本课程中,我们将探讨欧几里得空间 \mathbb{R}^n,其代数结构和度量性质。你将学习向量运算、内积、范数和欧几里得距离,这些概念在几何和分析中至关重要。本课程提供清晰的解释和直观的示例,使你能够理解如何在数学上建模多维空间。
学习目标:
完成本课程后,学生将能够:
- 定义欧几里得空间 \mathbb{R}^n 及其基本性质。
- 解释 \mathbb{R}^n 的向量结构及其基本运算。
- 应用 内积计算向量之间的角度和投影。
- 证明 \mathbb{R}^n 内积的代数和度量性质。
- 使用 欧几里得范数确定向量的大小。
- 计算 \mathbb{R}^n 中两点间的欧几里得距离,并分析其几何意义。
- 验证 重要的不等式,如柯西-施瓦茨不等式和三角不等式。
目录
欧几里得空间 \mathbb{R}^n
内积
范数与欧几里得距离
结论
向量空间 \mathbb{R}^n
在学习本节内容之前,你应该已经熟悉了实数集 \mathbb{R}, 平面 \mathbb{R}^2, 或者三维空间 \mathbb{R}^3. 这些概念有助于理解更高维的空间 \mathbb{R}^n. 具体来说,集合 \mathbb{R}^n = \{\vec{x} = (x_1, \cdots, x_n) | x_1, \cdots, x_n \in \mathbb{R}\}, 在向量加法和数乘运算的定义下构成一个向量空间。让我们深入探讨 \mathbb{R}^n 的基本运算。
\mathbb{R}^n 的基本运算
设 \vec{x}=(x_1, \cdots, x_n), \vec{y}=(y_1, \cdots, y_n) 是 \mathbb{R}^n 中的向量,\alpha 是任意实数。 那么,向量加法和数乘运算定义如下:
向量加法: 通过下述函数定义向量加法:
\begin{array}{rcrl} +:& \mathbb{R}^n \times \mathbb{R}^n & \longrightarrow & \mathbb{R}^n \\ & (\vec{x},\vec{y}) & \longmapsto & \vec{x}+\vec{y} = (x_1+y_1, \cdots, x_n + y_n) \end{array}
数乘运算: 通过下述函数定义数乘运算:
\begin{array}{rcrl} ():& \mathbb{R} \times \mathbb{R}^n & \longrightarrow & \mathbb{R}^n \\ & (\alpha,\vec{x}) & \longmapsto & (\alpha\vec{x}) = (\alpha x_1, \cdots, \alpha x_n) \end{array}
\mathbb{R}^n 的向量空间性质
由上述定义的运算,\mathbb{R}^n 是一个向量空间。
因为其加法和数乘运算满足如下性质:
首先,我们有交换律和结合律:
\vec{x} + \vec{y} = \vec{y} + \vec{x} \\ \vec{x} + (\vec{y} + \vec{z}) = (\vec{x} + \vec{y}) + \vec{z} \\ (\alpha \beta) \vec{x} = \alpha (\beta \vec{x}) = \beta (\alpha \vec{x}) = (\beta\alpha) \vec{x}
标量加法对数乘运算具有分配性,向量加法对数乘运算也具有分配性; 即满足以下等式:
(\alpha + \beta) \vec{x} = \alpha\vec{x} + \beta\vec{x} \\ \alpha(\vec{x} + \vec{y}) = \alpha\vec{x} + \alpha\vec{y}
存在一个加法单位元 \vec{0}=(0,\cdots, 0),使得:
\vec{x} + \vec{0} = \vec{x}
存在数乘单位元:
1 \vec{x} = \vec{x}
对于任意向量 \vec{x}\in\mathbb{R}^n,存在加法逆元 -\vec{x}, 使得:
\vec{x} + -\vec{x} = \vec{0}
内积
如果我们观察 \mathbb{R}^n 作为向量空间的构造,我们会发现它本身缺少向量之间的乘法运算;换句话说,我们不能像处理实数那样“相乘”两个向量。然而,我们可以通过定义 内积 来引入这种运算。
内积不应与数乘混淆, 前者是两个向量之间的运算,结果是一个标量,而后者是一个标量与向量之间的运算,结果是另一个向量。考虑 \mathbb{R}^n 中的两个向量 \vec{x}=(x_1, \cdots, x_n) 和 \vec{y}=(y_1, \cdots, y_n). 它们的内积定义如下:
\vec{x}\cdot\vec{y} =\displaystyle \sum_{i=1}^n x_i y_i = x_1y_1 + \cdots + x_ny_n
在 \mathbb{R}^n 中,内积有多种表示方法,一种是我们刚刚介绍的公式,另一种则基于 \mathbb{R}^n 的基底以及爱因斯坦求和约定: 如果 \{\hat{e}_i\}_{i=\overline{1,n}} 是 \mathbb{R}^n 的一组基(通常取标准基),那么向量 \vec{x} 和 \vec{y} 可以表示为:
\vec{x}=\displaystyle\sum_{i=1}^n x_i\hat{e}_i = x_1\hat{e}_1 + \cdots + x_n\hat{e}_n
\vec{y}=\displaystyle\sum_{i=1}^n y_i\hat{e}_i = y_1\hat{e}_1 + \cdots + y_n\hat{e}_n
这里明确表示了向量 x_i 和 y_i 的坐标是相对于基底的。
爱因斯坦求和约定
爱因斯坦求和约定 使得向量表示及内积运算更加简洁。如果我们观察上面的两个表达式,会发现索引 i 在向量的系数和基向量中都出现了。根据爱因斯坦的约定,出现重复索引时,我们可以默认存在求和运算,而无需显式写出求和符号,因此可以简化为:
\vec{x}= x_i\hat{e}_i
\vec{y}= y_i\hat{e}_i
使用这种记号,内积可以写成:
\vec{x}\cdot\vec{y} = x_i\hat{e}_i \cdot y_i\hat{e}_i = x_iy_i \underbrace{(\hat{e}_i \cdot \hat{e}_i)}_{=1} = x_iy_i
在最后的等式中,我们假设采用的是标准基。
内积的其他记号
向量及其运算的记号在不同上下文中可能有所不同, 本文前面使用的记号是微积分中最常见的。在线性代数中,我们有时会区分向量和共变向量(covector)。
当提到向量时,我们通常指的是”列向量”,其矩阵形式为:
\alpha^i = \left( \begin{array}{c}\alpha_1 \\ \vdots \\ \alpha_n \end{array} \right)
而共变向量(covector)通常指”行向量”,其矩阵表示如下:
\beta_i = \left( \beta_1 \; \cdots \; \beta_n \right)
因此,两个向量 \vec{x}=(x_1,\cdots,x_n) 和 \vec{y}=(y_1,\cdots,y_n) 的内积可以视为”共变向量” x_i 与向量 y^i 的矩阵乘积,结果是一个实数:
\left( x_1 \; \cdots \; x_n \right) \left( \begin{array}{c}y_1 \\ \vdots \\ y_n \end{array} \right) = x_iy^i
注意,在最后的等式中,我们再次使用了爱因斯坦求和约定,重复的索引表示求和。
在广义相对论和特殊相对论中,我们通常使用”协变记号”或”张量记号”来区分向量和共变向量。这种记号的优势在于它可以自然地推广到张量的运算,而张量正是我们稍后会详细讨论的概念。在量子力学中,通常采用 Bra-Ket 记号:
\left< x \right| =\left( x_1 \; \cdots \; x_n \right) \\ \\ \left|y\right> = \left( \begin{array}{c}y_1 \\ \vdots \\ y_n \end{array} \right)
这样,内积可以表示为 \left<x|y\right>.
内积的性质
从内积的定义出发,我们可以总结出一系列重要性质, 这些性质在未来的学习中会非常重要。
如果我们用内积定义函数 \tilde{\omega}(\vec{x})=\vec{\omega} \cdot \vec{x} = \omega_i x^i, 那么该函数 \tilde{\omega} 具备所有线性函数的性质。实际上,我们可以证明:
\begin{array}{rl} \tilde{\omega}(\alpha \vec{x} + \beta\vec{y}) = \alpha \tilde{\omega}(\vec{x}) + \beta\tilde{\omega}(\vec{y}) \end{array}
因此,像 \tilde{\omega} 这样由内积定义的对象被称为线性泛函。我们知道 \vec{x} 是向量空间 \mathbb{R}^n 的元素,而在某些情况下,\tilde{\omega} 则是 \mathbb{R}^n 的对偶空间中的对象。
因此,内积与线性函数之间存在着密切的关系。事实上,内积可以概括为一句话:“内积是一个双线性、对称、正定且非退化的形式”。 我们来逐一解析这些特性:
当我们说内积是双线性的,我们指的是如果 \vec{x},\vec{y} 和 \vec{z} 是 \mathbb{R}^n 中的向量,且 \alpha,\beta \in \mathbb{R}, 那么满足如下等式:
\begin{array}{rl} \vec{x}\cdot(\alpha \vec{y} + \beta\vec{z}) = \alpha (\vec{x}\cdot\vec{y}) + \beta(\vec{x}\cdot\vec{z}) \\ \\ (\alpha \vec{x} + \beta\vec{y})\cdot\vec{z} = \alpha (\vec{x} \cdot \vec{z}) + \beta(\vec{y}\cdot\vec{z}) \end{array}
内积是对称的,因为:
\forall(\vec{x},\vec{y}\in\mathbb{R}^n)(\vec{x}\cdot\vec{y} = \vec{y}\cdot\vec{x})
它是正定的,因为:
(\forall\vec{x}\in\mathbb{R}^n)(\vec{x}\cdot\vec{x} \geq 0)
最后,它是非退化的,因为:
\vec{x}\cdot\vec{x} = 0 \leftrightarrow \vec{x}=\vec{0}
范数与欧几里得距离
范数是一种衡量向量大小的方式, 当一个向量空间配备了一个范数时,我们称其为赋范向量空间。如果 \vec{x},\vec{y}\in\mathbb{R}^n 且 \lambda\in\mathbb{R}, 则函数 Norm( . ) 是一个范数,当且仅当它满足以下性质:
- Norm(\vec{x})\geq 0
- Norm(\vec{x}) = 0 \leftrightarrow \vec{x}=\vec{0}
- Norm(\lambda\vec{x}) = |\lambda| Norm(\vec{x})
- Norm(\vec{x} + \vec{y}) \leq Norm(\vec{x}) + Norm(\vec{y})
内积的一个重要方面 是它特别适用于定义数学上的距离概念,这种定义方式与我们直观理解两个点之间的距离相吻合。对于每个 \vec{x}\in\mathbb{R}^n,我们定义其欧几里得范数 \|\vec{x}\| 如下:
\|\vec{x}\| = \sqrt{\vec{x}\cdot\vec{x}}
因此,我们称欧几里得范数是由内积诱导出的范数。
距离,或称度量, 是一个用于描述”集合中两个元素之间分离程度”的函数。如果 \vec{x}, \vec{y}, \vec{z}\in\mathbb{R}^n 且 \lambda\in\mathbb{R}, 则函数 Dist( . ) 是一个距离,当且仅当它满足以下条件:
- Dist(\vec{x},\vec{y})=0 \leftrightarrow \vec{x}=\vec{y}
- Dist(\vec{x},\vec{y})=Dist(\vec{y},\vec{x})\geq 0
- Dist(\vec{x},\vec{z})\leq Dist(\vec{x},\vec{y}) + Dist(\vec{y},\vec{z})
最后一个表达式称为三角不等式,如果它不满足,则函数 Dist(.) 仅是”伪距离”或”伪度量”。一个带有距离的向量空间被称为度量空间。
基于欧几里得范数,我们定义了两个向量之间的欧几里得距离。对于 \vec{x},\vec{y}\in\mathbb{R}^n, 它们之间的欧几里得距离 dist_e(\vec{x},\vec{y}) 由下式给出:
dist_e(\vec{x},\vec{y}) = \|\vec{x} - \vec{y}\|
如果 \vec{x}=(x_1,\cdots,x_n) 且 \vec{y}=(y_1,\cdots, y_n), 那么根据内积和范数的性质,我们可以轻松证明:
dist_e(\vec{x},\vec{y}) = \sqrt{\displaystyle \sum_{i=1}^n (x_i - y_i)^2}
如果我们在向量空间 \mathbb{R}^n 中引入欧几里得距离,则得到的结构称为欧几里得空间。
因此,我们称欧几里得空间的度量是由欧几里得范数诱导出的度量。
欧几里得范数的性质
由于我们的研究重点是欧几里得空间,因此有必要回顾欧几里得范数的性质。
柯西-施瓦茨不等式
如果 \vec{x},\vec{y}\in\mathbb{R}^n, 则满足以下性质:
|\vec{x}\cdot\vec{y}|\leq \|\vec{x}\|\|\vec{y}\|
证明:
令 \lambda = (\vec{x}\cdot\vec{y})/\|\vec{y}\|^2, 则有:
\begin{array}{rl} 0\leq \|\vec{x} - \lambda \vec{y}\|^2 &= (\vec{x} - \lambda\vec{y}) \cdot (\vec{x} - \lambda\vec{y}) \\ \\ \displaystyle &= \vec{x}\cdot\vec{x} - \lambda\vec{x}\cdot\vec{y} + \lambda\vec{y}\cdot\vec{x} + \lambda^2(\vec{y}\cdot\vec{y})\\ \\ &= \|\vec{x}\|^2 - 2\lambda(\vec{x}\cdot\vec{y}) + \lambda^2 \|\vec{y}\|^2 \\ \\ \displaystyle &= \|\vec{x}\|^2 - 2\left(\frac{\vec{x}\cdot\vec{y}}{\|\vec{y}\|^2}\right)(\vec{x}\cdot\vec{y}) + \left(\frac{\vec{x}\cdot\vec{y}}{\|\vec{y}\|^2}\right)^2 {\|\vec{y}\|^2}\\ \\ \displaystyle &= \|\vec{x}\|^2 - 2\left(\frac{(\vec{x}\cdot\vec{y})^2}{\|\vec{y}\|^2}\right) + \frac{\left(\vec{x}\cdot\vec{y}\right)^2}{\|\vec{y}\|^2}\\ \\ &= \|\vec{x}\|^2 - \frac{\left(\vec{x}\cdot\vec{y}\right)^2}{\|\vec{y}\|^2} \end{array}
因此我们可以得出:
\displaystyle 0 \leq \|\vec{x}\|^2 - \frac{\left(\vec{x}\cdot\vec{y}\right)^2}{\|\vec{y}\|^2}
因此:
\left(\vec{x}\cdot\vec{y}\right)^2 \leq \|\vec{x}\|^2 \|\vec{y}\|^2
最终,取平方根得到所要证明的结论:
|\vec{x}\cdot\vec{y}| \leq \|\vec{x}\| \|\vec{y}\| ⬛
三角不等式
设 \vec{x},\vec{y}\in\mathbb{R}^n, 则这些向量满足以下关系:
\|\vec{x} + \vec{y}\| \leq \|\vec{x}\| + \|\vec{y}\|
证明:
首先我们注意到:
\begin{array}{rl} \|\vec{x} + \vec{y}\|^2 &= (\vec{x} + \vec{y})\cdot(\vec{x} + \vec{y}) \\ \\ &=\|\vec{x}\|^2 + 2(\vec{x}\cdot\vec{y}) + \|\vec{y}\|^2 \end{array}
由于以下关系成立:
\vec{x}\cdot\vec{y}\leq |\vec{x}\cdot\vec{y}| \leq \|\vec{x}\|\|\vec{y}\|
因此可以写成:
\begin{array}{rl} \|\vec{x} + \vec{y}\|^2 &\leq \|\vec{x}\|^2 + 2\|\vec{x}\|\|\vec{y}\| + \|\vec{y}\|^2 \\ \\ &\leq \left(\|\vec{x}\| + \|\vec{y}\| \right)^2 \end{array}
最终,取平方根后,得到要证明的结论:
\|\vec{x} + \vec{y}\|\leq \|\vec{x}\| + \|\vec{y}\| ⬛
结论
在本课程中,我们探讨了欧几里得空间 \mathbb{R}^n 的基本性质,包括其代数结构和度量结构。我们首先定义了基本运算,如向量加法和数乘,确立了其作为向量空间的特性。随后,我们深入研究了内积的概念及其在 \mathbb{R}^n 几何中的重要性,强调了其矩阵表示及其与线性函数的关系。
接着,我们分析了欧几里得范数及其诱导的距离,讨论了如何利用这些工具来度量该空间中的长度和距离。此外,我们回顾了两个重要的不等式:
|\vec{x}\cdot\vec{y}| \leq \|\vec{x}\| \|\vec{y}\|
柯西-施瓦茨不等式
\|\vec{x} + \vec{y}\|\leq \|\vec{x}\| + \|\vec{y}\|
三角不等式
这些性质在更高阶的分析与几何理论中具有关键作用。
