随机变量和概率分布
摘要
这门课程深入介绍了随机变量和概率分布的概念,这些是概率论和统计分析的基础。课程介绍了随机变量的定义,即依赖于随机实验结果的数值。讨论了随机变量的分布函数,强调了其重要性及其基本属性。最后,分析了随机变量与概率分布之间的关系,解释了两个变量可以具有相同的分布但不是同一个随机变量。
学习目标:
在本课程结束时,学生将能够:
- 理解随机变量的概念:学生应能描述和解释什么是随机变量及其数学定义。
- 理解概率分布的概念:学生应能解释什么是概率分布以及如何表示。
- 描述概率分布的属性:学生应能识别和解释概率分布的关键属性。
- 分析随机变量与概率分布之间的关系:学生应能讨论随机变量与概率分布之间的相互关系,以及两个变量如何具有相同的分布但不是同一个随机变量。
- 证明并应用概率分布的属性在实际情况中:学生应能数学证明概率分布的属性并在实际情况中应用这些属性。
- 理解分布函数的概念:学生应能描述什么是分布函数以及如何用来描述随机变量。
内容目录:
什么是随机变量?
什么是概率分布?
概率分布的属性
随机变量与概率分布的关系
概率论和统计分析的关键概念之一是随机变量和概率分布。虽然我们到目前为止开发的理论在某种意义上是“完整的”,但实际上在目前状态下它相当原始;随机变量和概率分布是使我们能够“提高处理概率和进行统计分析能力”的概念。
什么是随机变量?
为了熟悉随机变量的概念,从直观的方法开始是有用的:可以将随机变量解释为“依赖于随机实验结果的数值”。然而,为了更精确的理解,必须进一步探索其正式定义。来看这个定义:
定义: 集合 \mathcal{X} 上的随机变量是一个函数 f:\Omega \longmapsto \mathcal{X} |
最常见的情况是 \mathcal{X}= \mathbb{R}, 并且,除非另有说明,否则这是我们将假设的情况;即,我们将处理具有实数值的随机变量。通常,随机变量用大写字母表示,如 X,Y,Z, \cdots,,而常数用小写字母表示。为简化起见,我们将随机变量简单称为“变量”。
例子: 假设掷一个六面骰子两次。然后我们将有: \Omega_{2d6} = \{(\omega_1, \omega_2)\;|\; \omega_1,\omega_2 \in \{1,2,3,4,5,6\}\} 基于此,我们可以定义以下随机变量:
|
什么是概率分布?
定义:随机变量 X 的分布函数(或“DF”) 是一个函数 F_X: \mathbb{R} \longmapsto \mathbb{R},由关系 F_X(x) = P(\{\omega \;|\; X(\omega)\leq x\}), 或更简洁地表示为:P(X\leq x). |
通常,对随机变量感兴趣的不在于其在样本空间 \Omega 中的明确表达,而是其分布函数。在上下文明确且没有歧义的情况下,F_X 中的下标 X 可以省略。常用符号 X\sim F 表示随机变量 X 具有分布函数 F.
概率分布的属性
如果 F 是一个概率分布 且 a,b 是任意实数,那么将满足以下属性:
(a) a\lt b \longrightarrow [P(a\lt X \leq b) = F(b) - F(a)]
(b) a\lt b \longrightarrow F(a) \leq F(b), 即 “F 是递增的”。
(c) \displaystyle\lim_{x\to +\infty} F(x) = 1 和 \displaystyle\lim_{x\to -\infty} F(x) = 0
(d) \displaystyle P(X=x)=\lim_{t\to x^+}F(t) - \lim_{t\to x^-}F(t)
(e) \displaystyle F(x)=\lim_{t\to x^+}F(t)
| 证明 (a) 设 A 和 B 分别为事件 \{X\leq a\} 和 \{X\leq b\},其中 a\lt b. 如果所有这些都发生,那么将有 A\subseteq B,因此将会发生: \color{blue}{P(a\lt X\leq b)} = P(B\setminus A) = P(B) - P(B\cap A) = P(B)-P(A) =\color{blue}{F(b) - F(a)} (b) 由部分 (a) 可得:由于 P(B\setminus A)\geq 0, 因此可得: F(b) - F(a) \geq 0 即 F(a) \leq F(b) (c) 这里我们将使用 F 是单调递增的事实(在 (b) 中已证明)且其最大值为“1”(因为分布是根据概率定义的)。仅此足以说明: \displaystyle \lim_{x\to +\infty} F(x) = 1 一种补充的方法允许我们做出相同结果的以下计算。 定义集合 A_n=\{\omega\;|\;X(\omega)\leq n\}. 由此可以容易地验证,对于任意 n,将有 A_{n}\subseteq A_{n+1}, \displaystyle\bigcup_{n\lt +\infty} A_n = \Omega,因此使用连续性属性可得: \displaystyle 1=P(\Omega) = P\left( \bigcup_{n\lt +\infty} A_n \right) = \lim_{n\to +\infty} P(A_n) = \lim_{n\to +\infty} P(\{\omega\;|\;X(\omega)\leq n\}) = \lim_{n\to +\infty} P(X\leq n)=\lim_{n\to +\infty}F(n) 即: \displaystyle \color{blue}{\lim_{x\to +\infty} F(x) = 1} 相反,对于 x\to -\infty 的极限,有如下情况: 首先定义集合 B_n=\{\omega\;|\;-n\lt X(\omega)\}. 由此可以验证: \displaystyle \lim_{n \to -\infty}F(n) = \lim_{n\to -\infty} P(X\leq n) = \lim_{n\to \infty} P(X\leq -n)= 1 - \lim_{n\to \infty} P(-n \lt X) = 1 - \lim_{n\to \infty}P(B_n)) = 1 - P(\Omega) = 1-1=0 (d) 理由与部分 (c) 类似。首先定义集合 \displaystyle C_n = \left\{x - \frac{1}{n} \leq X \leq x + \frac{1}{n}\right\} 由此可得: C_{n+1}\subseteq C_n \displaystyle \bigcap_{n\gt 0} C_n = \{X=x\} 因此,使用连续性属性的一个结果可得: \displaystyle P(X=x)=P\left(\bigcap_{n\gt 0} C_n \right) = \lim_{n\to \infty} P(C_n) = \lim_{x+1/n \to x^+}F\left(x+1/n\right) - \lim_{x-1/n \to x^-}F\left(x-1/n\right)= \lim_{t \to x^+}F\left(t\right) - \lim_{t \to x^-}F\left(t\right) (e) 最后一种情况是从前面的结果得出的。事实上,既然我们已经证明了: \displaystyle P(X=x)= \lim_{t \to x^+}F\left(t\right) - \lim_{t \to x^-}F\left(t\right) 我们可以写: \displaystyle \lim_{t \to x^+}F\left(t\right) = P(X=x) + \lim_{t \to x^-}F\left(t\right) = P(X=x) + \lim_{t\to x^-}P(X\leq t)= P(X\leq x) = F(x) |
随机变量与概率分布的关系
如果 X 和 Y 具有相同的概率分布,则 (\forall A\subseteq \mathbb{R})(P(X\in A) = P(Y\in A)).
定义在相同样本空间 \Omega 上的两个变量 X 和 Y 可能具有相同的分布,但不一定是相同的随机变量。例如,如果我们考虑掷一枚公平的双面硬币实验,X=1 代表正面,X=0 代表反面,可以定义随机变量 Y=1-X,那么将有 P(X=1) = P(Y=1)=0.5, 且两者具有相同的分布,但如果计算两者具有相同值的概率,将有 P(X=Y)=0
