随机变量和概率分布

摘要
这门课程深入介绍了随机变量和概率分布的概念，这些是概率论和统计分析的基础。课程介绍了随机变量的定义，即依赖于随机实验结果的数值。讨论了随机变量的分布函数，强调了其重要性及其基本属性。最后，分析了随机变量与概率分布之间的关系，解释了两个变量可以具有相同的分布但不是同一个随机变量。

学习目标：
在本课程结束时，学生将能够：

理解随机变量的概念：学生应能描述和解释什么是随机变量及其数学定义。
理解概率分布的概念：学生应能解释什么是概率分布以及如何表示。
描述概率分布的属性：学生应能识别和解释概率分布的关键属性。
分析随机变量与概率分布之间的关系：学生应能讨论随机变量与概率分布之间的相互关系，以及两个变量如何具有相同的分布但不是同一个随机变量。
证明并应用概率分布的属性在实际情况中：学生应能数学证明概率分布的属性并在实际情况中应用这些属性。
理解分布函数的概念：学生应能描述什么是分布函数以及如何用来描述随机变量。

内容目录:
什么是随机变量？
什么是概率分布？
概率分布的属性
随机变量与概率分布的关系

概率论和统计分析的关键概念之一是随机变量和概率分布。虽然我们到目前为止开发的理论在某种意义上是“完整的”，但实际上在目前状态下它相当原始；随机变量和概率分布是使我们能够“提高处理概率和进行统计分析能力”的概念。

什么是随机变量？

为了熟悉随机变量的概念，从直观的方法开始是有用的：可以将随机变量解释为“依赖于随机实验结果的数值”。然而，为了更精确的理解，必须进一步探索其正式定义。来看这个定义：

定义： 集合 $\mathcal{X}$ 上的随机变量是一个函数 $f:\Omega \longmapsto \mathcal{X}$

最常见的情况是 $\mathcal{X}= \mathbb{R},$ 并且，除非另有说明，否则这是我们将假设的情况；即，我们将处理具有实数值的随机变量。通常，随机变量用大写字母表示，如 $X,Y,Z, \cdots,$ ，而常数用小写字母表示。为简化起见，我们将随机变量简单称为“变量”。

例子： 假设掷一个六面骰子两次。然后我们将有：

$\Omega_{2d6} = \{(\omega_1, \omega_2)\;|\; \omega_1,\omega_2 \in \{1,2,3,4,5,6\}\}$

基于此，我们可以定义以下随机变量：

$X=$ “出现一次的次数”
$Y=$ “结果的总和” $=\omega_1 + \omega_2$
$Z=$ “第二次掷骰子的结果” $= \omega_2$

什么是概率分布？

定义：随机变量 $X$ 的分布函数（或“DF”） 是一个函数 $F_X: \mathbb{R} \longmapsto \mathbb{R}$ ，由关系 $F_X(x) = P(\{\omega \;|\; X(\omega)\leq x\}),$ 或更简洁地表示为： $P(X\leq x).$

通常，对随机变量感兴趣的不在于其在样本空间 $\Omega$ 中的明确表达，而是其分布函数。在上下文明确且没有歧义的情况下， $F_X$ 中的下标 $X$ 可以省略。常用符号 $X\sim F$ 表示随机变量 $X$ 具有分布函数 $F.$

概率分布的属性

如果 $F$ 是一个概率分布 且 $a,b$ 是任意实数，那么将满足以下属性：

(a) $a\lt b \longrightarrow [P(a\lt X \leq b) = F(b) - F(a)]$

(b) $a\lt b \longrightarrow F(a) \leq F(b),$ 即 “F 是递增的”。

(d) $\displaystyle P(X=x)=\lim_{t\to x^+}F(t) - \lim_{t\to x^-}F(t)$

(e) $\displaystyle F(x)=\lim_{t\to x^+}F(t)$

证明

(a) 设 $A$ 和 $B$ 分别为事件 $\{X\leq a\}$ 和 $\{X\leq b\}$ ，其中 $a\lt b.$ 如果所有这些都发生，那么将有 $A\subseteq B$ ，因此将会发生：

$\color{blue}{P(a\lt X\leq b)} = P(B\setminus A) = P(B) - P(B\cap A) = P(B)-P(A) =\color{blue}{F(b) - F(a)}$

(b) 由部分 (a) 可得：由于 $P(B\setminus A)\geq 0,$ 因此可得：

$F(b) - F(a) \geq 0$

即

$F(a) \leq F(b)$

(c) 这里我们将使用 $F$ 是单调递增的事实（在 (b) 中已证明）且其最大值为“1”（因为分布是根据概率定义的）。仅此足以说明：

$\displaystyle \lim_{x\to +\infty} F(x) = 1$

一种补充的方法允许我们做出相同结果的以下计算。

定义集合 $A_n=\{\omega\;|\;X(\omega)\leq n\}.$ 由此可以容易地验证，对于任意 $n$ ，将有 $A_{n}\subseteq A_{n+1},$ $\displaystyle\bigcup_{n\lt +\infty} A_n = \Omega$ ，因此使用连续性属性可得：

$\displaystyle 1=P(\Omega) = P\left( \bigcup_{n\lt +\infty} A_n \right) = \lim_{n\to +\infty} P(A_n) = \lim_{n\to +\infty} P(\{\omega\;|\;X(\omega)\leq n\}) = \lim_{n\to +\infty} P(X\leq n)=\lim_{n\to +\infty}F(n)$

即：

$\displaystyle \color{blue}{\lim_{x\to +\infty} F(x) = 1}$

相反，对于 $x\to -\infty$ 的极限，有如下情况：

首先定义集合 $B_n=\{\omega\;|\;-n\lt X(\omega)\}.$ 由此可以验证：

$\displaystyle \lim_{n \to -\infty}F(n) = \lim_{n\to -\infty} P(X\leq n) = \lim_{n\to \infty} P(X\leq -n)= 1 - \lim_{n\to \infty} P(-n \lt X) = 1 - \lim_{n\to \infty}P(B_n)) = 1 - P(\Omega) = 1-1=0$

(d) 理由与部分 (c) 类似。首先定义集合

$\displaystyle C_n = \left\{x - \frac{1}{n} \leq X \leq x + \frac{1}{n}\right\}$

由此可得：

$C_{n+1}\subseteq C_n$

$\displaystyle \bigcap_{n\gt 0} C_n = \{X=x\}$

因此，使用连续性属性的一个结果可得：

$\displaystyle P(X=x)=P\left(\bigcap_{n\gt 0} C_n \right) = \lim_{n\to \infty} P(C_n) = \lim_{x+1/n \to x^+}F\left(x+1/n\right) - \lim_{x-1/n \to x^-}F\left(x-1/n\right)= \lim_{t \to x^+}F\left(t\right) - \lim_{t \to x^-}F\left(t\right)$

(e) 最后一种情况是从前面的结果得出的。事实上，既然我们已经证明了：

$\displaystyle P(X=x)= \lim_{t \to x^+}F\left(t\right) - \lim_{t \to x^-}F\left(t\right)$

我们可以写：

$\displaystyle \lim_{t \to x^+}F\left(t\right) = P(X=x) + \lim_{t \to x^-}F\left(t\right) = P(X=x) + \lim_{t\to x^-}P(X\leq t)= P(X\leq x) = F(x)$

随机变量与概率分布的关系

如果 $X$ 和 $Y$ 具有相同的概率分布，则 $(\forall A\subseteq \mathbb{R})(P(X\in A) = P(Y\in A)).$

定义在相同样本空间 $\Omega$ 上的两个变量 $X$ 和 $Y$ 可能具有相同的分布，但不一定是相同的随机变量。例如，如果我们考虑掷一枚公平的双面硬币实验， $X=1$ 代表正面， $X=0$ 代表反面，可以定义随机变量 $Y=1-X$ ，那么将有 $P(X=1) = P(Y=1)=0.5,$ 且两者具有相同的分布，但如果计算两者具有相同值的概率，将有 $P(X=Y)=0$

随机变量和概率分布

什么是随机变量？

什么是概率分布？

概率分布的属性

随机变量与概率分布的关系

发表回复