随机变量和概率分布

随机变量和概率分布

随机变量和概率分布

摘要
这门课程深入介绍了随机变量和概率分布的概念,这些是概率论和统计分析的基础。课程介绍了随机变量的定义,即依赖于随机实验结果的数值。讨论了随机变量的分布函数,强调了其重要性及其基本属性。最后,分析了随机变量与概率分布之间的关系,解释了两个变量可以具有相同的分布但不是同一个随机变量。


学习目标:
在本课程结束时,学生将能够:

  1. 理解随机变量的概念:学生应能描述和解释什么是随机变量及其数学定义。
  2. 理解概率分布的概念:学生应能解释什么是概率分布以及如何表示。
  3. 描述概率分布的属性:学生应能识别和解释概率分布的关键属性。
  4. 分析随机变量与概率分布之间的关系:学生应能讨论随机变量与概率分布之间的相互关系,以及两个变量如何具有相同的分布但不是同一个随机变量。
  5. 证明并应用概率分布的属性在实际情况中:学生应能数学证明概率分布的属性并在实际情况中应用这些属性。
  6. 理解分布函数的概念:学生应能描述什么是分布函数以及如何用来描述随机变量。


内容目录:
什么是随机变量?
什么是概率分布?
概率分布的属性
随机变量与概率分布的关系

概率论和统计分析的关键概念之一是随机变量和概率分布。虽然我们到目前为止开发的理论在某种意义上是“完整的”,但实际上在目前状态下它相当原始;随机变量和概率分布是使我们能够“提高处理概率和进行统计分析能力”的概念。



什么是随机变量?

为了熟悉随机变量的概念,从直观的方法开始是有用的:可以将随机变量解释为“依赖于随机实验结果的数值”。然而,为了更精确的理解,必须进一步探索其正式定义。来看这个定义:

定义: 集合 \mathcal{X} 上的随机变量是一个函数 f:\Omega \longmapsto \mathcal{X}

最常见的情况是 \mathcal{X}= \mathbb{R}, 并且,除非另有说明,否则这是我们将假设的情况;即,我们将处理具有实数值的随机变量。通常,随机变量用大写字母表示,如 X,Y,Z, \cdots,,而常数用小写字母表示。为简化起见,我们将随机变量简单称为“变量”。

例子: 假设掷一个六面骰子两次。然后我们将有:

\Omega_{2d6} = \{(\omega_1, \omega_2)\;|\; \omega_1,\omega_2 \in \{1,2,3,4,5,6\}\}

基于此,我们可以定义以下随机变量:

  • X= “出现一次的次数”
  • Y= “结果的总和” =\omega_1 + \omega_2
  • Z= “第二次掷骰子的结果” = \omega_2



什么是概率分布?

定义:随机变量 X 的分布函数(或“DF”) 是一个函数 F_X: \mathbb{R} \longmapsto \mathbb{R},由关系 F_X(x) = P(\{\omega \;|\; X(\omega)\leq x\}), 或更简洁地表示为:P(X\leq x).

通常,对随机变量感兴趣的不在于其在样本空间 \Omega 中的明确表达,而是其分布函数。在上下文明确且没有歧义的情况下,F_X 中的下标 X 可以省略。常用符号 X\sim F 表示随机变量 X 具有分布函数 F.



概率分布的属性

如果 F 是一个概率分布a,b 是任意实数,那么将满足以下属性:

(a) a\lt b \longrightarrow [P(a\lt X \leq b) = F(b) - F(a)]

(b) a\lt b \longrightarrow F(a) \leq F(b), 即 “F 是递增的”。

(c) \displaystyle\lim_{x\to +\infty} F(x) = 1\displaystyle\lim_{x\to -\infty} F(x) = 0

(d) \displaystyle P(X=x)=\lim_{t\to x^+}F(t) - \lim_{t\to x^-}F(t)

(e) \displaystyle F(x)=\lim_{t\to x^+}F(t)

证明

(a)AB 分别为事件 \{X\leq a\}\{X\leq b\},其中 a\lt b. 如果所有这些都发生,那么将有 A\subseteq B,因此将会发生:

\color{blue}{P(a\lt X\leq b)} = P(B\setminus A) = P(B) - P(B\cap A) = P(B)-P(A) =\color{blue}{F(b) - F(a)}

(b) 由部分 (a) 可得:由于 P(B\setminus A)\geq 0, 因此可得:

F(b) - F(a) \geq 0

F(a) \leq F(b)

(c) 这里我们将使用 F 是单调递增的事实(在 (b) 中已证明)且其最大值为“1”(因为分布是根据概率定义的)。仅此足以说明:

\displaystyle \lim_{x\to +\infty} F(x) = 1

一种补充的方法允许我们做出相同结果的以下计算。

定义集合 A_n=\{\omega\;|\;X(\omega)\leq n\}. 由此可以容易地验证,对于任意 n,将有 A_{n}\subseteq A_{n+1}, \displaystyle\bigcup_{n\lt +\infty} A_n = \Omega,因此使用连续性属性可得:

\displaystyle 1=P(\Omega) = P\left( \bigcup_{n\lt +\infty} A_n \right) = \lim_{n\to +\infty} P(A_n) = \lim_{n\to +\infty} P(\{\omega\;|\;X(\omega)\leq n\}) = \lim_{n\to +\infty} P(X\leq n)=\lim_{n\to +\infty}F(n)

即:

\displaystyle \color{blue}{\lim_{x\to +\infty} F(x) = 1}

相反,对于 x\to -\infty 的极限,有如下情况:

首先定义集合 B_n=\{\omega\;|\;-n\lt X(\omega)\}. 由此可以验证:

\displaystyle \lim_{n \to -\infty}F(n) = \lim_{n\to -\infty} P(X\leq n) = \lim_{n\to \infty} P(X\leq -n)= 1 - \lim_{n\to \infty} P(-n \lt X) = 1 - \lim_{n\to \infty}P(B_n)) = 1 - P(\Omega) = 1-1=0

(d) 理由与部分 (c) 类似。首先定义集合

\displaystyle C_n = \left\{x - \frac{1}{n} \leq X \leq x + \frac{1}{n}\right\}

由此可得:

C_{n+1}\subseteq C_n

\displaystyle \bigcap_{n\gt 0} C_n = \{X=x\}

因此,使用连续性属性的一个结果可得:

\displaystyle P(X=x)=P\left(\bigcap_{n\gt 0} C_n \right) = \lim_{n\to \infty} P(C_n) = \lim_{x+1/n \to x^+}F\left(x+1/n\right) - \lim_{x-1/n \to x^-}F\left(x-1/n\right)= \lim_{t \to x^+}F\left(t\right) - \lim_{t \to x^-}F\left(t\right)

(e) 最后一种情况是从前面的结果得出的。事实上,既然我们已经证明了:

\displaystyle P(X=x)= \lim_{t \to x^+}F\left(t\right) - \lim_{t \to x^-}F\left(t\right)

我们可以写:

\displaystyle \lim_{t \to x^+}F\left(t\right) = P(X=x) + \lim_{t \to x^-}F\left(t\right) = P(X=x) + \lim_{t\to x^-}P(X\leq t)= P(X\leq x) = F(x)



随机变量与概率分布的关系

如果 XY 具有相同的概率分布,则 (\forall A\subseteq \mathbb{R})(P(X\in A) = P(Y\in A)).

定义在相同样本空间 \Omega 上的两个变量 XY 可能具有相同的分布,但不一定是相同的随机变量。例如,如果我们考虑掷一枚公平的双面硬币实验,X=1 代表正面,X=0 代表反面,可以定义随机变量 Y=1-X,那么将有 P(X=1) = P(Y=1)=0.5, 且两者具有相同的分布,但如果计算两者具有相同值的概率,将有 P(X=Y)=0

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注