连续概率分布

摘要
在这里我们将深入研究连续概率分布的概念，重点介绍五种最著名的分布的特点和用途：指数分布、矩形均匀分布、正态分布（高斯分布）、威布尔分布和伽马分布。我们将提供定义每种分布的数学公式，并研究这些分布的影响和实际应用，如评估放射性样品中的粒子发射或计算轨道上球的位置。此外，还详细介绍了通过应用特定参数如何修改和调整这些分布。

学习目标：
完成本课后，学生将能够：

理解什么是连续概率分布。
应用最著名的连续概率分布：指数分布、矩形均匀分布、正态分布（高斯分布）、威布尔分布和伽马分布。

内容目录：
什么是连续概率分布？
五种最著名的连续概率分布
指数分布
矩形均匀分布
正态分布（高斯分布）
威布尔分布
伽马分布
练习

当我们回顾关于样本空间时，我们看到它们可以分为两种类型：离散的和连续的。我们还回顾了什么构成了离散概率分布。现在轮到连续概率分布了。

什么是连续概率分布？

我们说一个随机变量 $X$ 具有连续概率分布，如果存在一个函数 $f_X : \mathbb{R} \longrightarrow \mathbb{R}^+,$ 我们称之为 $X$ 的密度，使得 $\forall A \subseteq \mathbb{R}$ 满足等式

$P(X\in A) = \displaystyle \int_A f_X(x)dx$

特别是，如果我们取 $A=]a,b]$ 则有

$P(a\lt X \leq b) = \displaystyle \int_a^b f_X(x)dx$

如果 $a=-\infty$

$F_X(x) = P( X \leq x) = \displaystyle \int_{-\infty}^x f_X(t)dt$

此外，根据概率分布的性质 (c) (见这里) 我们有

$\displaystyle \int_{-\infty}^{+\infty} f_X(t)dt = 1$

通过应用微积分的基本定理，可以得出对于一个连续分布， $F_X(x)$ 对所有 $x$ 都是连续的，并且它的导数是 $f_X(x)$ 在 $f_X(x)$ 连续的所有 $x$ 处。由于 $F_X(x)$ 的连续性和性质 (d) (见这里) 可以得出：

$P(x=X)=0$

因此

$P(x\leq X)= P(x\lt X)$

如果 $f$ 是任何满足 $f\geq 0$ 并且 $\displaystyle \int_{-\infty}^{+\infty}f(x)dx = 1,$ 的函数，那么它就是一个密度函数。

五种最著名的连续概率分布

指数分布

一个具有参数 $\alpha \gt 0$ 的指数分布函数 是一个形如 $F$ 的分布函数。

$F(t) = \left\{\begin{array}{lll} 1 - e^{-t/\alpha} & ; & t\geq 0 \\ \\ 0 & ; & t\lt 0 \end{array}\right.$

因此，它的密度函数是形如

$\displaystyle f(t) = \left\{\begin{array}{lll} \frac{1}{\alpha}e^{-t/\alpha} & ; & t\geq 0 \\ \\ 0 & ; & t\lt 0 \end{array}\right.$

如果一个随机变量具有参数 $\alpha$ 的指数分布，我们写作 $X\sim Ex(\alpha).$

在泊松分布的背景下，如果我们有一个放射性样品以平均发射率 $c,$ 发射粒子，那么发射第一个粒子的时间 $T$ 具有参数 $1/c.$ 的指数分布。换句话说 $T\sim Ex(1/c),$ 因此：

$P(T\geq t)= e^{-ct}$

矩形均匀分布

一个在区间 $[a,b]$ 上的矩形均匀分布 是由密度函数定义的分布

$f(x) = \left\{\begin{array}{lll} \displaystyle\frac{1}{b-a} & ; & x\in[a,b] \\ \\ 0 & ; & 其他情况 \end{array}\right.$

如果我们在区间 $[a,b],$ 的两端有界限的轨道上释放一个小球，并且它弹性碰撞边界，那么由于摩擦效应，停止位置的随机变量 $X$ 具有矩形均匀分布，写作 $X\sim Un(a,b)$ .

正态分布（高斯分布）

在连续概率分布中，正态分布是实践中最流行的一种。

标准正态分布

标准正态密度 定义为函数

$\displaystyle \phi_{0,1}(x) = \frac{1}{\sqrt{2\pi}} e^{-x^2/2}$

根据定义，很明显 $\phi\gt 0.$ 因此，可以验证这是一个概率密度，只需证实

$\displaystyle \int_{-\infty}^{+\infty}\phi_{0,1}(x)dx$

最后一个等式可以通过计算 $I^2$ 的值来证明，当 $I =\int_{-\infty}^{+\infty}\phi(x)dx=1.$ 实际上，我们有：

$\begin{array}{rl} I^2 & = \displaystyle \int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx \int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}} e^{-x^2/2}dx \\ \\ & = \displaystyle \int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx \int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}} e^{-y^2/2} dy \\ \\ & = \displaystyle \frac{1}{{2\pi}} \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} e^{-\frac{x^2 + y^2}{2}} dxdy \\ \\ \end{array}$

结果是

$\displaystyle \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} e^{-\frac{x^2 + y^2}{2}} dxdy = \int_{0}^{2\pi} \int_{0}^{+\infty} e^{-r^2/2} rdr d\theta = 2\pi$

因此 $I^2 = 1,$ 所以 $I=\int_{-\infty}^{+\infty}\phi_{0,1}(x)dx = 1.$

从标准正态密度定义标准正态分布 $\Phi_{0,1}(x) = \int_{-\infty}^x\phi_{0,1}(t)dt.$ 如果一个随机变量 $X$ 具有标准正态分布，那么写作 $X\sim N(0,1).$ 分布 $\Phi_{0,1}(x)$ 不能显式计算，但是有一些表格可以快速获得近似值。

具有参数 $\mu$ 和 $\sigma$ 的正态分布

从标准正态分布的密度 $\phi_{0,1}$ 可以构造具有参数 $\mu$ 和 $\sigma,$ 的正态分布密度，其中 $\mu\in\mathbb{R}$ 和 $\sigma\gt 0$ 分别是均值和标准差。具有这些参数的正态分布密度写为：

$\displaystyle\phi_{\mu,\sigma}(x) = \frac{1}{\sigma}\phi_{0,1}\left(\frac{x-\mu}{\sigma} \right)$

因此，具有参数 $\mu$ 和 $\sigma,$ 的正态分布 $\Phi_{\mu,\sigma}(x)$ ，形式如下

$\displaystyle \Phi_{\mu,\sigma}(x) = \int_{-\infty}^x\frac{1}{\sigma}\phi_{0,1}\left(\frac{t-\mu}{\sigma} \right)dt = \frac{1}{\sqrt{2\pi\sigma}}\int_{-\infty}^x e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt$

如果随机变量 $X$ 具有参数 $\mu, \sigma,$ 的正态分布，那么写作 $X\sim N(\mu, \sigma).$

威布尔分布

威布尔分布 具有参数 $\alpha,\beta \gt 0$ 的分布函数形式如下

$F(t) = \left\{\begin{array}{llr} \left(1 - e^{-t/\alpha} \right)^\beta & ; & t\geq 0 \\ \\ 0 & ; & t\lt 0 \end{array}\right.$

如果随机变量 $X$ 具有参数 $\alpha, \beta$ 的威布尔分布，写作 $X\sim We(\alpha,\beta).$ 威布尔分布是指数分布的一般化，注意 $We(\alpha,1) = Ex(\alpha).$

伽马分布

伽马分布 具有参数 $\beta,\alpha$ 的密度函数形式如下

$f(t) = \left\{\begin{array}{llr} \displaystyle \frac{1}{\alpha \Gamma(\beta)}\left(\frac{t}{\alpha} \right)^{\beta-1}e^{-t/\alpha} & ; & t\geq 0 \\ \\ 0 & ; & t\lt 0 \end{array}\right.$

其中 $\Gamma(s) = \displaystyle \int_0^{+\infty}u^{s-1}e^{-u}du$ 被称为“伽马函数”。

伽马函数的一个显著特性是它允许将自然数的阶乘推广到实数（甚至是复数）。通过分部积分可以轻松验证 $\Gamma(s+1) = s\Gamma(s)$ 。此外，由于 $\Gamma(1)=1$ ，结果是

$\left(\forall n\in\mathbb{N}\right)\left(\Gamma(n) = (n-1)! \right)$

如果随机变量 $X$ 具有参数 $\beta, \alpha$ 的伽马分布，写作 $X\sim Ga(\alpha,\beta).$ 伽马分布是指数分布的另一种推广，注意 $Ga(\alpha,1) = Ex(\alpha).$

在具有频率 $c$ 的泊松过程中（如放射性衰变），如果 $T$ 是表示第 m 次事件发生时刻的随机变量；那么，给定一个 $t\geq 0$ 和在时间间隔 $[0,t]$ 发生的事件数 $N$ ，有 $t\lt T \leftrightarrow N\lt m$ 并且， $N\sim Po(ct),$ 我们有：

$1-F_T(t) = P(T\gt t) = \displaystyle \sum_{k=0}^{m-1}Po(k; ct)=e^{-ct}\sum_{k=0}^{m-1}\frac{(ct)^k}{k!}$

因此，通过求导我们可以发现密度函数是

$\displaystyle f(t) = ce^{-ct}\frac{(ct)^{m-1}}{(m-1)!}$

因此， $T\sim Ga(1/c, m).$

练习

找到常数 $c$ 使 $\displaystyle f(x) = \frac{c}{x^2+1}$ 是一个概率密度函数，并计算相应的概率分布函数（柯西分布）
从分布 $Un(a.b),$ 的密度函数，确定其相应的分布函数。
证明函数 $\Phi_{\mu,\sigma}(x)$ 是一个概率分布函数。