连续概率分布

连续概率分布

连续概率分布

摘要
在这里我们将深入研究连续概率分布的概念,重点介绍五种最著名的分布的特点和用途:指数分布、矩形均匀分布、正态分布(高斯分布)、威布尔分布和伽马分布。我们将提供定义每种分布的数学公式,并研究这些分布的影响和实际应用,如评估放射性样品中的粒子发射或计算轨道上球的位置。此外,还详细介绍了通过应用特定参数如何修改和调整这些分布。


学习目标:
完成本课后,学生将能够:

  1. 理解什么是连续概率分布。
  2. 应用最著名的连续概率分布:指数分布、矩形均匀分布、正态分布(高斯分布)、威布尔分布和伽马分布。


内容目录
什么是连续概率分布?
五种最著名的连续概率分布
指数分布
矩形均匀分布
正态分布(高斯分布)
威布尔分布
伽马分布
练习

当我们回顾关于 样本空间 时,我们看到它们可以分为两种类型:离散的和连续的。我们还回顾了什么构成了 离散概率分布。 现在轮到连续概率分布了。

 



什么是连续概率分布?

我们说一个随机变量 X 具有连续概率分布,如果存在一个函数 f_X : \mathbb{R} \longrightarrow \mathbb{R}^+, 我们称之为 X 的密度,使得 \forall A \subseteq \mathbb{R} 满足等式

P(X\in A) = \displaystyle \int_A f_X(x)dx

特别是,如果我们取 A=]a,b] 则有

P(a\lt X \leq b) = \displaystyle \int_a^b f_X(x)dx

如果 a=-\infty

F_X(x) = P( X \leq x) = \displaystyle \int_{-\infty}^x f_X(t)dt

此外,根据概率分布的性质 (c) (见这里) 我们有

\displaystyle \int_{-\infty}^{+\infty} f_X(t)dt = 1

通过应用微积分的基本定理,可以得出对于一个连续分布,F_X(x) 对所有 x 都是连续的,并且它的导数是 f_X(x)f_X(x) 连续的所有 x 处。由于 F_X(x) 的连续性和性质 (d) (见这里) 可以得出:

P(x=X)=0

因此

P(x\leq X)= P(x\lt X)

如果 f 是任何满足 f\geq 0 并且 \displaystyle \int_{-\infty}^{+\infty}f(x)dx = 1, 的函数,那么它就是一个密度函数。



五种最著名的连续概率分布



指数分布

一个具有参数 \alpha \gt 0 的指数分布函数 是一个形如 F 的分布函数。

F(t) = \left\{\begin{array}{lll} 1 - e^{-t/\alpha} & ; & t\geq 0 \\ \\ 0 & ; & t\lt 0 \end{array}\right.

因此,它的密度函数是形如

\displaystyle f(t) = \left\{\begin{array}{lll} \frac{1}{\alpha}e^{-t/\alpha} & ; & t\geq 0 \\ \\ 0 & ; & t\lt 0 \end{array}\right.

如果一个随机变量具有参数 \alpha 的指数分布,我们写作 X\sim Ex(\alpha).

在泊松分布的背景下,如果我们有一个放射性样品以平均发射率 c, 发射粒子,那么发射第一个粒子的时间 T 具有参数 1/c. 的指数分布。换句话说 T\sim Ex(1/c), 因此:

P(T\geq t)= e^{-ct}



矩形均匀分布

一个在区间 [a,b] 上的矩形均匀分布 是由密度函数定义的分布

f(x) = \left\{\begin{array}{lll} \displaystyle\frac{1}{b-a} & ; & x\in[a,b] \\ \\ 0 & ; & 其他情况 \end{array}\right.

如果我们在区间 [a,b], 的两端有界限的轨道上释放一个小球,并且它弹性碰撞边界,那么由于摩擦效应,停止位置的随机变量 X 具有矩形均匀分布,写作 X\sim Un(a,b).



正态分布(高斯分布)

在连续概率分布中,正态分布是实践中最流行的一种。

标准正态分布

标准正态密度 定义为函数

\displaystyle \phi_{0,1}(x) = \frac{1}{\sqrt{2\pi}} e^{-x^2/2}

根据定义,很明显 \phi\gt 0. 因此,可以验证这是一个概率密度,只需证实

\displaystyle \int_{-\infty}^{+\infty}\phi_{0,1}(x)dx

最后一个等式可以通过计算 I^2 的值来证明,当 I =\int_{-\infty}^{+\infty}\phi(x)dx=1. 实际上,我们有:

\begin{array}{rl} I^2 & = \displaystyle \int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx \int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}} e^{-x^2/2}dx \\ \\ & = \displaystyle \int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx \int_{-\infty}^{+\infty}\frac{1}{\sqrt{2\pi}} e^{-y^2/2} dy \\ \\ & = \displaystyle \frac{1}{{2\pi}} \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} e^{-\frac{x^2 + y^2}{2}} dxdy \\ \\ \end{array}

结果是

\displaystyle \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} e^{-\frac{x^2 + y^2}{2}} dxdy = \int_{0}^{2\pi} \int_{0}^{+\infty} e^{-r^2/2} rdr d\theta = 2\pi

因此 I^2 = 1, 所以 I=\int_{-\infty}^{+\infty}\phi_{0,1}(x)dx = 1.

从标准正态密度定义标准正态分布 \Phi_{0,1}(x) = \int_{-\infty}^x\phi_{0,1}(t)dt. 如果一个随机变量 X 具有标准正态分布,那么写作 X\sim N(0,1). 分布 \Phi_{0,1}(x) 不能显式计算,但是有一些表格可以快速获得近似值。

具有参数 \mu\sigma 的正态分布

从标准正态分布的密度 \phi_{0,1} 可以构造具有参数 \mu\sigma, 的正态分布密度,其中 \mu\in\mathbb{R}\sigma\gt 0 分别是均值和标准差。具有这些参数的正态分布密度写为:

\displaystyle\phi_{\mu,\sigma}(x) = \frac{1}{\sigma}\phi_{0,1}\left(\frac{x-\mu}{\sigma} \right)

因此,具有参数 \mu\sigma, 的正态分布 \Phi_{\mu,\sigma}(x),形式如下

\displaystyle \Phi_{\mu,\sigma}(x) = \int_{-\infty}^x\frac{1}{\sigma}\phi_{0,1}\left(\frac{t-\mu}{\sigma} \right)dt = \frac{1}{\sqrt{2\pi\sigma}}\int_{-\infty}^x e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt

如果随机变量 X 具有参数 \mu, \sigma, 的正态分布,那么写作 X\sim N(\mu, \sigma).



威布尔分布

威布尔分布 具有参数 \alpha,\beta \gt 0 的分布函数形式如下

F(t) = \left\{\begin{array}{llr} \left(1 - e^{-t/\alpha} \right)^\beta & ; & t\geq 0 \\ \\ 0 & ; & t\lt 0 \end{array}\right.

如果随机变量 X 具有参数 \alpha, \beta 的威布尔分布,写作 X\sim We(\alpha,\beta). 威布尔分布是指数分布的一般化,注意 We(\alpha,1) = Ex(\alpha).



伽马分布

伽马分布 具有参数 \beta,\alpha 的密度函数形式如下

f(t) = \left\{\begin{array}{llr} \displaystyle \frac{1}{\alpha \Gamma(\beta)}\left(\frac{t}{\alpha} \right)^{\beta-1}e^{-t/\alpha} & ; & t\geq 0 \\ \\ 0 & ; & t\lt 0 \end{array}\right.

其中 \Gamma(s) = \displaystyle \int_0^{+\infty}u^{s-1}e^{-u}du 被称为“伽马函数”。

伽马函数的一个显著特性是它允许将自然数的阶乘推广到实数(甚至是复数)。通过分部积分可以轻松验证 \Gamma(s+1) = s\Gamma(s)。此外,由于 \Gamma(1)=1,结果是

\left(\forall n\in\mathbb{N}\right)\left(\Gamma(n) = (n-1)! \right)

如果随机变量 X 具有参数 \beta, \alpha 的伽马分布,写作 X\sim Ga(\alpha,\beta). 伽马分布是指数分布的另一种推广,注意 Ga(\alpha,1) = Ex(\alpha).

在具有频率 c 的泊松过程中(如放射性衰变),如果 T 是表示第 m 次事件发生时刻的随机变量;那么,给定一个 t\geq 0 和在时间间隔 [0,t] 发生的事件数 N,有 t\lt T \leftrightarrow N\lt m 并且,N\sim Po(ct), 我们有:

1-F_T(t) = P(T\gt t) = \displaystyle \sum_{k=0}^{m-1}Po(k; ct)=e^{-ct}\sum_{k=0}^{m-1}\frac{(ct)^k}{k!}

因此,通过求导我们可以发现密度函数是

\displaystyle f(t) = ce^{-ct}\frac{(ct)^{m-1}}{(m-1)!}

因此,T\sim Ga(1/c, m).



练习

  1. 找到常数 c 使 \displaystyle f(x) = \frac{c}{x^2+1} 是一个概率密度函数,并计算相应的概率分布函数(柯西分布)
  2. 从分布 Un(a.b), 的密度函数,确定其相应的分布函数。
  3. 证明函数 \Phi_{\mu,\sigma}(x) 是一个概率分布函数。

Views: 2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注