当前位置：

首页
/
IT
/
前端
/
javascript
/
几大分布函数

几大分布函数

1,0-1 分布(两点分布, 伯努利分布)

2, 几何分布

3, 二项分布

4, 高斯分布(正态分布)

5, 卡方分布 (chi-square distribution)

6,t 分布

单个二值型离散随机变量的分布, 概率分布函数:

2, 几何分布

离散型概率分布, 定义为: n 次伯努利试验中, 试验 k 次才能得到一次成功的机率. 即前 k-1 次皆失败, 第 k 次成功的概率.

概率分布函数:

3, 二项分布

n 次伯努利试验, 各次试验之间相互独立, 每次试验只有两种可能(抛硬币), 相互对立. 设事件发生的概率是 P, 不发生的概率是 1-P,n 次重复独立试验中发生 K 次的概率:

4, 高斯分布(正态分布)

随机变量 X 服从数学期望为μ, 方差为σ2 的正态分布, 记为 N(μ,σ2).

μ决定正态分布的位置.

标准差决定正态分布的幅度.

性质:

标准正态分布:μ=0,σ=1.

性质:

Φ(x)=1-Φ(-x)

5, 卡方分布 (chi-square distribution)

若 n 个相互独立的随机变量ξ?,ξ?,...,ξn , 均服从标准正态分布 N(0,1)(也称独立同分布于标准正态分布), 则这 n 个服从标准正态分布的随机变量的平方和构成一新的随机变量, 其分布规律称为卡方分布(chi-square distribution).

随机变量 :

记为:

其中参数称为自由度, 自由度不同就是另一个分布.

卡方分布是由正态分布构造而成的一个新的分布, 当自由度很大时, 分布近似为正态分布.

性质:

6,t 分布

正态分布是许多统计方法的理论基础.μ和σ决定了正态分布的位置和形态. 为了应用方便, 常将一般的正太变量 X 通过 u 变换 [(X-μ)/σ] 转化成标准正态分布 N(0,1), 使原来各种形态的正态分布都转换成了μ=0,σ=1 的标准正态分布, 也称为 u 分布 .

根据中心极限定理, 通过抽样模拟试验表明, 在正态分布总体以固定 n 抽取若干个样本时, 样本均数的分布仍然服从正态分布 N(μ, ). 所以对样本均数 (均值) 的分布进行 u 变换, 也可以变换为标准正态分布.

实际工作中,σ2(总体方差)是未知的, 所以常用 s 作为σ的估计值, 为了与 u 变换区别, 称为 t 变换.

统计量 t 值的分布称为 t 分布. 假设随机变量 X 服从标准正态分布 N(0,1),Y 服从分布, 那么的分布称为自由度为 n 的 t 分布, 记为

可以看出 t 分布以 0 为中心, 左右对称的单峰分布;

t 分布式一簇曲线, 形态变化与 n(确切的说自由度 v)大小有关, 自由度越小, t 分布越低平; 自由度越大, t 分布曲线越接近标准正态分布(u 分布).

6.1 置信区间

已知 X~N(μ,1)找一个区间, 使得包含μ的真值的概率为 95%, 假 n=5, 则:

~ N(μ, ) ~ N(μ,1/5)

α = 1 - 95% = 0.05

查表得:

查表的方法: 直接在标准正态分布表里面找概率 = 1-α/2 时的 z 取值.

含义: 正态分布左侧的面积 (概率) 为 0.975 时候的横坐标值.(上分位)

Z1-α/2: 是下分位表示, 意思是右侧面积为 0.975.

注意: 置信区间双侧检验, 所以要α/2.

称随机区间

为参数μ的置信度为 95% 的置信区间.

(1)已知总体方差, 求总体均值的置信区间

是总体样本均值;

α是显著水平(1 - 置信度), 若置信度是 95%, 则α=1-0.95=0.05;

Zα/2 称为 Z 值, 可以查找标准正态分布表得到;(z(a/2)指的是标准正态分布的双侧临界值, z(a)当然就是单侧临界值)

σ: 总体的标准差;

n: 抽样出来的样本个数;

: 样本的标准误差

(2)未知总体方差, 求总体均值μ的置信区间

tα/2(n-1)称为 t 值, 通过查 t 分布表得到(tα/2(n-1) = t1-α/2(n-1));

S: 样本的标准差

: 样本的平均误差

来源: http://www.bubuko.com/infodetail-3161518.html

与本文相关文章

暂无,快来抢沙发吧！