目录
1,0-1 分布(两点分布, 伯努利分布)
2, 几何分布
3, 二项分布
4, 高斯分布(正态分布)
5, 卡方分布 (chi-square distribution)
6,t 分布
单个二值型离散随机变量的分布, 概率分布函数:
2, 几何分布
离散型概率分布, 定义为: n 次伯努利试验中, 试验 k 次才能得到一次成功的机率. 即前 k-1 次皆失败, 第 k 次成功的概率.
概率分布函数:
3, 二项分布
n 次伯努利试验, 各次试验之间相互独立, 每次试验只有两种可能(抛硬币), 相互对立. 设事件发生的概率是 P, 不发生的概率是 1-P,n 次重复独立试验中发生 K 次的概率:
4, 高斯分布(正态分布)
随机变量 X 服从数学期望为μ, 方差为σ2 的正态分布, 记为 N(μ,σ2).
μ决定正态分布的位置.
标准差决定正态分布的幅度.
性质:
标准正态分布:μ=0,σ=1.
性质:
Φ(x)=1-Φ(-x)
5, 卡方分布 (chi-square distribution)
若 n 个相互独立的随机变量ξ?,ξ?,...,ξn , 均服从标准正态分布 N(0,1)(也称独立同分布于标准正态分布), 则这 n 个服从标准正态分布的随机变量的平方和构成一新的随机变量, 其分布规律称为卡方分布(chi-square distribution).
随机变量 :
记为:
其中参数 称为自由度, 自由度不同就是另一个 分布.
卡方分布是由正态分布构造而成的一个新的分布, 当自由度 很大时, 分布近似为正态分布.
性质:
6,t 分布
正态分布是许多统计方法的理论基础.μ和σ决定了正态分布的位置和形态. 为了应用方便, 常将一般的正太变量 X 通过 u 变换 [(X-μ)/σ] 转化成标准正态分布 N(0,1), 使原来各种形态的正态分布都转换成了μ=0,σ=1 的标准正态分布, 也称为 u 分布 .
根据中心极限定理, 通过抽样模拟试验表明, 在正态分布总体以固定 n 抽取若干个样本时, 样本均数的分布仍然服从正态分布 N(μ, ). 所以对样本均数 (均值) 的分布进行 u 变换, 也可以变换为标准正态分布.
实际工作中,σ2(总体方差)是未知的, 所以常用 s 作为σ的估计值, 为了与 u 变换区别, 称为 t 变换.
统计量 t 值的分布称为 t 分布. 假设随机变量 X 服从标准正态分布 N(0,1),Y 服从 分布, 那么 的分布称为自由度为 n 的 t 分布, 记为
可以看出 t 分布以 0 为中心, 左右对称的单峰分布;
t 分布式一簇曲线, 形态变化与 n(确切的说自由度 v)大小有关, 自由度越小, t 分布越低平; 自由度越大, t 分布曲线越接近标准正态分布(u 分布).
6.1 置信区间
已知 X~N(μ,1)找一个区间, 使得包含μ的真值的概率为 95%, 假 n=5, 则:
~ N(μ, ) ~ N(μ,1/5)
α = 1 - 95% = 0.05
查表得:
查表的方法: 直接在标准正态分布表里面找概率 = 1-α/2 时的 z 取值.
含义: 正态分布左侧的面积 (概率) 为 0.975 时候的横坐标值.(上分位)
Z1-α/2: 是下分位表示, 意思是右侧面积为 0.975.
注意: 置信区间双侧检验, 所以要α/2.
称随机区间
为参数μ的置信度为 95% 的置信区间.
(1)已知总体方差, 求总体均值的置信区间
是总体样本均值;
α是显著水平(1 - 置信度), 若置信度是 95%, 则α=1-0.95=0.05;
Zα/2 称为 Z 值, 可以查找标准正态分布表得到;(z(a/2)指的是标准正态分布的双侧临界值, z(a)当然就是单侧临界值)
σ: 总体的标准差;
n: 抽样出来的样本个数;
: 样本的标准误差
(2)未知总体方差, 求总体均值μ的置信区间
tα/2(n-1)称为 t 值, 通过查 t 分布表得到(tα/2(n-1) = t1-α/2(n-1));
S: 样本的标准差
: 样本的平均误差
来源: http://www.bubuko.com/infodetail-3161518.html