引入
有一批灯泡, 知其平均寿命是 $E(X)=1000$ (小时)仅由这一指标我们还不能判定这批灯泡的质量好坏
事实上, 有可能其中绝大部分灯泡的寿命都在 950~1050 小时;
也有可能其中约有一半是高质量的, 它们的寿命大约有 1300 小时, 另一半却是质量很差的, 其寿命大约只有 700 小时,
为要评定这批灯泡质量的好坏, 还需进一步考察灯泡的寿命 $X$ 与其平均值 $E(X)=1000$ 的偏离程度
若偏离程度较小, 表示质量比较稳定从这个意义上来说, 我们认为质量较好
前面也曾提到在检验棉花的质量时, 既要注意纤维的平均长度, 还要注意纤维长度与平均长度的偏离程度
由此可见, 研究随机变量与其构成的偏离程度是必要的
那么, 用怎样的量去度量这个偏离程度呢?
容易看到 $E\{ |X-E(X)|\}$ 能度量随机变量与其均值 $E(X)$ 的偏离程度,
但由于上式带有绝对值, 运算不方便, 为运算方便起见, 通常用量 $E\{ [X-E(X)]^2\}$ 来度量随机变量 X 与其均值 $E(X)$ 的偏离程度
定义
设 $X$ 是一个随机变量, 若 $E\{ [X-E(X)]^2\}$ 存在, 则称 $E\{ [X-E(X)]^2\}$ 为 $X$ 的方差, 记为 $D(X)$ 或 $Var(X)$,
即
$$D(X)=Var(X)=E\{ [X-E(X)]^2\}\tag{2.1}$$
在应用上还引入量 $\sqrt{D(X)}$ , 记为 $\sigma (X)$ , 称为标准差或均方差
按定义, 随机变量 $X$ 的方差表达了 $X$ 的取值与其数学期望的偏离程度
若 $D(X)$ 较小意味着 $X$ 的取值比较集中在 $E(X)$ 的附近, 反之, 若 $D(X)$ 较大则表示 $X$ 的取值较分散
因此, $D(X)$ 是刻画 $X$ 取值分散程度的一个量, 它是衡量 $X$ 取值分散程度的一个尺度
由定义知, 方差实际上就是随机变量 $X$ 的函数 $g(X)=(X-E(X))^2$ 的数学期望
于是对于离散型随机变量, 按 (1.3) 式有
$$D(X)=\sum_{k=1}^{\infty}[x_k-E(X)]^2p_k\tag{2.2}$$
其中,$P\{ X=x_k\}=p_k,k=1,2,$ 是 $X$ 的分布律
对于连续型随机变量, 按 (1.4) 式有
$$D(X)=\int_{-\infty}^{\infty}[x-E(X)]^2f(x)dx\tag{2.3}$$
其中 $f(x)$ 是 $X$ 的概率密度
随机变量 $X$ 的方差可按下列公式计算
$$D(X)=E(X^2)-[E(X)]^2\tag{2.4}$$
证:
例 1 标准化变量
例 2(离散)(0-1)分布
例 3(离散)泊松分布
例 4(连续)均匀分布
例 5(连续)指数分布
方差的性质
1. 设 $C$ 是常数, 则 $D(C)=0$
证:
2. 设 $X$ 是随机变量,$C$ 是常数, 则有 $D(CX)=C^2D(X),\qquad D(X+C)=D(X)$
证:
3. 设 $X,Y$ 是两个随机变量, 则有 $D(X+Y)=D(X)+D(Y)+2E\{ (X-E(X)(Y-E(Y)))\}$
特别, 若 $X,Y$ 相互独立, 则有 $D(X+Y)=D(X)+D(Y)$
这一性质可以推广到任意有限多个相互独立的随机变量之和的情况
证:
4. $D(X)=0$ 的充要条件是 $X$ 以概率 1 取常数 $E(X)$ , 即 $P\{ X=E(X)\} =1$
证:
例 6(离散)二项分布
例 7(连续)正态分布
例 8
定理切比雪夫不等式
证:
来源: http://www.bubuko.com/infodetail-2532338.html