关于概率, 条件概率, 联合概率的基本解释.
概率 Probability
概率可以理解为可能性, 从 0 到 1 之间, 0 是不可能, 1 是必然. A 事件的概率通常写作 P(A):
概率经常和随机有关, 比如说 "随机扔一个骰子, 得到 3 点的概率是多少?","随机从班里选一个人, 选到男生的概率是多少?"
随机并不一定意味着均等, 比如在 3 这边灌了铅的骰子, 投出 3 的概率就少很多; 比如男生多女生少的班级, 随机取到女生的概率也会小.
如果接下来可能发生 n 个事件, 我们把这些事件看成一个集合, 就叫做概率空间, 一般用欧米伽Ω符号表示. 比如扔骰子得到随机点数的概率空间就是[1,2,3,4,5,6], 共有 6 个均匀等概率事件.
概率空间中每个事件不一定拥有均等的概率, 但所有独立事件的概率之和一定是 1. 灌了铅的骰子可能出现 6 点的概率高到 60%, 那么另外五种点数可能之和一定是 40%.
概率是个无限近似概念, 比如骰子投出 6 点的概率是 1/6, 但不能说投 6 次就一定会出现一次 6, 而是说不停的投, 投的次数越多, 出现点数 6 的比例越必然接近 1/6, 实际上可能需要无限次投才能逼近 1/6, 但无限次本身就是不可能实现的概念.
联合概率 Joint Probability
联合概率是事件 A 和事件 B 同时满足的概率, 和条件概率的区别在于联合概率的分母是整个概率空间 1.
如果 A 和 B 两个事件是独立的, 那么联合概率等于 A 和 B 单独概率的乘积, 例如两个骰子都投出 5 点的联合概率就是 1/36. 联合概率使用 符号表示, 左右两者没有先后关系:
当然这个公式也是两个事件满足互相独立的必要条件.
条件概率 Conditional Probability
条件概率就是事件 A 在事件 B 发生的条件下也会发生的概率.
比如说两个骰子, 第一个投出 5 点的时候, 第二个投出 5 点的概率是多少? 这就是条件概率, 第一个骰子是条件, 也是划定范围(划定分数的分母), 第二个骰子是满足 AB 两个事件的概率, 是分子. 条件概率的条件 B 和 A 用竖线分开, P(A|B), 有公式:
所以, 注意, 条件概率的分母不是概率空间的全部, 而是条件 A 划定的子集范围. 比如上面第一个投骰子得到 5 的条件下, 第二次也投出 5 点的条件概率是 1/6 而不是 1/36.
对于两个独立事件 (两个骰子互相没有关系), 条件概率 等于事件概率 , 和条件事件发生的概率 无关.
条件概率也叫后验概率.
注意, 条件概率的竖线的前后关系很重要,和 不是一回事.是以 作为分母,适宜 作为分母, 谁是条件谁做分母.
比如某种患病率为 1% 的癌症, 那就意味着:
.
如果检测设备检测结果的假阳性概率也是 1%, 那就意味着:
更多内容可以参考这个文章: 贝叶斯的重病筛查案例 - Precision-Accuracy-Recall
来源: http://www.jianshu.com/p/82e1ee94dd59