有前提条件
样本量
各变量之间必须有相关性 (被归纳在一个因子里强相关, 因子间弱相关)
特征值大于 1
自己设置几个因子
旋转后, 就是调整能够解释的项的占比,
选择原则
1. 贡献率 0.5
2. 大于 1
3. 可解释
纠缠不清: 根据专业知识判断
张冠李戴: 大部队与某一项关联, 但是其中的一个因素和大部队不同, 这时需要把这一个因素剔除掉
共同度: 比较低的不要
探索因子, 就是把它归类
计算权重, 就是看最后得到所有因子各占的比例, 如果需要的因子相加不为 1, 则需要标准化.
===========================================
对应分析: 类别数据之间的关系
手机品牌偏好和收入水平之间的关系
手机品牌偏好确实有差异
收入水平确实有差异
重点: 图
高收入与 E 品牌有关系
离原点越远表示差异性越强
=========================================
X,Y 两个矩阵之间的关系, 但是比较困难
X 做好多个线性组合 A,B,C,D
Y 做好多个线性组合 E,F,G,H
将这两组线性组合相互成对并比较, 找到相关性最强的线性组合.
即比较 A-E,A-f,A-G,A-H,B-E,B-f,B-G,B-H,C-E,C-f,C-G,C-H,D-E,D-f,D-G,D-H 之间的相关性, 假如 A-E 最强, 就将它挑选出来.
然后还剩下
X 线性组合 B,C,D
Y 线性组合 F,G,H
再以同样方式比较, 但是不同的是, 选择的线性组合必须与 A 且与 E 正交.
假如第二组选择的是 B-F, 则需要 B 与 A 正交, B 与 E 正交, F 与 A 正交, F 与 E 正交, 即 B 与 A 不相关, B 与 E 不相关, F 与 A 不相关, F 与 E 不相关.
以此类推.
第二组解释第一组没解释的部分
标准化
解释
通过线性组合
线性组合与单元变量的相关性
=====================================
目的一: 消灭信息重叠 --PCA
目的二: 探讨变量内的联系和结构: FA
PCA:1. 尽量多保留信息 2. 主成分之间不相关
用途:
主成分评价:
主成分回归, 解决共线性问题
小于 1 个主成分都不用考虑
因子分析
来源: http://www.bubuko.com/infodetail-3327278.html