因子分析: 对定量数据, 不对定性数据

有前提条件

样本量

各变量之间必须有相关性 (被归纳在一个因子里强相关, 因子间弱相关)

特征值大于 1

自己设置几个因子

旋转后, 就是调整能够解释的项的占比,

选择原则

1. 贡献率 0.5

2. 大于 1

3. 可解释

纠缠不清: 根据专业知识判断

张冠李戴: 大部队与某一项关联, 但是其中的一个因素和大部队不同, 这时需要把这一个因素剔除掉

共同度: 比较低的不要

探索因子, 就是把它归类

计算权重, 就是看最后得到所有因子各占的比例, 如果需要的因子相加不为 1, 则需要标准化.

===========================================

对应分析: 类别数据之间的关系

手机品牌偏好和收入水平之间的关系

手机品牌偏好确实有差异

收入水平确实有差异

重点: 图

高收入与 E 品牌有关系

离原点越远表示差异性越强

=========================================

X,Y 两个矩阵之间的关系, 但是比较困难

X 做好多个线性组合 A,B,C,D

Y 做好多个线性组合 E,F,G,H

将这两组线性组合相互成对并比较, 找到相关性最强的线性组合.

即比较 A-E,A-f,A-G,A-H,B-E,B-f,B-G,B-H,C-E,C-f,C-G,C-H,D-E,D-f,D-G,D-H 之间的相关性, 假如 A-E 最强, 就将它挑选出来.

然后还剩下

X 线性组合 B,C,D

Y 线性组合 F,G,H

再以同样方式比较, 但是不同的是, 选择的线性组合必须与 A 且与 E 正交.

假如第二组选择的是 B-F, 则需要 B 与 A 正交, B 与 E 正交, F 与 A 正交, F 与 E 正交, 即 B 与 A 不相关, B 与 E 不相关, F 与 A 不相关, F 与 E 不相关.

以此类推.

第二组解释第一组没解释的部分

标准化

解释

通过线性组合

线性组合与单元变量的相关性

=====================================

目的一: 消灭信息重叠 --PCA

目的二: 探讨变量内的联系和结构: FA

PCA:1. 尽量多保留信息 2. 主成分之间不相关

用途:

主成分评价:

主成分回归, 解决共线性问题

小于 1 个主成分都不用考虑

因子分析

来源: http://www.bubuko.com/infodetail-3327278.html

与本文相关文章

暂无,快来抢沙发吧！