hello好久没来更新了,一直比较懒惰。。。
今天来谈谈数据分析必备常用的一些统计方法
1. 多元线性回归
主要用于有多个数字型自变量,且变量之间无相关度,构建一个线性模型。
它的统计检验主要包括:拟合优度,方程显著性,回归系数显著性
2. 判别分析
主要用于分析和解释各类指标之间存在的差异,建立判别函数,从而对未知分类属性的案例进行判别分析。
例如一家公司的产品在上市前进行调研,向顾客发问卷调查,对样式,包装,耐久性进行打分,并选择是否愿意购买,其中5位顾客没有表示意愿,那如何来看他们是否愿意购买呢?可以通过判别分析对指标之间进行分析,找出影响因素。
3. 聚类分析
顾名思义,是对事件进行聚集,当变量很多时,根据研究的问题选择部分变量对事物的某一方面进行研究
4. 因子分析
用于自变量很多,而且相关性较大,来踢出一些无用的变量。在做因子分析之前,先进行KMO指数检验,0.7以上适合做因子分析
好啦~~~今天先聊聊这些,下次可以分享一下python的主要用法