因子分析主要用于分析商户O2O运营数据,了解商家的行为信息,找出数据背后的共性,最终对商家进行综合评价,挖掘商家特点。 应用背景 获得企业所属的商户O2O运营数据后,通过分析它们在一段时间内的线上线下行为信息,找出这些变量的共性,降低分析维度,对商户进行综合评价,可以知道产品运营效果是否达到预期。 分析方法 因子分析(探索结构,简化数据,综合评价) 分析工具 SPSS(数据分析的重量级应用,与SAS二选一) 实例:100个商户的O2O运营数据 一、基础知识讲解 因子分析的目的是什么? 探索结构:在变量之间存在高度相关性的时候,我们希望用较少的因子数目来概括其信息。 简化数据:把原始变量转化为因子后,使用因子得分进行分析,比如聚类分析、回归分析等。 综合评价:通过每个因子得分计算出综合得分,对分析对象进行综合评价。 因子分析的步骤判断数据是否适合因子分析 构造因子变量 利用银子旋转方法使得因子更有实际意义 计算每个个案的因子得分 如何判断数据是否适合因子分析?因子分析的变量要求为连续变量,分类变量不适合直接进行因子分析。 建议个案个数为变量个数的5倍以上,这只是参考值,不是绝对标准。 KMO检验统计量:小于0.5时不适合因子分析;大于0.5小于0.7时,尚可以接受因子分析;大于0.7小于0.8时,比较适合因子分析;大于0.8时非常适合因子分析。 二、如何展开因子分析?不瞎逼逼,直接开干。 【描述】 勾选“KOM和巴特利特球形度检验”,目的是用于生成检验因子分析适合度的统计指标。 【提取】 方法选择“主成分”,这是最常用的提取因子的方法; 勾选“碎石图”,用于辅助判断因子个数。 【旋转】 选择“最大方差法”,用于更好的解释因子所包含的意义。 最大方差法师最常用的,该方法能够使每个变量尽可能的在一个引子上有较高的载荷,在其余因子上载荷较低,从而方便对因子进行解释。 【得分】 勾选“保存为变量”,方法选择“回归”,用于保存计算的到的因子得分。 【选项】 勾选系数显示格式中的“按大小排序”,是为了让系数大小有序,方便观察;勾选“排除小系数”,atv直播,输入0.4,这样在结果中相关系数小于0.4的会被排除,不再显示,也是为了方便观察(因为我们是寻找相关系数高的) 注意:这里不必生搬硬套,也不必也定时0.4,可视具体情况而定 分析结果解读: 该结果主要用来检验数据是否适合因子分析,主要参考KMO统计量即可。 KMO统计量为0.627,大于0.5小于0.7,尚可以接受因子分析。 这个结果是“变量共同度”,显示了原始变量能被提取的因子解释的程度。 本例中所有变量共同度都在60%以上,可以认为所提取的因子对各变量的解释能力是可以接受的。 该图是“总方差解释”,显示了通过分析所提起的因子数量,以及所提取的因子对所有变量的累计方差贡献率。 累计方差贡献率大于60%,则说明因子对变量的解释能力尚可接受,达到80%,说明因子对变量的解释能力非常好。 本例根据“初始特征值”大于1的标准提取了两个因子,旋转之后累计方差贡献率达到72.367%,因子的解释能力较好。 碎石图”能辅助我们判断最佳因子个数,通常是选区取现中比较陡峭的位置所对应的因子个数。 本例前三个音字都在较陡峭的曲线上,所以提取2~~3个因子都可以对原始变量有较好的解释。 如何确定提取的因子个数? 初始特征值(总方差解释图)大于1的因子个数 累计方差贡献率(总方差解释图)达到一定水平的因子个数(如60%) 碎石图中处于陡峭曲线上的对应因子个数。 根据经验或研究,指定个数。 这是旋转之前的因子载荷矩阵,j2直播,难以对因子进行明确定义,可以忽略不看,直接看旋转后的因子载荷矩阵。 “旋转后的成分矩阵”显示的是旋转后的因子载荷矩阵,这个结果能够凸显因子含义。 (责任编辑:本港台直播) |