标签:分析 relevant 相关系数 blog pc 相关性 拟合 模型
工具:tableau
数据源:tableau自带示例超市数据
1.数据处理:订单表自连接,如图(mysql数据库连接时需进行数据提取,才能调用corr函数)
2.创建计算字段
3.制图
4.线性回归分析
在相关系数图中,用具和标签二者销量相关的皮尔森相关系数为0.881,通过散点图线性分析我们发现主要是受3个离散值影响的。 剔除后(见下图)R方值调整为0.0038,非常弱的模型拟合。所以用具和标签销售连带相关性非常弱。
注:R方也叫决定系数,它的主要作用是衡量数据中的因变量有多准确可以被某一模型所计算解释。R方可以衡量模型拟合数据的好坏程度;R方的取值范围<=1,R方越大,模型对数据的拟合程度越好。
R方/调整R方值区间经验判断:
0.3>非常弱的模型拟合
0.3-0.5>弱的模型拟合
0.5-0.7>适度的模型拟合
>0.7较好的模型拟合
常见的相关系数有:
皮尔森相关系数 每个变量呈正态分布
斯皮尔曼相关系数 每个变量呈非正态分布
一般默认使用皮尔逊相关系数,SPSS二者结果相差不大
相关分析后需进行散点图线性回归分析进一步验证
皮尔森相关系数反映的是一种线性相关系数。x、y的协方差除以x、y的标准差
相关系数越接近于1或-1,相关度越强,相关系数越接近于0,相关度越弱。
https://liangyan.blog.csdn.net/article/details/111033499?spm=1001.2101.3001.6650.16&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7Edefault-16-111033499-blog-82527400.pc_relevant_aa&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7Edefault-16-111033499-blog-82527400.pc_relevant_aa&utm_relevant_index=17
标签:分析,relevant,相关系数,blog,pc,相关性,拟合,模型 来源: https://www.cnblogs.com/haibai/p/16388922.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。