天才一秒记住【爱看小说】地址:https://www.antiquessd.com
。
此外,有时候数据还会分布成几个组。
这些情况如果只看相关系数的数值是无法判断的。
2.在此基础上,计算相关系数
通过散点图知道了趋势之后,请务必确认相关系数的数值。
以下的两个散点图,相关系数都是“0.5”
,但它们分布的情况有所不同。
练习题1
现在要确认店铺的工作人员人数与销售额(每家店)是否存在相关性。
X轴是店铺工作人员的人数,Y轴是每家店每月的销售额(单位:百万日元)。
请思考,根据以下的散点图,可以如何进行解释?
解答
从散点图来看,可以看出数据分布朝右上扬的趋势,但是不明显。
另外,相关系数是0.4,也不是一个高的数值。
因此,可以解释为,工作人员的人数与销售额没有太大的相关性,工作人员的人数多,销售额也不一定高。
练习题2
那么,如果是下图的话,可以怎样解释呢?
解答
这个图表的数据分布呈现朝右方上扬的趋势,相关系数是0.8,是较高的数值。
因此,可以解释为,如果店铺工作人员的人数多,销售额就会提升。
其实刚才确认的两个图表,原始数据是相同的,不同的是有没有纳入以下这两个数据。
即店铺工作人员的人数多,销售额却不高的X店;以及店铺工作人员的人数少,但销售额却很高的Y店。
把这两家店作为离群点从数据中剔除的话,就可以认为整体的趋势是工作人员人数与销售额有相关性。
这样的话,接下来要思考的就是,把这两家店作为离群点与其他数据分开来看是否合适。
那么,我们试想一下,在怎样的情况下会出现人数多但销售额不高(X店),以及人数少但销售额较高(Y店)的情况呢?
(X店)
团队合作不佳
店长刚刚变更,经营方针落实得不彻底
虽然人数多,但有几个人实质上并没有在工作等
(Y店)
人数虽然少,但其中有经验的人较多,接待顾客的技巧非常高
得益于店长的经营技巧,下了一些有别于其他店铺的功夫
有地方优势,如顾客流量高等
造成与其他店铺情况不同的趋势,可能存在多个原因。
如果对刚才罗列出来的可能性进行充分验证后,发现确实存在上述某些情况,就可以把X店和Y店作为离群点剔除。
剔除了X店和Y店以后的散点图,就可以代表整体趋势。
我们能够发现离群点,是因为如上述所言,通过描绘散点图,得以从视觉上获取信息。
从表格中的数据去识别离群点虽然也可行,但数据量增加后就会变得困难。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!