博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
[爱上统计学]-[笔记]-计算和理解平均数
阅读量:6664 次
发布时间:2019-06-25

本文共 786 字,大约阅读时间需要 2 分钟。

平均数也叫做集中趋势量数(measures of central tendency),一般有三种形式:均值、中位数和众数。

计算均值

均值很简单,就是数据组中的所有数值的总和除以该组数值的个数。

均值也叫做算术平均数。

 

计算加权平均数

就是每一个数值乘以它出现的次数,并将所有的积相加,然后除以次数的总和。

计算中位数

中位数被定义为一系列数据的中点,也就是一系列数据中间位置的哪个数值。如果数据组个数为偶数,那么中位数就是中间两个数值的平均值。在数据组中,有一半的数据在中位数之上,有一半的数据在中位数之下。

百分位点

百分位点用于定义数据集或数据分布中等于或者小于一个特定数值的个体的百分数。例如,你的成绩是“处在75百分位点”,这意味着你的成绩刚好或者是超过75%的其他人的成绩。

 

中位数对于极值不敏感,而均值对于极值敏感。

极值就是与其所属数据组数据非常不同的值。

由于均值容易受到极值的影响,所以在某些场合,使用中位数更合适。例如,收入统计,极高和极低的收入会影响收入平均数的统计,这时候就使用中位数来作为收入平均数的统计结果。

计算众数

最笼统、最不精确的集中趋势量数。众数就是出现次数最多的数值。

如果出现不止一个数值出现次数最多,也就是几个数值出现的次数一样,都是最多,那么就是多峰分布。两个数值出现最多就是双峰分布。

何时用什么

定性数据、类别数据或定类数据的集中趋势只可以使用众数来描述。定量的数据就使用均值和中位数。

1、如果数据属性是分类的,而且数据只属于一种类型,就是用众数。

2、如果数据包含极值,而且你不想扭曲平均数,就是用中位数。

3、如果数据不包括极值,也不是分类数据,就是用均值。

本文转自 virusswb 51CTO博客,原文链接:http://blog.51cto.com/virusswb/858145,如需转载请自行联系原作者

你可能感兴趣的文章
SEO从业者打造个人品牌的八个建议
查看>>
Vue2.0+组件库总结
查看>>
云计算的前世今生-【软件和信息服务】2013.1
查看>>
51CTO交流摘录(2):SOC的应用现状
查看>>
私有云管理-Windows Azure Pack
查看>>
SCCM 2012 R2---配置补丁分发
查看>>
《从零开始学Swift》学习笔记(Day 14)——字符串的插入、删除和替换
查看>>
《从零开始学Swift》学习笔记(Day 44)——重写属性
查看>>
SQL Server 2012 官方培训课程体系
查看>>
反社交app应用的逆袭
查看>>
Lync Server单前端无边缘的外部访问思考
查看>>
linux运维实战练习-2015年9月01日课程作业(练习)安排
查看>>
简单使用packetbeat
查看>>
下一匹黑马就是你
查看>>
open***负载均衡高可用多种方案实战讲解02(老男孩主讲)
查看>>
学习VMware虚拟化技术
查看>>
Cocos2d-x v3.2笔记——总结Cocos2d-x 3.x版本的一些变化
查看>>
葡萄城活字格 Web 应用生成平台 — V4.0 技术白皮书
查看>>
读懂sqliosim的测试结果
查看>>
jquery.validate 扩展验证+异步验证
查看>>