例:某次数学考试中,小组A与小组B的成员的乘机分别如下:
A:70,85,62,98,92
B:82,87,95,80,83
分别求出两组的平均分,并比较两组的成绩。
均值(mean)和平均值(average)的区别
- 均值(mean)是对恒定的真实值进行测量后,把测量偏离于真实值的所有值进行平均所得的结果;
- 平均值(average)是直接对一系列具有内部差异的数值进行的测量值进行的平均结果。
- 均值是“观测值的平均”
- 平均值是“统计量的平均”。
举个例子:
例如一个人的身高的真实值是180,但利用不同的仪器或者同一个仪器经过多次测量,有181,179,182,180等,把多次测量的这些所有数字进行平均,就是均值。
一个班级有30个学生,测量每个学生的身高,把这30个学生测量的30个身高数字进行平均,所得的结果就是平均值。
均值有一个真实值存在作为参考,而平均值没有一个真实值的存在,只是差异性的平均结果。
例:58,32,46,92,73,88,,23,22
1、先排序:23,32,46,58,73,88,92
2、找出处于中间位置的数:23,32,46,58,73,88,92
- 若处于中间位置的数据有两个(也就是数据的总个数为偶数时),中位数为
假如有n个数据,
- 当n为偶数时,中位数为 第n/2位数 和 第(n+2)/2位数 的平均数
- 当n为奇数,那么中位数为 第(n+1)/2 得到的位置值,例子中为4,即58。
一组数据中,可能存在多个众数,也可能不存在众数。
1 2 2 3 3 中的众数是2和3
1 2 3 4 5 中没有众数
众数不仅适用于数值型数据,对于非数值型数据也同样适用。
{苹果,苹果,香蕉,橙,橙,橙,桃},这一组数据,没有什么均值、中位数可言,但是存在着众数——橙。
方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差,记作S2。
-
标准差(Standard Deviation) ,数学术语,是离均差平方的算术平均数(即:方差)的算术平方根,用σ表示。
-
在概率统计中最常使用作为统计分布程度上的测量依据。
-
,标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。
-
标准差可以反映平均数不能反映出的东西(比如稳定度等)。
求解方法:
所有数减去其平均值的平方和,所得结果除以该组数之个数(或个数减一,即变异数),再把所得值开根号,所得之数就是这组数据的标准差。
也就是 标准差 = 方差的算术平方根
- 协方差:度量两个随机变量关系的统计量 or 在概率论和统计学中用于衡量两个变量的总体误差
- 而方差是协方差的一种特殊情况,即当两个变量是相同的情况。
- 协方差物理意义:衡量两个随机变量的相关性
求协方差
cov(x,y) = EXY - EX * EY
例子:
E(X) = (1.1 + 1.9 + 3)/3 = 2
E(Y) = (5.0 + 10.4 + 14.6)/3 = 10
EXY(1.1 * 5.0 + 1.9 * 10.4 + 3 * 14.6) /3 =23.02
cov(x,y) = EXY - EX*EY
= 23.02- 2 *10
=3.02
标准分,是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置的。
考生在接受测验后,按照评分标准对其作答反应直接评出来的分数,叫原始分。
原始分反映了考生答对题目的个数,或作答正确的程度。但是,原始分一般不能直接反映出考生间差异状况,不能刻划出考生相互比较后所处的地位,也不能说明考生在其他等值测试上应获得什么样的分值。
- 多应用于统计学中的箱线图绘制。
- 。
- 四分位数是通过3个点将全部数据等分为4部分,其中每部分包含25%的数据
分位数是将总体的全部数据按大小顺序排列后,处于各等分位置的变量值。
- 如果将全部数据分成相等的两部分,它就是中位数;
- 如果分成四等分,就是四分位数;
- 八等分就是八分位数等。
四分位数也称为四分位点,它是将全部数据分成相等的四部分,其中每部分包括25%的数据,处在各分位点的数值就是四分位数。
四分位数有三个,第一个四分位数就是通常所说的四分位数,称为下四分位数,第二个四分位数就是中位数,第三个四分位数称为上四分位数,分别用Q1、Q2、Q3表示 。
- 第一四分位数 (Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。
- 第二四分位数 (Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。
- 第三四分位数 (Q3),又称“较大四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。
- 第三四分位数与第一四分位数的差距又称四分位距(InterQuartile Range,IQR)。
实例
首先确定四分位数的位置:
n表示项数
- Q1的位置= (n+1) × 0.25
- Q2的位置= (n+1) × 0.5
- Q3的位置= (n+1) × 0.75
对于四分位数的确定,有不同的方法,另外一种方法基于N-1 基础。即
- Q1的位置=1+(n-1)x 0.25
- Q2的位置=1+(n-1)x 0.5
- Q3的位置=1+(n-1)x 0.75
四分位间距
Q3 - Q1 = 上四分位数 - 下四分位数
同比一般情况下是。同比发展速度主要是为了消除季节变动的影响,用以说明本期发展水平与同期发展水平对比而达到的相对发展速度。
如
- 本期2月比同期2月,本期6月比同期6月等。
- 速度,其计算公式为:
- ,其计算公式为:
在实际工作中,经常使用这个指标,如某年、某季、某月与同期对比计算的发展速度,就是同比发展速度。
- 环比,统计学术语,是表示连续2个统计周期(比如连续两月)内的量的变化比。
- 环比的发展速度是,表明现象逐期的发展速度。
如计算一年内各月与前一个月对比,即2月比1月,3月比2月,4月比3月……12月比11月,说明逐月的发展程度。如分析抗击“非典”期间某些经济现象的发展趋势,环比比同比更说明问题。
分类
发展速度由于采用基期的不同,可分为同比发展速度、环比发展速度和定基发展速度。均用百分数或倍数表示。环比分为日环比、周环比、月环比和年环比
环比发展速度,一般指是指报告期水平与前一时期水平之比,表明现象逐期的发展速度。
概念
- 「同比」
与历史「同时期]比较,例如2011年3月份与2010年3月份相比,叫「同比」。
- 「环比」
与「上一个」统计周期比较,例如2011年4月份与2011年3月份相比较,称为「环比」。
- 反映的都是「变化速度」,但由于采用「基期」的不同,其反映的内涵是完全不同的;
-
一般来说,环比可以与环比相比较,而不能拿「同比」与「环比」相比较;
-
而对于同一个地方,考虑时间纵向上发展趋势的反映,则往往要把「同比」与「环比」放在一起进行对照。
计算公式
1、本期「环比」增长(下降)率计算公式
-
环比分为日环比、周环比、月环比和年环比。
-
本期环比增长(下降)率(%) = (本期价格/上期价格 — 1 )× 100%
-
(1)如果计算值为正值(+),则称增长率;如果计算值为负值(-),则称下降率。
-
(2)如果本期指本日、本周、本月和本年,则上期相应指上日、上周、上月和上年。
2、本期同比增长(下降)率计算公式
-
本期同比增长(下降)率(%) = (本期价格/上年同期价格 —1) × 100%
-
(1)如果计算值为正值(+),则称增长率;如果计算值为负值(-),则称下降率。
-
(2)如果本期指本日、本周和本月,则上年同期相应指上年同日、上年同周和上年同月。