相关动态
什么是数据描述统计分析指标?
2024-11-01 23:27

:某次数学考试中,小组A与小组B的成员的乘机分别如下

什么是数据描述统计分析指标?

A:70,85,62,98,92  
B:82,87,95,80,83

分别求出两组的平均分,并比较两组的成绩。

均值(mean)和平均值(average)的区别

  • 均值(mean)是对恒定的真实值进行测量后,把测量偏离于真实值的所有值进行平均所得的结果
  • 平均值(average)是直接对一系列具有内部差异的数值进行的测量值进行的平均结果。
  1. 均值是“观测值的平均”
  2. 平均值是“统计量的平均”。

举个例子
例如一个人的身高的真实值是180,但利用不同的仪器或者同一个仪器经过多次测量,有181,179,182,180等,把多次测量的这些所有数字进行平均,就是均值。

一个班级有30个学生,测量每个学生的身高,把这30个学生测量的30个身高数字进行平均,所得的结果就是平均值。

均值有一个真实值存在作为参考,而平均值没有一个真实值的存在,只是差异性的平均结果。

:58,32,46,92,73,88,,23,22

1、先排序:23,32,46,58,73,88,92

2、找出处于中间位置的数:23,32,46,58,73,88,92

  • 若处于中间位置的数据有两个(也就是数据的总个数为偶数时,中位数为
    假如有n个数据
  1. 当n为偶数时,中位数为 第n/2位数 和 第(n+2)/2位数 的平均数
  2. 当n为奇数,那么中位数为 第(n+1)/2 得到的位置值,例子中为4,即58。

一组数据中,可能存在多个众数,也可能不存在众数。

1 2 2 3 3 中的众数是2和3

1 2 3 4 5 中没有众数

众数不仅适用于数值型数据,对于非数值型数据也同样适用。

{苹果,苹果,香蕉,橙,橙,橙,桃},这一组数据,没有什么均值、中位数可言,但是存在着众数——橙。

方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差,记作S2。

  1. 标准差(Standard Deviation,数学术语,是离均差平方的算术平均数(即:方差)的算术平方根,用σ表示。

  2. 在概率统计中最常使用作为统计分布程度上的测量依据。

  3. ,标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。

  4. 标准差可以反映平均数不能反映出的东西(比如稳定度等)。
    求解方法
    所有数减去其平均值的平方和,所得结果除以该组数之个数(或个数减一,即变异数,再把所得值开根号,所得之数就是这组数据的标准差。
    也就是 标准差 = 方差的算术平方根

  • 协方差:度量两个随机变量关系的统计量 or 在概率论和统计学中用于衡量两个变量的总体误差
  • 而方差是协方差的一种特殊情况,即当两个变量是相同的情况。
  • 协方差物理意义:衡量两个随机变量的相关性

求协方差

cov(x,y= EXY - EX * EY
例子

E(X) = (1.1 + 1.9 + 3)/3 = 2
E(Y) = (5.0 + 10.4 + 14.6)/3 = 10
EXY(1.1 * 5.0 + 1.9 * 10.4 + 3 * 14.6) /3 =23.02
cov(x,y= EXY - EX*EY
= 23.02- 2 *10
=3.02

标准分,是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置的。
考生在接受测验后,按照评分标准对其作答反应直接评出来的分数,叫原始分。
原始分反映了考生答对题目的个数,或作答正确的程度。但是,原始分一般不能直接反映出考生间差异状况,不能刻划出考生相互比较后所处的地位,也不能说明考生在其他等值测试上应获得什么样的分值。

  1. 多应用于统计学中的箱线图绘制。
  • 四分位数是通过3个点将全部数据等分为4部分,其中每部分包含25%的数据

分位数是将总体的全部数据按大小顺序排列后,处于各等分位置的变量值。

  • 如果将全部数据分成相等的两部分,它就是中位数
  • 如果分成四等分,就是四分位数
  • 八等分就是八分位数等。
    四分位数也称为四分位点,它是将全部数据分成相等的四部分,其中每部分包括25%的数据,处在各分位点的数值就是四分位数。
    四分位数有三个,第一个四分位数就是通常所说的四分位数,称为下四分位数,第二个四分位数就是中位数,第三个四分位数称为上四分位数,分别用Q1、Q2、Q3表示 。
  1. 第一四分位数 (Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。
  2. 第二四分位数 (Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。
  3. 第三四分位数 (Q3),又称“较大四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。
  4. 第三四分位数与第一四分位数的差距又称四分位距(InterQuartile Range,IQR)。

实例

首先确定四分位数的位置
n表示项数

  • Q1的位置= (n+1) × 0.25
  • Q2的位置= (n+1) × 0.5
  • Q3的位置= (n+1) × 0.75

对于四分位数的确定,有不同的方法,另外一种方法基于N-1 基础。即

  • Q1的位置=1+(n-1)x 0.25
  • Q2的位置=1+(n-1)x 0.5
  • Q3的位置=1+(n-1)x 0.75

四分位间距

Q3 - Q1 = 上四分位数 - 下四分位数

同比一般情况下是。同比发展速度主要是为了消除季节变动的影响,用以说明本期发展水平与同期发展水平对比而达到的相对发展速度。

  1. 本期2月比同期2月,本期6月比同期6月等。
  • 速度,其计算公式为
  • ,其计算公式为
    在实际工作中,经常使用这个指标,如某年、某季、某月与同期对比计算的发展速度,就是同比发展速度。
  1. 环比,统计学术语,是表示连续2个统计周期(比如连续两月)内的量的变化比。
  2. 环比的发展速度是,表明现象逐期的发展速度。
    如计算一年内各月与前一个月对比,即2月比1月,3月比2月,4月比3月……12月比11月,说明逐月的发展程度。如分析抗击“非典”期间某些经济现象的发展趋势,环比比同比更说明问题。

分类

发展速度由于采用基期的不同,可分为同比发展速度、环比发展速度和定基发展速度。均用百分数或倍数表示。环比分为日环比、周环比、月环比和年环比

环比发展速度,一般指是指报告期水平与前一时期水平之比,表明现象逐期的发展速度。

概念

  1. 「同比」

与历史「同时期]比较,例如2011年3月份与2010年3月份相比,叫「同比」。

  1. 「环比」

与「上一个」统计周期比较,例如2011年4月份与2011年3月份相比较,称为「环比」。

  1. 反映的都是「变化速度」,但由于采用「基期」的不同,其反映的内涵是完全不同的
  • 一般来说,环比可以与环比相比较,而不能拿「同比」与「环比」相比较

  • 而对于同一个地方,考虑时间纵向上发展趋势的反映,则往往要把「同比」与「环比」放在一起进行对照。

计算公式

1、本期「环比」增长(下降)率计算公式

  • 环比分为日环比、周环比、月环比和年环比。

  • 本期环比增长(下降)率(%) = (本期价格/上期价格 — 1 )× 100%

  • (1)如果计算值为正值+,则称增长率;如果计算值为负值(-,则称下降率。

  • (2)如果本期指本日、本周、本月和本年,则上期相应指上日、上周、上月和上年。

2、本期同比增长(下降)率计算公式

  • 本期同比增长(下降)率(%) = (本期价格/上年同期价格 —1) × 100%

  • (1)如果计算值为正值+,则称增长率;如果计算值为负值(-,则称下降率。

  • (2)如果本期指本日、本周和本月,则上年同期相应指上年同日、上年同周和上年同月。

发展数据分类

    以上就是本篇文章【什么是数据描述统计分析指标?】的全部内容了,欢迎阅览 ! 文章地址:http://mip.xhstdz.com/quote/86.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://mip.xhstdz.com/mobile/ , 查看更多   
发表评论
0评