回答数
4
浏览数
18650
深井里的冰别碰
方差:各数据与平均数的差的平方的平均数。计算公式:S2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2]其中x是平均数。极差:一组测量数据中,最大值与最小值之差。它能体现一组数据波动的范围。中位数:一组数据先按大小顺序依次排列,位置处在最中间的数据(当数据个数为奇数个时最中间的一个数据,当数据个数为偶数个时最中间两个的平均数)中位数。
如果我是陈奕迅
知识结构 一、知识结构 统计这一部分包括六章: (一)统计与统计数据 (二)统计数据的整理与显示 (三)数据特征的测度 (四)时间序列 (五)统计指数 (六)相关与回归 整体来看,可以分成两大块, • 前三章主要讲统计数据,这是统计的基础;后三章更进一步,讲到了序列、指数、相关与回归关系。时间序列就是把某一统计指标在各个不同时间上的数值按时间先后顺序编制形成的序列,指数单从形式上看就是两个数值对比形成的相对数;相关与回归也是衡量数据之间的联系。总之,后三章实际上是一种对数据的高级处理方法,基础还是数据。 • 第一章 统计与统计数据,主要是对统计数据所做的概述,包括统计数据的计量尺度、类型、来源及质量。统计数据的计量尺度是新加的一节,不可忽视,但内容比较简单;重点是掌握数据的类型,定量数据,由定距和定比尺度形成,就指数值型数据;定性数据包括分类数据和顺序数据,由定类尺度和定序尺度形成。还有一点是掌握时期指标和时点指标之间的区分。 • 第二章 统计数据的整理与显示,分别讲述对定性数据和定量数据的整理,对定性数据,主要是频数分布表的编制;对定量数据,主要掌握数据分组方法。 • 第三章 数据特征的测度,包括集中趋势和离散程度两个相反的方面。要概括地描述一组数据,也就是描述清楚它的集中趋势和离散程度。 • 第四章 时间序列,对时间序列的分析包括水平分析和速度分析两方面。水平分析包括发展水平与平均发展水平、增长量与平均增长量;速度分析包括发展速度与增长速度、平均发展速度与平均增长速度、增长1%的绝对值这样三个知识点。需要掌握各自的定义及计算。 • 第五章 统计指数,需要清楚是根据基期加权还是根据报告期加权,重点是指数体系的分析。 • 第六章 相关与回归,要能够根据相关系数判断相关关系的程度;掌握一元线性回归方程正误的判断。对于相关系数和一元线性回归系数的计算公式,03年没有考这样繁琐的内容,但能记住。 • 本部分是容易出计算题的部分,除了搞清楚基本概念外,必须多做练习,掌握基本题型的解题步骤,提高计算的准确性。 二、主要考点 (一)统计与统计数据 1 掌握统计的含义 2 掌握统计数据的不同类型以及变量的含义和类型 3 掌握统计指标的含义、分类 4 掌握普查、抽样调查、统计报表的含义、特点和应用场合; 5 掌握登记性误差和代表性误差的含义、区别 (二)统计数据的整理与显示 1 掌握比例、百分比和比率的计算方法 2 掌握分类数据频数分布表的编制方法 3 掌握条形图的作用、特点和绘制方法 4 掌握累积频数和累计频率的计算方法 5 掌握顺序数据频数分布表和累积频数分布表的编制方法 6 掌握数据分组的方法 7 掌握组中值的作用和计算方法 8 掌握直方图和折线图的绘制方法 9 掌握统计表的基本结构和设计要求 (三)数据特征的测度 1 掌握众数的计算方法、特点和应用范围 2 掌握中位数的计算方法、特点和应用场合 3 掌握简单算术平均数和加权算术平均数的计算方法、算术平均数的特点和应用场合 4 掌握几何平均数的计算方法和应用场合 5 掌握标准差和方差的计算方法和应用 6 掌握离散系数的计算方法和具体应用 (四)时间序列 1 掌握不同时间序列序时平均数的计算方法 2 掌握增长量、逐期增长量、累积增长量和平均增长量的计算方法 3 掌握发展速度和增长速度的计算方法,定基发展速度与环比发展速度之间的关系并能相互推算 4 掌握平均发展速度和平均增长速度的计算方法,掌握增长1%绝对值的计算方法 (五)统计指数 1 掌握指数的分类 2 掌握基期加权综合指数和报告期加权综合指数的含义和计算方法 3 掌握指数体系中价值指数与各因素指数之间的相对数量关系和绝对数量关系,并掌握指数体系的分析方法 (六)相关与回归 1 掌握相关关系的种类 2 掌握相关表的编制方法和散点图的绘制方法 3 掌握相关系数的计算方法,并能根据实际数据编制相关表、绘制散点图、计算相关系数,并进行分析。 4 掌握一元线性回归方程的求法,能够解释回归系数的实际意义,能够根据实际数据求解回归方程并进行分析和预测 三、内容详解 (一) 统计与统计数据 1.含义:统计工作;统计数据;统计学 2.统计数据的计量尺度:定类尺度、定序尺度、定距尺度、定比尺度。 定类尺度、定序尺度、定距尺度、定比尺度。 定类尺度:只进行分类或分组,不反映各类的优劣、量的大小或顺序,不可以进行数学运算;例如:将人口分为男女两类。 定序尺度:可以反映各类的优劣、量的大小或顺序,不可以进行数学运算;例如:将学生成绩分成优、良、中、及格和不及格五类。 定距尺度:可以反映现象在量方面的精确差异,可以进行加、减运算;例如:某物长10米,重100千克等。 定比尺度:相对数(或平均数),可以进行加、减、乘、除等数学运算 多选 (2004年试题):以定距尺度计量的统计数据可以进行( ) A,加 B,减 C,乘 D,除 E,比较大小 答案:ABE 3. 类型 类型:分类数据;顺序数据;数值型数据(通常我们处理的大多为数值型数据),其中分类数据和顺序数据是定性数据或品质数据;数值型数据是定量数据或数量数据。 对不同类型的数据应采用不同的统计方法来处理和分析。品质数据可计算各组的频数或频率,而数值型数据可以采取更多计算方法。 变量及其类型::分类变量、顺序变量、数值型变量。数据型变量又有离散变量和连续变量之分。 多选(2004年试题):连续变量具有( )的特点 A,可以取无穷多个值 B,取值连续不断 C,只可以取有限个值 D,其取值都以整位数断开 E,取值不能一一列举 答案:ABE 4.统计指标及其类型 分类:总量指标、相对指标和平均指标 其中,总量指标可分为时期指标和时点指标 例题:03单选 经济增长率指标属于( ) A,总量指标 B,相对指标 C,平均指标 D,时点指标 答案:B 5.统计数据的来源 (1)直接来源,称第一手或直接的统计数据 方式:普查、抽样调查、统计报表 (2)间接来源,第二手或间接的统计数据 主要有:公开的出版物、未公开的内部调查等。 单选(2005年试题)从使用者角度看,从( )中取得的统计数据是第二手统计数据。 A.经济普查 B.农产量抽样调查 C.《中国人口统计年鉴》 D.固定资产投资月度统计报表 答案:C 6.统计数据的质量 误差来源主要有:登记性误差(从理论上讲可以消除)和代表性误差(通常无法消除,但可以事先进行控制或计算)。登记性误差的原因:调查方案中有关的规定或解释不明确导致的填报错误、抄录错误、汇总错误;因人为因素干扰形成的有意虚报或瞒报调查数据。代表性误差的原因:抽取样本时没有遵循随即原则;样本结构与总体结构存在差异;样本容量不足等。 单选(2005年试题)抽样时,由于样本容量不足造成的误差与因为( )造成的误差,都属于代表性误差。 A.被调查者有意虚报 B.数据汇总错误 C.填报错误 D.没有遵循随机原则 答案:D (二) 统计数据的整理和显示 1.品质数据的整理与显示 指标:频数与频数分布,比例,百分比,比率 频数分布表:把数据的各个类别及其相应的频数全部列出来就是频数分布或称次数分布,将其用表格的形式表现出来就是频数分布表。 比例是一个总体中各个部分的数量占总体数量的比重 百分比是将比例乘以100而得出 比率是各个不同类别的数量的比值 图示:主要用条形图和圆形图 单选(2004年试题):根据第五次全国人口普查的结果,我国男性占总人口的,女性占总人口的,那么人口的性别比为( ) A, 100: B, C, D, 100: 答案:C 多选(2004年试题):2001年底,我国共有博物馆1458个,其中综合性博物馆769个,历史类博物馆521个,艺术类博物馆57个,自然科技类博物馆19个,其他类型博物馆92个。这一构成应通过绘制( )来显示。 A,条形图 B,累积频数分布图 C,圆形图 D,直方图 E,折线图 答案:AC 2.顺序数据的整理与显示 除了可以用分类数据的整理及图示方法外,还有累积频数和累计频率。 累积频数:将各类别的频数逐级累加起来,一种方法是从类别顺序的开始一方向类别顺序的最后一方累加频数;另一种方法是从类别顺序的最后一方向类别顺序的开始一方累加频数 累计频率:将各类别的百分比逐级累加起来 3.数值型数据的整理与显示 组距分组的步骤: (1)确定分组组数,经验公式:K= 1+ log10Nlog102; (2)对原始资料进行排序; (3)求极差:观察值减去最小观察值。 (4)确定各组组距:组距=极差组数=某组的上限值-该组的下限值 (5)确定组限:组中值=(上限+下限) 2 (6)确定各组观察值出现的频数:组距分组遵循“不重不漏”的原则;分组时“上组限不在内”以防止重复。 (7)制作频数分布表 直方图与条形图的区别:前者用面积而后者用条形的长度来表示各类别频数的多少,前者高度与宽度均有意义,前者的各矩形通常是连续排列而后者通常是分开排列。 4统计表 基本结构:表头、行标题、列标题和数字资料 设计要求:科学、实用、简练、美观 要合理安排统计表的结构;表头一般应包括表号、总标题和表中数据的单位等内容;表中的上下两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清楚、醒目;在使用统计表时,必要时可在表的下方加上注释,特别要注意注明资料的来源,以示对他人劳动成果的尊重,并备读者查阅使用 多选(2004年试题):通常情况下,设计统计表要求( ) A,没有数字的单元格应空白 B,左右两边不封口 C,表中数据一般是右对齐 D,列标题之间一般用竖线隔开 E,行标题之间不必用横线隔开 答案:BCDE (三)数据特征的测度 1.集中趋势的测度 众数:一组数据中出现次数最多的变量值;它是一个位置代表值,特点是不受数据中极端值的影响 中位数:是一组数据按一定顺序排序后,处于中间位置上的数值。当数值个数为奇数时,取中间位置的数;当数值个数为偶数时,取中间位置两个数的均值。 它将全部数据等分成两部分,也是一个位置代表值,其特点是不受极端值的影响,在研究收入分配时很有用 单选(2004年试题):2003年,某市下辖六个县的棉花种植面积按规模由小到大依次为800公顷、900公顷、1100公顷、1400公顷、1500公顷、3000公顷,这六个县棉花种植面积的中位数是( )公顷。 A,1450 B,1250 C,1100 D,1400 答案:B 解析:变量值一共有6个,偶数个,中位数为最中间两个数的平均数,即第三和第四个数的平均数,为12*(1100+1400)= 1250。 算术平均数:也称均值,是全部数据的算术平均。它是集中趋势的最主要测度值。 简单均值:等于所有数值相加之和数值个数;加权均值:(各组组中值*各组频数)频数之和。 均值是一组数据的重心所在,是数据误差相互抵消后的必然结果,反映出事物必然性的数量特征。其缺点是容易受极端值的影响 几何平均数:将一组中n个数据连乘后再开n次方。是适用于特殊数据的一种平均数,主要用于计算比率或速度的平均。实践中,主要用于计算社会经济现象的平均发展速度 2.离散程度的测度 标准差:各变量与其均值离差平方和的平均数的平方根,它是数测量数据离散程度的最主要方法,也是实际中应用最广泛的离散程度测度值。在对社会经济现象进行分析是主要使用标准差。 例:一组5个数据, 1、2、3、4、5,求其标准差。 解:先求均值等于(1+2+3+4+5) 5 =3; 再求离差,分别为:(1-3)=-2,(2-3)=-1,(3-3)=0,(4-3)=1,(5-3)=2。 离差平方,分别为:4,1,0,1,4。离差平方和等于4+1+0+1+4=10 离差平方和的平均数:105=2,所以方差为2 把2开平方,即得标准差。 离散系数:一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标,其作用主要是用于比较不同组别数据的离散程度。 上例中,离散系数等于2的平方根除以3。 单选(2004年试题):某学校学生的平均年龄为20岁,标准差为3岁;该校教师的平均年龄为38岁,标准差为3岁。比较该校学生年龄和教师年龄的离散程度,则( ) A,学生年龄和教师年龄的离散程度相同 B,教师年龄的离散程度大一些 C,教师年龄的离散程度是学生年龄离散程度的倍 D,学生年龄的离散程度大一些 答案:D 解析:比较不同组别数据的离散程度应该用离散系数。学生年龄的离散系数为(320),教师年龄的离散系数为(338),学生年龄的离散系数要大一些。 多选(2005年多选)下列数据特征的测度值中,易受极端值影响的有( )。 A.加权算术平均数 B.简单算术平均数 C.极差 D.众数 E.中位数 答案:ABC
羞哒哒滴逗比萌哒哒滴开
平均数:表示数据的总体水平。
中位数:表示数据的中等水平。
众数:表示数据的普遍情况。
方差、标准差:表示数据的离散程度,方差更能反映情况。
1、平均数是求几个数据的算术平均数。平均数是反映一组数据平均水平的特征数。平均数与一组数据里的每一个数据都有关系,平均数具有唯一性。
2、中位数是将一组数据按大小(或小大)顺序排列后,处在最中间的一个数(奇数个)(偶数个求最中间的两个数的平均数)。一组数据的中位数具有唯一性。
3、众数是一组数据中出现次数最多的数叫做这组数据的众数。一组数据的众数可以是一个或多个。众数着眼于对数据出现次数的分析,众数是描述一组数据集中趋势的统计量,不具有唯一性。
平均数、中位数、众数从不同的角度反映了一组数据的集中趋势,但他们是有区别和联系的,他们有可能是同一个数据。
极差是一组数据的最大值减去最小值所得的差叫极差。它是反映数据变化范围的。
方差是一组数据中各数据与它们的平均数的差的平方的平均数,我们把这个平均数叫做这组数据的方差。即来衡量这组数据的波动大小,一组数据的方差越大,说明这组数据的波动越大;方差越小,数据的波动越小。要比较数据的稳定性,一般会用到方差。方差比较全面地反映数据的离散程度。
标准差是将求出的方差开平方,即算术平方根。这个算术平方根,即称为这组数据的标准差。标准差也是用来表示一组数据的波动大小的量。和方差一样是衡量这组数据的波动大小。
优质经济师问答知识库