任务三 统计整理

任务三 统计整理

【知识目标】

  • 理解统计整理的意义和整理步骤
  • 理解统计分组的概念和作用
  • 掌握统计分组的方法
  • 掌握编制统计表和绘制统计图的方法
  • 掌握运用Excel软件进行统计整理的方法

【能力目标】

  • 能够根据实际资料进行统计分组,编制分配数列
  • 能够根据实际资料编制统计表、绘制统计图
  • 能够利用Excel软件对统计资料进行整理

相关知识.png 任务描述与分析

1.任务描述

经过前期艰苦的统计调查,你已经从A市自来水公司的客户那里获得了原始的调查资料,统计调查阶段结束。现在你的统计工作开始进入统计资料整理阶段,这一阶段你的任务是将收集来的零散的、不系统的,甚至是存在虚假差错的统计资料进行整理,为下一阶段的统计分析创造良好的条件。

2.任务分析

统计资料的整理是一项较为烦琐,且技巧要求较高的工作,要完成这项任务,你需要思考以下几个问题。

(1)资料的整理大致分为哪些工作环节?

(2)使用什么方法能够使零散的原始调查资料条理化?

(3)在汇总调查资料时,使用手工汇总还是计算机汇总?

(4)使用什么方法把整理好的调查资料表现出来?

相关知识.png 相关知识

3.1 统计整理的意义和步骤

【案例3-1】


通过艰苦的问卷调查,你已从A市自来水公司的城镇居民客户那里获得了400多份问卷,回想一幕幕调查的场景,在你接触客户的过程中,你已掌握了很多客户对A市自来水公司的评价意见。假设A市自来水公司的领导现在向你了解情况,你该怎么向他汇报你所掌握的客户意见呢?现在你可以如数家珍地将你所接触的客户的意见向领导反馈,但你还无法从400多份问卷中汇总所有客户的意见,个别客户的意见尽管生动但不能代表总体,你所提供的情况与自来水公司的调查要求还存在差距!那么,你该怎样汇总辛苦获得的这些调查资料,实现你的调查目的呢?

案例分析:你必须对这些调查问卷中所包含的数据进行分门别类的汇总整理,在开展这项工作之前,你应该对这一阶段的工作内容有一个基本的了解。

3.1.1 统计整理的意义

统计资料整理是统计工作的第三个阶段,是统计人员根据统计研究的目的,对统计调查阶段所搜集到的大量原始资料进行加工汇总,使其系统化、条理化,从而得到表现总体特征的综合统计资料的工作过程。

统计工作经过了统计调查阶段后,搜集了大量的统计资料,但是这些资料都是反映每个调查个体的,资料较为零散和表面化,反映的是事物的表面现象或某个侧面,不能概括地说明总体特征和内在联系,并且,在调查中还可能出现差错、虚假的现象。因此,只有通过对这些原始资料进行审核、分类、汇总和再加工,形成真实、系统、反映总体的资料,才能全面地认识调查对象,并为进一步分析研究打下良好基础。

统计整理是统计工作的中间环节,它是统计调查的继续,也是统计分析的前提,在统计工作中起着承上启下的重要作用。统计整理的质量不仅直接关系到调查资料能否发挥其应有的作用,也直接影响到统计分析和预测能否得出正确的结论。

3.1.2 统计整理的步骤

统计资料整理过程是一个我们对个别现象的认识上升到对总体全貌认识的过程,是一项内容烦琐、要求细致、科学性很强的工作,需要有组织、有计划地进行,每个步骤都有各自需要解决的问题和原则要求。使用计算机进行统计资料整理的工作步骤如图3-1所示。

图片 1

图3-1 使用计算机进行统计资料整理的工作步骤

1.设计统计整理方案

在进行整理调查资料之前,首先要制定明确的资料整理方案,资料整理方案是从调查目的出发,按照整理资料的专门方法,对整理资料的工作流程、分工和要求等事项所做的具体说明。

调查资料整理方案在前期调查设计阶段就应作为调查方案的组成部分予以制定。统计资料整理方案中要明确以下基本工作内容:资料回收审核方法、资料录入方法,与统计研究目的相对应的统计指标及指标体系,统计分组的方法,统计汇总的方法,表现统计指标的形式,如果是大型的统计调查工作还应确定统计整理各环节的人员分工与责任等。统计整理方案是统计设计在统计整理阶段的具体化,是保证统计整理工作顺利进行的前提,因此,统计整理方案应尽可能详细具体。

2.审核原始资料

审核调查资料的目的是确保能够进入数据录入分析阶段的调查资料的完整性和准确性,是对回收的调查资料进行质量控制的必不可少的步骤。在问卷调查中,对调查资料的检查通常在实施调查过程中就应进行,在收回被调查者问卷时应尽可能及时检查问卷的完成质量,以便对未能完成的问卷及时予以补充完善。为了对调查活动进行有效的质量监控,在回收问卷时,也就是在调查活动结束后,仍应对所收回的调查资料进行独立的审查,其目的是确定哪些问卷可以接受,哪些问卷必须作废。由于调查资料是分批回收上来的,所以在收回第一批调查资料后,就可以开始对资料的审核工作了。这样做的好处是可以及时发现问题并及时予以改正。

3.录入数据

通过审核的调查资料往往包含着大量的调查数据,这些数据需要通过汇总的方法才能使我们对调查对象的认识形成从个体到总体、从局部到整体的提升深化。传统的手工汇总方法主要是通过划记法、卡片法、折叠法、过录法等汇总数据,如选举中对选票的汇总用的是划记法。但手工汇总方法效率低、准确性差,只适用于简单的数据汇总处理,运用计算机汇总调查数据是目前市场调查工作中较为普遍运用的技术方法。运用计算机进行数据处理,首先要对调查资料进行编码,将调查资料以编码的形式录入计算机,然后才能由计算机软件进行数据汇总和分析。在后面介绍Excel在统计整理中的应用时将说明编码的有关内容。

4.数据排序与分组

一般来说,录入的数据是无序的,不能反映现象的本质与规律性,只有进行统计分组,依据相应的统计指标对统计资料进行加工整理,使录入的数据按要求排列,才能对被研究的客观现象进行准确的数量描述和数量分析。因此,统计分组是统计整理的基础,是统计整理的关键环节。统计分组科学与否直接影响到统计整理工作的质量。

5.绘制统计表和统计图

根据现象之间的内在联系和统计分析的要求,将总体的有关统计指标编制在一张表格上,就形成了统计表,统计表使统计资料的表现更加明白、清晰。统计图是表现统计资料的另一种更直观、更形象的手段。

3.2 统计分组

【案例3-2】


现在你已经对400多份调查问卷进行了审核,并将有效的问卷资料录入了计算机。但计算机中呈现的数据仍然是零散的,只能显示每个被调查对象的具体情况,不能说明被研究总体的全貌,接下来,你该怎么办呢?

案例分析:在统计中,分组是常用的统计整理分析方法,它可以使我们在充分掌握了个别数据的基础上,以分类概括的方式汇总资料,从而达到全面反映总体数量特征的目的。

3.2.1 统计分组的概念和作用

统计分组是根据统计研究的需要,将统计总体按照一定的标志分为若干组成部分的一种统计分析方法。统计分组对总体而言是“分”,对总体单位而言是“组”,其目的是把同质总体中的具有不同性质的总体单位归类,把性质相同的总体单位归并到一起,通过分类的方法达到认识事物本质和规律的目的。

统计分组在统计整理和统计分析中具有十分重要的作用,具体表现在以下几个方面。

(1)反映总体特点和规律。对于零星的、分散的统计资料,经过统计分组整理后,资料可以变得有条理,从而能够直观地反映事物的特点。例如,某班级共50位学生,以下是某次统计考试的卷面成绩。

89 75 60 48 95 88 78 90 66 93 74 71 58 85 80 69 79

77 92 70 61 55 81 83 66 62 51 72 90 86 65 73 83 61

86 67 82 71 51 92 69 77 87 82 79 72 75 80 76 58 

根据以上资料我们无法对该班的学习成绩进行具体分析。现在,我们对上述资料进行分组整理,编制成如表3-1所示的考试成绩分组表。

表3-1 某班学生统计考试成绩分组表

按成绩分组

学生人数(人)

60分以下

6

60~70分

10

70~80分

15

80~90分

13

90~100分

6

合计

50

从表3-1中可以看到,某班学生的统计考试成绩经过分组整理后,能够比较直观地反映该班的总体成绩情况了。

(2)划分现象类型。在对复杂的社会经济现象进行统计中,借助于统计分组的方法,可以将社会经济现象按照统计研究的要求区分为不同的类别或群体,形成若干类型,通过类型划分研究国民经济和社会发展各方面内在的相关关系。例如,国民经济统计中,按经济活动性质不同将国民经济划分为第一、第二、第三产业;社会统计中,将人口按经济收入、受教育程度等标准划分为不同的阶层;企业统计中,将技术工人按技能水平划分为不同的岗级,这些类型划分对于研究国民经济运行、社会发展和企业生产经营都有着重要的意义。

(3)揭示现象内部结构。各种现象的总体都是由各个组成部分构成的,计算各组成部分占总体的比重,可以揭示总体内部的构成,表明部分与总体、部分与部分之间的关系。例如,统计某班学生考试成绩所编制的成绩分组表之所以能够比较直观地反映该班的总体成绩情况,正是因为分组能够揭示该班学习成绩的总体分布,我们还可以通过计算各组的学生人数在班级中所占的比重,更深入地反映该成绩分布的结构关系。

(4)分析现象的依存关系。社会经济现象之间是相互联系、相互制约的,一些现象的发展变化往往会引起另一些现象的发展变化,统计分组可以帮助我们分析现象之间的这种依存关系。例如,研究商业企业中商品销售额与流通费用的依存关系,可以将各商业企业按商品销售额分组,计算每个组相应的商品流通费用,如表3-2所示。

表3-2 某市100个超市流通费用率情况

按销售额分组(万元)

超市数(个)

流通费用率(%)

100以下

10

11.8

100~200

20

11.2

200~300

30

10.5

300~400

25

9.7

400以上

15

8.9

由表3-2的分组资料可见,销售额与流通费用之间具有明显的依存关系,即销售额越大,每百元销售额中的流通费用越小。这种依存关系只有通过分组才能揭示出来。

3.2.2 统计分组的方法

对调查资料的分组整理分为3个步骤:一是选择分组标志;二是确定分组界限;三是根据分组标志和分组界限编制分配数列。其中,选择分组标志和确定分组界限是统计分组的关键,本节先向你介绍这两个分组步骤,三是编制分配数列,它的内容在下一节中介绍。

1.选择分组标志

正确地选择分组标志是统计分组的关键。分组标志一旦选定,就突出了总体在该项标志下的性质差别,而掩盖了总体在其他标志下的不同。对同一总体按不同标志进行分组会得到不同的分组结果甚至相反的结论。分组标志选择不当,不但无法显示现象的根本特征,甚至会混淆事物的性质。正确选择分组标志应遵循以下原则。

(1)根据统计研究的目的和任务选择分组标志。同一研究总体,研究的目的不同,可选用的分组标志也不同。如市场调查中研究的目的不同,对客户的分组可以从多个角度来进行。例如,在学校学生管理工作中,一般按班级对学生进行分组;在举行全校运动会时,会按性别和年级分组;在统计学生实习和就业情况时,又会按学生是否上岗就业进行分组。

(2)要选择最能够反映现象本质的标志作为分组标志。在同一研究目的下,往往有多种分组标志可供选择。在这些标志中,有些是本质的或主要的,有些是非本质的或次要的,在进行分组时,应选择最能反映事物本质特征的标志。例如,在对大学生理财观念及行为进行调查时,应选择最能够反映大学生理财观念及行为的标志,如每月必需生活费的金额、节余的钱的使用方向、对生活支出是否有计划等。

(3)要考虑现象所处的历史条件和经济状况及标志内涵的变化来选择分组标志。由于社会是不断发展的,不同的历史条件与不同的经济条件下,选择的分组标志也不一样,某些标志的内涵也在发展改变。如企业按规模大小进行分组,反映企业规模的标志很多,如职工人数、产品产量、产值、生产能力、固定资产价值等,选择哪一个作为分组标志,就必须结合企业所处的具体行业来确定。处于劳动密集型行业的企业宜选择职工人数作为分组标志;处于技术密集型行业的企业宜采用生产能力或固定资产价值作为分组标志。并且,随着社会经济的发展,划分大中小型企业的标准也在改变,宜参照国家提供的企业规模划分标准和企业当地的实际经济状况来确定具体的划分标准。

2.确定各组界限

分组标志确定之后,还必须在分组标志变异范围内,划定各相邻组间的性质界限和数量界限。根据分组标志的不同,统计总体可以按品质标志分组,也可以按数量标志分组。

(1)按品质标志分组。按品质标志分组是指选择反映现象属性特征的品质标志作为分组标志。按品质标志分组能直接反映事物间质的差别,给人以明确、具体的概念,如将学生按性别、班级分组,将某市的企业按区域分组等。按品质标志分组多数是比较容易的,由于分组界限清晰,分组标志有几种具体表现,就分成几组。但有些品质标志分组时各组的界限确定则比较复杂,如人口按城乡分组、产品按用途分组、生产按行业分组、劳动者按职业分组等,都是比较复杂的分组。在实际工作中,为了统一标准,联合国及各个国家都制定了适合一般情况的标准分类目录,如我国就有《国民经济行业分类目录》《学科门类分类目录》《统计用产品分类目录》《统计上大中小微型企业划分办法》等。

(2)按数量标志分组。统计的研究对象是社会经济现象的数量方面,所以,按数量标志分组是我们研究的重点。按数量标志分组是指选择反映事物数量差异的数量标志作为分组标志。

与品质标志分组不同的是,数量标志具体表现为一定范围内的变量数值,按数量标志分组时并不是单纯地确定各组的数量差别,而是要通过数量的变化来区分各组的不同类型和性质。因此,正确地选择决定事物质的差别的数量界限,在数量分组中是一个关键问题。例如,统计学生的考试成绩时,应选择60分为数量界限,60分是划分学生成绩是否及格的关键界限。

无论是按品质标志分组还是按数量标志分组,在进行分组时必须遵循穷尽原则和互斥原则。

穷尽原则就是要使总体内的每一单位都能无一例外地划归到各自所属的组。例如,如果把学生的生活费开支分为500~800元、800~1 200元、1 200~1 500元、1 500~2 000元4组,则那些生活费开支在500元以下的和生活费开支在2000元以上的学生就会无所归属。

互斥原则也称不相容原则,就是总体分组后,每个组的范围应该互不相容,互相排斥。即每个总体单位在特定的分组标志下只能归属于某一组,而不能同时归属于几个组中,组限的划分要分明。例如,将学生的生活费开支分为500~800元、800~1 200元、1 200~1 500元、1 500~2 000元4组,需要确定各组临界值的归属标准,如生活费开支在800元的学生不应被同时计入500~800元、800~1 200元两个组中。

3.统计分组的种类

统计分组按分组标志的多少及其排列形式可分为简单分组、平行分组体系和复合分组体系。

(1)简单分组。简单分组就是对被研究现象总体仅按一个标志所进行的分组。例如将学生按性别分组、按学习成绩分组等,简单分组只能说明总体在某一方面的差异情况。

(2)平行分组体系。对同一总体采用两个或两个以上的分组标志分别进行的简单分组,就形成了平行分组体系。例如,将某班学生按性别和统计考试成绩分别分组,就形成了表3-3所示的分组情况。

表3-3 某班学生分别按性别、统计考试成绩分组情况

性别 统计考试成绩
60分以下 60~70分 70~80分 80~90分 90~100分
22 28 6 10 15 13 6

从表3-3中可以看到,通过平行分组可以从多个角度了解总体内部的分布情况,但各个分组标准之间是相互独立的。

(3)复合分组体系。复合分组是将总体按两个或两个以上的标志重叠起来进行的分组。例如,将某班学生先按性别分组,再在此基础上按统计考试成绩分别在男生和女生中细分成更小的组,如表3-4所示,就形成了复合分组体系。

表3-4 某班学生按性别、统计考试成绩分组情况

学生按性别、统计考试成绩分组 男生学生数(人) 女生学生数(人)
总人数 22 28
60分以下 4 2
60~70分 5 5
70~80分 5 10
80~90分 4 9
90~100分 4 2
合计 50

从表3-4中可以看到,通过复合分组,可以从学生性别、考试成绩两个不同的角度了解总体内部的差别和关系,能够更深入、更全面地掌握总体情况。

需要注意的是,复合分组的组数会随着分组标志的增加成倍地增加,如果组数太多,反而不易揭示问题的实质。因此,复合分组的分组标志不宜过多,一般不超过3个。

【案例3-2】解析


现在来思考一下A市自来水公司客户满意度调查项目,在这个项目中你觉得会使用哪些分组方法?

提示:在前面的学习中,你已经编制了客户满意度调查问卷,现在你会发现,其实在设计调查问卷时就已经涉及分组概念了,调查问卷上的每一个调查项目(标志)都已进行了分组。例如,问卷中的问题D1,“对于A市自来水有限公司提供的自来水的质量,您的满意度如何?”,这个调查分为“无特殊气味”、“无杂质”、“无色”、“无特殊味道”等4个项目,分别按“非常满意”、“满意”、“一般”、“不满意”、“非常不满意”进行了分组。

在A市自来水公司客户满意度调查项目里,统计分组主要表现为品质分组,但对客户家庭人口数的分组和客户每月水费的分组属于数量分组。

统计分组在统计工作中可分为事前分组和事后分组。如在问卷调查中,为了便于被调查对象回答问题和提高答卷的有效性,通常在问卷设计中就已考虑到后期资料整理的要求,每一个调查项目的答案就是按照后期分组的要求设计的,这就是事前分组。但在使用直接观察法和访问法的调查项目中,需要通过现场观察和访问的方式先记录下调查的结果,然后才能对资料进行整理、汇总,这就需要进行事后的分组整理。

3.3 分配数列

【案例3-3】


在明确了应如何对A市自来水公司的客户满意度进行分组的基础上,你现在开始着手对客户意见进行汇总,当你计算汇总出结果后,该以什么方式来反映分组统计出的客户意见的总体情况呢?

案例分析:在统计分组整理的前两个步骤中,我们通过选择合理的分组标志和分组界限解决了如何分类汇总统计资料的问题,在此基础上我们需要实施第3个步骤,通过编制分配数列,将分组统计汇总的结果表现出来。

3.3.1 分配数列的概念和种类

分配数列又称分布数列、次数分布,是指在统计分组的基础上,把总体的所有单位按组归类并排列,形成总体中各个单位在各组间的分布。各组的单位数叫做次数,又称频数。各组次数与总次数之比叫做频率,又称比率。分布数列在统计研究中具有重要意义,它是统计整理结果的一种重要表现形式,也是统计分析的一种重要方法。它表明了总体单位分布的特征和结构状况,为进一步研究总体的构成、计算统计指标提供了方便。

分配数列由两个要素构成:总体按某标志所分的组的名称和各组的次数或频率。表3-5所示为2013年我国人口性别情况统计表。

表3-5 2013年我国人口性别情况统计表

性别

人口数(万人)

比率(%)

69 728

51.24

66 344

48.76

合 计

136 072

100.00

根据分组标志的不同,分配数列分为品质分配数列和变量分配数列。

按品质标志分组形成的分配数列为品质分配数列。品质分配数列的编制相对比较简单,只要分组标志选择正确,分组恰当合理,按统一规定的分类标准,各组的性质界限也就容易划分。

按数量标志分组形成的分配数列为数量分配数列,也称为变量分配数列。按照用以分组的变量的表现形式,可以分为单项式变量数列和组距式变量数列两种。

1.单项式变量数列

单项式变量数列指只以一个变量值代表一组所编制的变量数列,简称单项数列。单项数列的特点是每个变量值单独成为一个组,组数的多少由变量值的个数决定。表3-6所示的某班学生年龄统计表即为单项数列。

表3-6 某班学生年龄统计表

年龄(岁)

学生数(人)

比率(%)

18

20

40

19

20

40

20

10

20

合 计

50

100

单项式变量数列一般适用于离散型变量,且在变量值不多、变动范围不大的条件下采用。如果离散型变量的变量值变动很大,数值很多,采用单项式分组必然造成组数过多,总体次数分布过于分散,就会失去分组的意义。例如,如果将全国的人口按年龄分组,由于人口年龄跨度大,从0岁至100多岁,这种情况下就不适合再编制单项数列。

2.组距式变量数列

组距式变量数列指每个组是由表示一定变动范围的两个变量值所组成的变量数列,简称组距数列。组距数列的特点是每个组是变量值的一段数值区间,组别的多少由组距的大小决定。表3-7所示为2013年全国人口年龄构成情况,编制的即为组距数列。组距式变量数列一般适用于连续型变量或者是变量值个数较多、变动范围较大的离散型变量。

表3-7 2013年全国人口年龄构成统计表

年龄(岁)

人口数(万人)

比率(%)

0~14

22 316

16.33

14~65

100 557

73.57

65岁以上

13 799

10.10

合 计

136 072 

100.00

在组距数列的编制和分析中,经常运用以下基本概念。

(1)组限。组限是指各组两端的数值。每一组的最大变量值称为该组的上限,最小变量值称为该组的下限。例如,表3-7所示的2013年全国人口年龄构成统计表第一组的上限为14岁,下限为0岁;最后一组“65岁以上”则只有下限,没有上限,这种分组称为开口组。

由于变量有离散变量和连续变量之分,在组限表示上也有所不同。离散型变量可以一一列举,而且相邻两个数值之间没有中间数值,因此,各组的上下限都可以用确定的数值表示,相邻组组限数值可不重叠,表3-7所示的各组年龄数值可表示为0~14岁、15~65岁等。

连续型变量与此不同,由于相邻两个数值之间可能有无限多个中间数值,不可能一一列举,因此相邻组的上限和下限无法用两个确定的数值分别表示。所以在连续变量数列中,上一组的上限同时也是下一组的下限。表3-8所示为某车间职工月工资统计表,表中相邻两组的组限是重叠的,如4 000元是第二组的上限,也是第三组的下限,这时,习惯上按照“上限不在内”的原则处理,将月工资为4 000元的职工归入第三组中。

表3-8 某车间职工月工资统计表

月工资(元)

职工人数

比率(%)

3 000以下

5

10

3 000~4 000

15

30

4 000~5 000

20

40

5 000~6 000

8

16

6 000以上

2

4

合 计

50

100

根据“上限不在内”原则,离散型变量的分组,也普遍采用相邻组上下限重叠的方式来进行分组列示,表3-7所示的2013年全国人口年龄构成统计表的分组可以表示为0~14岁、14~65岁等。这样表示不仅比较简明,而且在统计分析中计算组中值时也更加方便。

(2)组距。上限与下限之间的距离或差数就是该组的组距,即:组距=上限−下限。组距表示各组标志值变动的范围。

根据变量分配数列各组的组距是否相等还可分为等距数列和异距数列(或不等距数列)。

等距数列是指各组保持相等组距的变量数列。表3-8所示的某车间职工月工资统计表即为等距数列。在标志值变动比较均匀的情况下,可编制等距数列。编制等距数列有很多好处,它便于各组单位数和标志值的直接比较,在进行统计分析时也比较简便。

异距数列是指各组组距不相等的变量数列。当标志值变动很不均匀,如急剧增长或下降、变动较为极端时比较适宜编制异距数列。有时编制异距数列更能反映事物性质变化的数量界限,如表3-7所示的2013年全国人口年龄构成统计表,是考虑到人口在不同年龄阶段的生理变化特点所进行的分组。

(3)组数。组数就是分组的个数。在所研究的总体一定的情况下,组数的多少和组距的大小是紧密相关的。一般来说,组数和组距成反比关系。在对同一现象进行分组时,组数少,则组距大;组数多,则组距小。如果组数太多,分组太细,容易将属于同类的单位划分到不同的组中,因而显示不出现象类型的特点。但也不能随意扩大组距,减少组数,把不同性质的单位归并在一组中,失去区别事物的界限,则无法达到正确反映客观事实的目的。

(4)组中值。组中值就是上、下限之间的中点数值,是代表各组标志值的一般水平的数值。

图像说明文字

在开口组中计算组中值的公式为

图像说明文字

图像说明文字

组中值并不是各组标志值的平均数,在组距数列中,组距掩盖了分布在组内各单位的实际变量值,因此需要用组中值来代表该组的一般水平。可见计算组中值是假定各组标志值的变化是均匀的。

3.3.2 变量分配数列的编制

品质分配数列的编制较为简单,在实际工作中使用较多的是变量分配数列,因此,这里以变量分配数列为例介绍分配数列的编制方法。

1.单项式变量数列的编制

单项式变量数列就是把每一个变量值作为一组,编制时,首先把所有变量值按大小顺序排列,再将各变量值相应的次数列入分配数列的次数栏中即可。

【例3-1】某车间班组25个工人生产计件(台)资料如下,要求对工人生产量数据进行分组整理。

6 4 3 5 7 5 4 6 7 3 5 4 6 6 4 4 5 6 4 7 5 4 3 5 6

整理方法如下。

(1)观察以上原始资料,将变量值按由小到大的顺序进行排列。

(2)将加工产品数量相同的工人分为一组,计算各组的工人数。

(3)计算出每组的工人人数在总体中所占的比率,编制分配数列,如表3-9所示。

表3-9 某车间班组25个工人生产计件统计表

生产计件数(台)

工人数(人)

比率(%)

3

3

12

4

7

28

5

6

24

6

6

24

7

3

12

合计

25

100

2.组距式变量数列的编制

组距式变量数列一般在不同变量值很多,且在变量值变动范围很大时使用。

【例3-2】以下是某学生对班里40位同学暑期勤工俭学情况进行调查时所获得的每位同学勤工俭学的收入。

  3 200   1 200   480     0   1 500   1 300   600     0   5 800  1 850

  2 400   1 350   850     0   2 480    980   750   1 200   960   800

   500   1 350   2 800    0   780   1 800   1 550   1 600   3 650  1 000

  1 780    660   1 400   1 100  5 660   4 000   1 860  1 280   4 580  1 600

由于每位同学的勤工俭学收入差异较大,且收入属于连续变量,所以对数据整理时不宜编制单项数列,该同学决定编制组距数列。

整理方法如下。

(1)将原始资料按大小顺序排列。只有将得到的原始资料按其数值大小重新排列,才能看出变量分布的集中趋势和特点,为确定全距、组距和组数做准备。以下是将数据重新排列后的结果。

    0     0     0      0    480    500   600    660    750   780

   800   850    960    980   1 000   1 100   1 200   1 200   1 280   1 300

  1 350   1 350   1 400   1 500   1 550   1 600   1 600   1 780   1 800   1 850

  1 860   2 400   2 480   2 800   3 200   3 650   4 000   4 580   5 660   5 800

从以上数据排列可以观察到,学生的勤工俭学收入差距较大,收入比较集中于5003000元。

(2)确定全距。全距是最大变量值与最小变量值之差,表明标志值的变动范围。确定全距,主要是确定变量值的变动范围和变动幅度,如果是变动幅度不大的离散变量,即可编制单项式变量数列;如果是变量变动幅度较大的离散变量或者是连续变量,就要编制组距式变量数列。在本例中,全距 = 5 800 − 0 = 5 800(元)。

(3)确定组数、组距和组限。组距的大小与组数的多少相互制约,呈反比例关系。组距越大,组数就越少。为了统计分析计算方便,编制组距数列时,组距宜取5、10或100的倍数。而且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值。在确定组距时,必须考虑原始资料的分布状况和集中程度,注意组距的同质性,尤其是决定质的差别的数量界限,绝不能混淆,否则就失去了分组的意义。例如,对成绩分组时,应将60分作为一个重要组限,不能在同一组中既有及格的学生又有不及格的学生;对计划完成程度分组时,100%也是一个重要组限,同样不能出现同一组中有已完成任务的和未完成任务的情况。如果一个班的学生成绩比较集中于70~90,仅有一个学生成绩在40分,则可以将其归入“60分以下”组,而无需在60分以下再详细分组。

在本例中,由于学生勤工俭学收入差异较大,分组不能太细,分组的组数以10组以下较为适宜,如果组数为10组,则每组组距 = 5800 ÷ 10 = 580元,显然这种分组组距不便于统计整理和分析。分组的组距宜取5、10或100的倍数,这里我们可以考虑将组距定为600元,这样分组数据在显示上较为简明,在计算组中值时也较为简便。经过以上分析,我们可以确定表3-10所示的分组组距、组数和组限。

(4)计算各组的单位数。在变量分组确定后,通过手工或计算机汇总,计算出各组的单位数,并用分配数列的形式表示,如表3-10所示。

表3-10 某班学生暑期勤工俭学收入统计表

勤工俭学收入(元)

学生人数(人)

比重(%)

600以下

6

15.00

600~1 200

10

25.00

1 200~1 800

12

30.00

1 800~2 400

3

7.50

2 400~3 000

3

7.50

3 000~3 600

1

2.50

3 600~4 200

2

5.00

4 200以上

3

7.50

合计

40

100.00

3.累计次数和累计频率

为了研究变量数列的次数分配状况,统计工作中还常计算累计次数和累计频率,它表明总体在某一定量值之下或之上共包含的单位个数及占总体单位总数的比重。累计次数和累计频率分为向上累计和向下累计两种。

(1)向上累计。向上累计又称由小向大累计,是将各组次数和频率由变量值低(小)的组向变量值高(大)的组逐个累计,它表明该组上限以下的单位数是多少,占总体比重是多少。例如,表3-11所示的某班学生统计考试成绩分组表,第2组的上限是70,则向上累计即为70分以下的学生数,包括60以下组的6人和60~70组的10人,累计人数为16人。

(2)向下累计。向下累计又称由大向小累计,是将各组次数和频率由变量值高(大)的组向变量值低(小)的组逐组累计,它表明该组下限以上的单位数是多少,占总体比重是多少。例如,表3-11所示的某班学生统计考试成绩分组表,第2组的下限为60,则向下累计即为60分以上的学生数,包括除60分以下组以外的其他各组的学生数,累计人数为44人。

表3-11 某班学生统计考试成绩分组表

按成绩分组 (分) 学生数 (人) 比重 (%) 向上累计 向下累计
学生数(人) 比重(%) 学生数(人) 比重(%)
60以下 6 12 6 12 50 100
60~70 10 20 16 32 44 88
70~80 15 30 31 62 34 68
80~90 13 26 44 88 19 38
90~100 6 12 50 100 6 12
合计 50 100

【案例3-3】解析


现在来思考一下A市自来水公司客户满意度调查项目,在这个项目中你该怎样编制分配数列?

提示:由于在A市自来水公司客户满意度调查项目中已进行了事前分组,你在统计整理阶段所需要做的工作就比较简单了,只需汇总统计每个调查项目客户的反馈意见即可整理出相应的分配数列。下面以编号为D1的问卷处理为例,说明其编制分配数列的方法。

D1.对于A市自来水有限公司提供的自来水的质量,您的满意度如何?

 

非常满意

满意

一般

不满意

非常不满意

无特殊气味

 

 

 

 

 

无杂质

 

 

 

 

 

无色

 

 

 

 

 

无特殊味道

 

 

 

 

 

操作方法:分别统计与自来水质量有关的4个项目客户的意见,将属于相同意见的客户归入同一组,然后编制分配数列,如表3-12所示。

表3-12 客户对自来水质量的满意度

按客户对自来水质量满意度分组 无特殊气味 无杂质 无色 无特殊味道
客户数 (人) 比率 (%) 客户数 (人) 比率 (%) 客户数 (人) 比率 (%) 客户数 (人) 比率 (%)
非常不满意 5 1.25 7 1.75 9 2.25 3 0.75
不满意 28 7.00 46 11.50 54 13.50 24 6.00
一般 128 32.00 122 30.50 105 26.25 116 29.00
满意 171 42.75 172 43.00 173 43.25 195 48.75
非常满意 68 17.00 53 13.25 59 14.75 62 15.50
合计 400 100.00 400 100.00 400 100.00 400 100.00

3.3.3 次数分布的类型

各种不同性质的客观现象有着各自不同的次数分布特征,概括起来主要有3种类型:钟形分布、U形分布和J形分布。

1.钟形分布

钟形分布的特征是中间高、两头低,这类总体单位的分布是以平均值为中心的。越接近中心,分布的次数越多;离中心越远,分布的次数越少。其分布曲线就像一口古钟,故称之为钟形分布。钟形分布又可细分为正态分布和偏态分布。

(1)正态分布。钟形分布中的对称分布也称为正态分布,如图3-2所示。许多现象的分配数列的分布属于钟形分布,如学生的学习成绩、工人的生产产量、人的身高等。

(2)偏态分布。偏态分布曲线也是中间高、两侧低,但左右不对称,有一侧呈尾巴状。根据长尾拖向左方或右方,分为左偏分布和右偏分布,如图3-2和图3-4所示。如社会人均收入分布通常呈右偏分布(见图3-4),即低收入段的人数较多,高收入的人数较少,收入水平差距较大。保健品消费的年龄分布通常呈左偏分布(见图3-3),这些产品的消费者以中老年人为主,年轻人由于购买力的限制,加上保健意识不强,人数较少。

0301

图3-2 正态分布

0302

图3-3 偏态分布(左偏) 

0303

图3-4 偏态分布(右偏)

2.U形分布

U形分布的特征与钟形分布恰好相反,其特点是:靠近中间的变量值分布次数较少,靠近两端的变量值分布的次数较多,形成两头大、中间小的状态,如图3-5所示。例如,人口死亡现象按年龄分布便是典型的U形分布,在正常情况下的人口总体中,婴幼儿和老年人死亡率相对较高,而中青年人死亡率较低。

0304

图3-5 U形分布 

3.J形分布

J形分布的特征是一边小一边大的单边分布,绘制成曲线图形如英文字母“J”,故称为J形分布。J形分布有正J形分布和反J形分布之分。

正J形分布的特点是次数随着变量值的增大而增多,如图3-6所示。例如,通常某种产品的供给量会随着价格上升而增大,供应量在价格上的次数分布即表现为正J形分布。

反J形分布的特点是次数随着变量值的增大而减少,如图3-7所示。例如,通常某种产品的消费量会随着价格上升而减少,消费量在价格上的次数分布即表现为反J形分布。

0305

图3-6 正J形分布 

0306

图3-7 反J形分布

3.4 统计表和统计图

【案例3-4】


现在你已完成了对A市自来水公司调查资料的分组整理,并按要求编制了各个调查项目的分配数列。你的统计整理任务是否已经完成?你还需要做些什么?

案例分析:统计数据经过分组整理后,通过编制分配数列已经变得有条理了,在此基础上,你需要按照统计表的规范格式展示分配数列,以便于读者阅读和理解,你还可以考虑用形象的统计图把总体的数量特征和数量关系更直观地表现出来,尤其是在你特别需要强调的关键问题上,这种效果会更好。

统计资料的表现形式有统计表、统计图和统计分析报告。其中,统计表和统计图是显示统计数据最常用的两种形式。学会阅读、编制和使用统计表、统计图是统计的基本技能,是做好统计分析的基础。

3.4.1 统计表

将统计资料按照一定的规范表现在表格里,就形成了统计表。统计表能够使统计资料的表现条理化、系统化,更清晰简明地显示数字之间的联系,有利于进行比较和分析研究。

1.统计表的结构

从统计表的形式看,统计表由4部分构成,如图3-8所示。

(1)总标题:它是统计表的名称,用以概括表中统计资料的主要内容。

(2)横行标题:它是各组的名称,反映总体单位的分组情况。

(3)纵栏标题:它是统计指标的名称,说明纵栏所列各项资料的内容。

(4)数字资料:也称指标数值,它是统计表的具体内容,每一项指标数值都由相应的横行标题和纵栏标题加以限定。

从统计表的内容看,统计表包括主词和宾词两个部分,如图3-8所示。主词是统计表所要说明的总体以及总体的各单位、各组的名称,或者各个时期。宾词是统计表用来说明主词的各个指标,包括指标名称、指标数值和计算单位。

0307

图3-8 统计表的结构

2.统计表的种类

统计表按照主词是否分组和分组的程度,分为简单表、分组表和复合表。

(1)简单表。简单表是主词未经任何分组,仅按单位名称或时间先后顺序排列而成的统计表。通常对调查的原始资料进行初步整理时会运用简单表,如表3-13所示的某企业某年各季度销售额统计表即为简单表。

表3-13 某企业某年各季度销售额统计表

季度

销售额(万元)

一季度

5 158

二季度

5 649

三季度

6 687

四季度

7 103

(2)分组表。分组表是主词按一个标志进行分组而形成的统计表,分组可以反映现象的不同特征,揭示总体的内部构成,有利于分析现象之间的依存关系,如图3-8所示的某班学生年龄统计表即是分组表。

(3)复合表。复合表是主词按两个或两个以上标志进行复合分组而形成的统计表。它可以反映所研究对象受几种因素的共同影响而发生的变化,如表3-14所示的各城市自来水用水量统计表。

表3-14 各城市某年自来水用水量统计

按各城市自来水用户性质分组 自来水用水量(亿立方米)
       A市 4.5
企业用户 2.4
居民用户 2.1
       B市 6.5
企业用户 3.8
居民用户 2.7
       C市 4.3
企业用户 2.5
居民用户 1.8
3.统计表的编制规则

为使统计表的设计合理、科学、实用、简明,在编制统计表时,必须遵守以下规则。

(1)统计表的各种标题,特别是总标题的表达,应该十分简明、确切,能够概括地反映出统计表的基本内容。总标题还应该标明资料所属的时间和空间。

(2)统计表的左右两端习惯上均不画线,采用开口式。表的上下横线最好用粗线,纵栏之间用细线分开,横行之间可以不加线。

(3)如果统计表的栏数较多,通常要加以编号,主词和计量单位等栏用(甲)、(乙)、(丙)等文字标明;宾词指标各栏用(1)、(2)、(3)等数字编号。各栏之间若有计算关系,可以用数字符号表示。如(3)=(2)×(1),表示第(3)栏等于第(2)栏乘以第(1)栏。

(4)表中数字应该填写整齐,对准位数,同类数字要保持有效的统一位数。当数字为0或因数小可忽略不计时,要写上0;当缺乏某项资料时,用符号“…”表示;不应有数字时用符号“—”表示。表内如有相同的数字时,应全部重写一遍,不能用“同上”、“同左”等字样表示。

(5)表中的横行“合计”,一般列在最后一栏(或最前一栏),表中纵栏的“合计”一般列在最后一行。

(6)统计表中必须注明数字资料的计量单位,当表中只有一种计量单位时,可以把它写在表头的右上方。如果表中需要分别注明不同的单位,横行标题的计量单位可以专设一栏,纵栏标题的计量单位,要与纵栏标题写在一起,用小字标写。

(7)必要时,统计表应加注说明或注解。例如,某些数字是由估算来插补的,某些资料只包括一部分地区,这些都需要加以说明。

3.4.2 统计图

统计图是利用几何图形或具体形象表现统计资料的一种形式。用统计图再现统计资料,具有鲜明醒目、富于表现、易于理解的特点,因而绘制统计图是统计整理的重要内容之一。

统计图可以表明现象的规模、水平、结构、对比关系、依存关系、发展趋势和分布状况,有利于进行统计分析和研究,常用的统计图主要有直方图、折线图、曲线图、饼图等。

1.直方图

直方图是用宽度相等、高度或长短不同的柱形来表示现象之间对比关系的统计图,故又被称为柱形图。由于这种图形制作简单,便于对比,又容易给人留下深刻印象,所以被广泛应用于实践中。绘制直方图的基础是分组表,以某班学生统计考试成绩分组为例,绘制的直方图如图3-9所示。

0308

图3-9 直方图 

2.折线图

折线图是在直方图的基础上,将每个长方形的顶端中点用折线连接而成,或用组中值和频数相应的坐标点连接而成。折线图可使资料的分布更加一目了然,并且可以描述某种现象随时间变化而变化的趋势,通过分析其规律,来预测未来发展变化。图3-10所示为根据某班学生统计考试成绩分组表绘制的折线图。

0309

图3-10 折线图

3.曲线图

曲线图是将纵横坐标相交的实心点以光滑的曲线相连接而形成的图形。曲线是表现连续型变量数列次数分布的常用形式,适用于变量值非常多或变量数列的组数非常多的情况。图3-11所示为根据某班学生统计考试成绩分组表绘制的曲线图。

0310

图3-11 曲线图

4.饼图

饼图又称圆形图,是以圆形面积或以圆内各扇形面积的大小来表示指标数值大小的图形,它常用于反映总体的内部结构。在实际应用时亦可将圆面改为圆饼、圆台或圆形立体图来展示。所要显示的资料数据一般是百分数,这样可以直观地显示总体各组成部分所占的比重。图3-12所示为根据某班学生统计考试成绩分组表绘制的饼图。

0311

图3-12 饼图

一项调查所得资料经过处理,通常会有大量的数据,如果仅用文字描述,显得枯燥乏味且难以理解,而以上所展示的统计图则非常简单直观地说明了事物之间的内在关系和发展变化。

3.5 Excel在统计整理中的应用

除了在大型统计项目中需要运用专业的统计软件如SPSS等进行资料整理和分析外,一般的统计项目均可以运用Excel软件进行资料的整理和分析。

3.5.1 录入编码

运用计算机进行数据处理,首先要对调查资料进行编码,然后将数据录入计算机,才能由计算机软件进行数据汇总分析。

编码就是用数值或其他特征符号来代表原始资料中的每一个问题或可能答案,其目的是便于提高计算机输入信息的效率,也便于数据录入后的汇总分析。编码工作实质上就是在计算机中建立一个数据库结构,每个调查项目都用一个变量来代表,每个变量在数据库中有固定的位置,每个变量的取值即变量对应的编码。

有些编码在实施调查前就已进行,称为事前编码;在实施调查后,根据已获得的调查资料在整理阶段再进行的编码,称为事后编码。

1.事前编码

以问卷设计为例,绝大多数问题是有固定选择的,即封闭式的,这一类问题及其答案都很明确,在问卷设计阶段即可进行编码,并且通常是将每个答案的对应值印在问卷上,数据文件用的记录格式常常放在最右边或放在某处的括弧内。

例如:以下两个调查问题及备选答案选自A市自来水公司的客户满意度调查问卷。

E8.您觉得将来自来水价格会怎么样?(单选)

1□ 价格降低

2□ 价格保持不变

3□ 价格提高

E10.在以下的几种交费方式中,将来您比较愿意使用哪几种方式?(多选,不超过3项)

1□ 去营业厅交

2□ 去银行用银行卡在ATM上交

3□ 使用缴费卡

4□ 网上银行

5□ 其他(详细说明)

在这份问卷中,问题E8是一个单选题,共有3个备选答案,分别从1到3进行了编码。问题E10是一个多选题,这是封闭式问题编码的难点,常用的解决方法是将每一回答指定为次级变量,即第E10的每个问题下设有明细的小问题,每个小问题的答案用“1”表示选择,用“0”表示未选择,其中,第5个选项“其他”属于开放性回答,可留待事后再根据答案情况进行编码,即:

E10.在以下的几种交费方式中,将来您比较愿意使用哪几种方式?(多选,不超过3项)

10-1□ 去营业厅交(0,1)

10-2□ 去银行用银行卡在ATM上交(0,1)

10-3□ 使用缴费卡(0,1)

10-4□ 网上银行(0,1)

10-5□ 其他(详细说明)

多选题的编码比单选题复杂,为了保持问卷的清晰性,便于被访者理解和选择,一般不将每个问题和答案的编码印在问卷上。

2.事后编码

事后编码指的是给某个没有事先编码的答案分配一个代码。通常需要事后编码的有以下几种情况。

  • 开放式问题。
  • 封闭式问题中的“其他”选项的资料处理。

调查中出现上述两种情况的原因是被调查事物在调查之前无法确定清晰的可供选择答案,被调查事物的表现将有很多不同的。这些问题的答案无法事先编码,只能在事后对答案进行分析归类,然后再将各类答案分配相应的数值编码。为开放式问题的答案编码是一个很复杂的问题,这种情况下的编码结构,必须反映调研人员的看法,编码的主要目的是将文字回答的含义准确地转化为数值编码,在分析归类过程中,不是简单地以文字作为编码的基础,而是要在理解被访者真实思想的基础上对其进行分类。

3.5.2 在Excel中输入公式

1.公式的结构

公式是对工作表中的数值执行计算的等式,公式以“=”开头,然后是公式的表达式。通常情况下,公式中包含各种运算符、常量、函数和单元格地址等。以下是公式的简单实例。

=300*50           //常量运算

=B6+B7+B8+B9+B10     //使用单元格地址(变量)

=SUM(B6:B10)       //使用求和函数

在Excel中,函数是预定义的公式,如公式“=B6+B7+B8+B9+B10”可以用求和函数表达为“=SUM(B6:B10)”,从而使公式的表达更为简洁。

2.单元格引用

单元格引用是指用单元格在工作表中的坐标位置作为标识。单元格的位置用单元格所在的列标和行号表示,如B8,表示B列第8行。对于单元格区域的引用,则使用冒号将该区域左上角和右下角单元格连接来表示,比如B2:D6表示从B2单元格到D6单元格的5行3列的区域。在定义Excel公式时,经常会通过引用单元格来实现计算,从而提高计算的效率。单元格的引用主要包括相对引用、绝对引用和混合引用。

(1)相对引用。相对引用是指复制公式时单元格地址随着发生改变的引用方式。如图3-13所示,张强的全年销售额为F3,在F3输入公式“=B3+C3+D3+E3”。当将F3的公式复制到F4,计算李伟的全年销售额时,F4单元格的公式自动调整为“=B4+C4+D4+E4”。

图3-13 单元格的相对引用

(2)绝对引用。绝对引用是指复制公式时单元格地址不随着改变的引用方式。其表示方式为在单元格的列标和行号前加上符号“$”。如图3-14所示,在计算张强的销售额占公司全年总销售额的百分比时,G3单元格的公式设置为“=F3/$F$8”,该公式的分母使用的是单元格的绝对引用,这样,在复制该单元格公式时,分母引用的单元格将不再随着单元格的改变而改变。在复制G3公式到G4单元格,计算李伟的年度销售额占比时,G4单元格公式自动调整为“=F4/$F$8”,分母所引用的单元格不再改变。

(3)混合引用。在有些情况下,复制公式时只想保留行固定不变或者列固定不变,这时可以使用混合引用,即同时包含相对引用和绝对引用的引用方式。其表示方式为在单元格的列标或行号前加上符号“$”,如“B$2”,为引用绝对行,“$B2”为引用绝对列。

3-14

图3-14 计算机Excel中输入公式

另外,如果设置公式时,需要引用同一工作簿内的不同工作表的单元格时,引用单元格时需标明工作表,其格式为“工作表!单元格引用”。如在同一工作簿中,将工作表Sheet1中的单元格B6、Sheet2中的单元格B6、Sheet3中的单元格B6求和,结果放在Sheet1中的单元格C6中,则在工作表Sheet1的单元格C6中输入公式为“=Sheet1!B6+ Sheet2!B6+ Sheet3!B6”。

3.输入公式

在Excel中使用公式有助于分析工作表中的数据,同时也避免了手工输入数字的错误。

(1)计算机Excel中输入公式。在计算机Excel中输入公式有两种方式:一是直接在单元格中输入公式内容;二是在编辑栏中输入公式。在单元格中输入公式时,可以用键盘输入,也可以使用鼠标单击引用的单元格,使用键盘上的F4功能键,可以调整单元格的引用方式。

【例3-3】在某公司年度销售员销售业绩统计表中的G3单元输入“=F3/$F$8”。

操作方法(见图3-14):①键盘输入“=”;②鼠标单击F3单元格,该单元格地址自动写入公式;③键盘输入“/”;④鼠标单击F8单元格,该单元格地址自动写入公式;⑤光标定位位于F8时,按键盘上的功能键图像说明文字,F8单元的引用方式修改为绝对引用“$F$8;⑥按回车键确认公式。

(2)手机Excel中输入公式。手机Excel输入公式的方法与计算机Excel类似,只是由于手机界面较小,在单元格中设置的公式内容仅显示于编辑栏中。手机Excel中调整单元引用类型的方式是:点击编辑栏中需调整的单元格地址,窗口自动显示出单元格引用类型列表,点击选择所需的类型,如图3-15所示。

3-15

图3-15 手机Excel中输入公式

4.复制公式

复制公式有两种方式:一是通过窗口功能区中的复制、粘贴工具按钮完成,或使用快捷组合键图像说明文字图像说明文字,此方式适用于不连续的单元格之间的公式复制;二是通过填充柄工具完成复制,此方式适用于连续单元格的公式复制。如图3-14所示,在输入G3公式后,使用填充柄向下拖动,即可完成对G4至G7单元格的公式设置。有关填充柄的操作方法在任务2中已有介绍,这里不再赘述。

5.输入函数

Excel提供了非常丰富的函数,包括统计、财务、数学与三角函数等。输入函数有两种式:一是直接在单元格或编辑栏中输入,与输入公式的方法相同;二是在对函数不熟悉的情况下,通过插入函数工具向导输入函数。下面详细介绍插入函数的操作方法。

【例3-4】在某公司年度销售员销售业绩统计表中的B8单元格中输入“SUM=(B3:B7)”。

(1)计算机上Excel中插入函数。操作方法:①在Excel工作表中选择准备输入函数的单元格B8;②在【公式】标签下的【函数库】组中,单击【插入函数】按钮图片 1,或者直接单击编辑栏中的图片 1按钮;③在弹出的【插入函数】对话框中选择函数类别,并在对应的函数列表中选择所需函数,然后单击图片 1按钮;④在弹出的【函数参数】对话框中,单击【Number1】文本框旁的图片 1按钮;⑤返回到工作表中,拖动鼠标选择准备引用的单元格区域,在【函数参数】文本框中会自动显示已引用的单元格区域,单击文本框旁的图片 1按钮,返回【函数参数】对话框;⑥在【函数参数】对话框的【Number1】文本框中会显示刚引用的单元格区域,单击图片 1按钮,在工作表中即可显示函数计算的结果,如图3-16所示。

图3-16 计算机上Excel中插入函数

(2)在手机上Excel中插入函数。手机上Excel中插入函数的方法与计算机上Excel类似。

操作方法1:①在编辑状态窗口,单击【工具】,展开功能区;②在功能区点击【插入】,在功能列表中选择【fx函数】;③在【函数列表】中选择函数类别和所需的函数;④系统在编辑栏中自动输入选取的函数,光标显示于函数的参数区,单击并拖动选取函数所需引用的单元格区域,已选取的单元格会自动写入编辑栏的公式;⑤单击图片 160按钮,调出数字键盘,可根据需要进行函数内容的编辑,函数编辑完成后,按回车键确认,如图3-17所示。

3-17

图3-17 手机上Excel中插入函数

操作方法2:①在编辑状态窗口,单击【键盘】,展开数字键盘;②单击数字键盘上的图像说明文字按钮,同样可以打开【函数列表】,进而完成后续的函数设置,如图3-17所示。

3.5.3 在Excel中进行分组统计

1.数据排序

对数据进行排序有时是出于分组设计的需要,有时是为了便于阅读理解,使有限的数据在图表中能够以一定的顺序呈现。

【例3-5】请对以下某班40位同学暑期勤工俭学收入资料进行排序。

  3 200   1 200   480    0   1 500   1 300   600    0   5 800   1 850  

  2 400   1 350   850    0   2 480   980   750   1 200    960  800

   500   1 350   2 800    0   780   1 800   1 550  1 600  3 650  1 000

  1 780   660   1 400   1 100  5 660   4 000   1 860  1 280   4 580 1 600

(1)电脑Excel中的数据排序。操作方法:①先将原始数据输入到Excel单元格中,为便于对数据进行操作管理,一般将数据录入在同一列中;②单击列标按钮图片 1,选定需进行排序的数据资料所在列;③在【数据】标签下,【排序和筛选】功能组中,单击【排序】按钮图片 1,将“列A”选择为【升序】排列,如图3-18所示。

图3-18 计算机Excel数据资料排序

(2)手机Excel中的数据排序。操作方法:①将原始数据输入到Excel单元格中同一列;②选定需进行排序的数据资料所在列;③点击【工具】,在【数据】标签下点击【升序排序】或【降序排序】,系统即按指定顺序排列数据,如图3-19所示。

图3-19 手机Excel数据资料排序

2.分组整理

在Excel中进行分组整理有两种方法:一是利用统计分组函数FREQUENCY;二是利用数据分析工具中的直方图工具,可以一次完成分组、计算频数、频率、绘制直方图和累计频率以及图表制作等全部操作,此种方法需要加载宏。统计分组一般适合用电脑Excel进行相应的数据处理。下面仍以【例3-5】数据为例,介绍这两种电脑Excel分组整理方法。

(1)用FREQUENCY函数进行统计分组整理。FREQUENCY函数是根据统计数据源,按照设置的分组标准进行自动计算各组次数的函数。

操作步骤如下。

① 观察资料,确定组数、组距和组限。

② 按分组要求将组限值输入到指定位置,如图3-20所示。

图3-20 数据资料分组

③ 选定结果存放的单元格区域。

④ 在【公式】标签下的【函数库】功能组中单击【插入函数】按钮图片 1,或直接单击编辑栏中的图片 1按钮,打开【插入函数】对话框。

⑤ 在对话框中的函数分类列表中选择“统计”,再在统计函数列表中选择其中的“FREQUENCY”函数(当前窗口没有,可拖动滚动条寻找),然后单击图片 169按钮,打开“FREQUENCY”的【函数参数】对话框。

⑥ 在【Data_array】框中输入待分组的原始数据资料所在区域。可键盘输入,也可单击文本框右边图片 170按钮,拖动鼠标选取数据区域。

⑦ 在【Bins_array】框中输入分组的组限。可用键盘输入每组的上限值,如果是单项数列分组(一个数据一组),也可单击文本框右边图片 171按钮,拖动鼠标选取事先设定好的数据区域。键盘输入时注意,由于分组结果要给出一组频数,所以必须以数组的形式输入,即在输入数据的两端分别加大括号“{”和“}”,各数据(即上限)之间用小写分号“;”隔开,如图3-20所示。

注意


Excel在统计各组频数时,是按“上限在内”的原则进行统计的,这与前面介绍分组原则时所要求的各组“上限不在内”正好相反。在利用Excel进行统计分组整理时,要特别注意两者的差异。在设置各组上限时,应根据实际数据情况进行适当的调整,如本例中,1 000~1 200组的上限为1 200,但在Excel中该组上限应设为1 199,否则,原始资料中有两个1 200的勤工俭学收入数据将统计入1 000~1 200组内。

⑧ 输入完毕,即在文本框下显示出频数分布情况,如图3-20所示。按图像说明文字+图像说明文字+图像说明文字组合键,即可将计算出的分组次数分布数据记入到指定的单元区域内。

注意


按回车或按图片 176按钮均只能记入第一组的次数。

⑨ 计算合计数。计算合计数可插入SUM函数,选定需计算合计的数据区域获得自动计算结果,即D11=SUM(D3:D10);也可直接拖动鼠标,选定数据区域及合计栏,然后单击【函数库】中的【自动求和】按钮图片 1,如图3-21所示。在合计栏中即自动显示合计数据。

3-21

图3-21 计算合计数和比重

⑩ 计算各组比重。首先将数据格式设置为百分比形式,选定比重所在的数值区域,然后执行【格式】/【单元格】命令,打开【单元格格式】对话框。

⑪ 在【开始】标签下的【数字】功能组中,单击图片 1按钮,可将该选取区域设置为百分比格式;单击图片 1按钮和图片 1按钮,可增加和减少小数位,如图3-22所示。

图3-22 设置数据格式

⑫ 单击第一组比重所在单元格E3,用键盘输入“=D3/$D$11(分母先输入D11,然后按键盘上的F4功能键,可将分母设置为单元格的绝对引用方式),按回车键后即得出第一组的频率值。

⑬ 使用填充柄功能复制公式。即单击D3单元,将鼠标移至单元格右下角的边角上,鼠标变成黑色小十字形,按住鼠标左键向下拖动至D11单元,松开鼠标即获得各组的频率值。

(2)使用数据分析工具进行统计分组整理。如果在Excel的功能区中没有数据分析工具,则必须在Excel中安装“数据分析”模块。

操作步骤如下。

① 在Excel窗口中的【文件】标签中,单击【选项】,打开【Excel选项】对话框。

② 在【自定义功能区】的【主选项卡】中勾选【开发工具】,然后单击图片 1按钮。在Excel的功能区会看到新增了【开发工具】标签,如图3-23所示。

图3-23 安装“数据分析”模块

③ 在【开发工具】标签中的【加载项】功能组中单击【加载项】按钮,打开【加载宏】对话框。

④ 勾选【分析工具库】选项,然后单击图片 1按钮。在Excel的【数据】标签中即可增加【数据分析】功能。

使用“数据分析”模块中的“直方图”工具,可以将调查所得的原始数据分组,并一次性完成统计各组频数、频率、累计频率和图表绘制的操作。

操作步骤如下。

① 将调查获得的原始数据输入Excel表中,并进行排序。

② 观察原始数据,按分组要求将组限值输入到指定位置,注意在Excel中上限值包含在该组内,如需设置标题则在分组标志值前空出相应标题行,如图3-24所示。

③ 在Excel窗口中的【数据】标签中单击【数据分析】按钮,打开【数据分析】对话框。

④ 从【分析工具】列表框中选择“直方图”,然后单击图片 31按钮,打开【直方图】对话框。

⑤ 单击【输入区域】文本框中的图片 190按钮,拖动鼠标选择原始调查数据所在的区域,然后再单击图片 191按钮返回,或直接用键盘输入的方式定义原始数据区域。

图3-24 设置“直方图”选项

⑥ 接收区域是指分组标志所在的区域,如勾选了【标志】选项,则需将标志值上方的标题行一并选入接收区域,如未勾选【标志】选项,则只需将各组标志值所在区域选入接收区域。

⑦ 选择输出选项。选择【输出区域】,则需定义输出图表在Excel表中所处的位置,只需定义输出表左上角所在的单元格行列号,如本例中选为“C1”单元;如选择【新工作表组】,则Excel在本文件中建立新的工作表标签,输出图表将在新的工作表中单独显示;如选择【新工作簿】,则Excel将建立一个新文件,输出图表将显示在新文件的窗口中。

⑧ 对其他图表选项进行设置。如选择【图表输出】,则可以输出按标志值顺序排列的次数分布直方图;如选择【柏拉图】,则输出按降序排列的直方图;如选择【累积百分率】,则系统将在直方图上添加累积频率折线图。

⑨ 设置完毕,单击图片 31按钮,即在指定位置显示出一个分组表,如图3-25所示。注意表和图中的“频率”实际上是频数,“累积%”实际上是累计频率。

图片 1

图3-25 利用“直方图”整理输出的统计图表

3.5.4 在Excel中绘制统计图

统计图可以采用手工制作,也可以利用计算机制作生成。Excel提供的统计图有多种,包括柱形图(竖列条形图)、条形图(横列条形图)、折线图、饼图、散点图、面积图等,各种图形的做法大同小异。在手机Excel中同样可以较为便捷地绘制各种统计图。

【例3-6】根据某班40位同学暑假勤工俭学收入的分组资料绘制统计图。

(1)电脑Excel中绘制统计图。操作方法:①选定要绘制统计图的资料区域,在选择时,可以将数据所对应的横行标题和纵栏标题一并选上,这样可以使生成的统计图的标题和图例自动说明数据含义;②在【插入】标签下的【图表】功能组中,单击所需绘制的图表格式按钮,以柱状图为例,单击【柱形图】按钮图片 1,窗口会显示柱形图的图例列表,选择适合的柱形图图标,即可生成相关柱形图,如图3-26所示;③单击标题文本框,可重新编辑柱形图标题。

图3-26 电脑Excel中绘制统计图(1)

如需对图表做进一步设置,可选定图表,在窗口上方即显示【图表工具】功能区,可分别在【设计】、【布局】、【格式】标签下,单击相应的按钮进行设置,如图3-27所示。

(2)手机Excel中绘制统计图。操作方法:①选定要绘制统计图的资料区域;②点击【工具】;③在功能区中点击【插入】;④在功能列表中点击【图表】;⑤选择图表类别;⑥选择图表样式;⑦点击【确定】,窗口即生成相应的统计图表;⑧点击图表框中的空白区域,可调出功能菜单,可对图表进行复制、粘贴、剪切、数据源修改、切换图表类别和样式、进行图表选项设置和删除图表,如图3-28所示。

图片 1

图3-27 电脑Excel中绘制统计图(2)

在图表选项中,可以对图表标题、图例、坐标轴、数据源等参数进行设置。以增设图表标题为例,操作方法:①点击图表框中的空白区域,调出功能菜单,点击【图表选项】;②在【图表选项】窗口点击【图表标题】;③在打开的窗口中将【显示标题】设置为【ON】;④在【标题文字】文本框中输入标题内容,在【标题位置】下拉框中选择标题位置,在窗口下方即可显示图表样式;⑤设置完毕点击【确定】返回,如图3-29所示。

3-28

图3-28 手机Excel中绘制统计图(1)

图3-29 手机Excel中绘制统计图(2)

思考与应用.png 任务实施

现在来思考一下A市自来水公司客户满意度调查项目,请你根据本书提供的数据资料,利用Excel进行统计资料的整理。要求根据调查资料编制相应的统计表和统计图。

任务导入.png 小结

在本任务三学习里,你了解了有关统计数据整理的基础知识,包括统计整理的重要性、统计整理的工作步骤、统计分组和编制分配数列的方法、编制统计表和绘制统计图的方法等内容。其中,你需要重点学习统计分组和编制分配数列的方法,它是进行统计整理的关键步骤,在此基础上,掌握运用Excel进行统计整理的技能,能够提高统计整理的工作效率,并为下一阶段的统计分析做好准备。

相关知识.png 应用与拓展

一、判断题

1.(3.2.1)进行统计分组,有利于研究经济现象的内部结构。      (  )

2.(3.2.1)能够对统计总体进行分组,是由统计总体中的各个单位的“同质性”特点所决定的。                           (  )

3.(3.2.2)统计分组的关键问题是确定组距和组数。          (  )

4.(3.2.2)按数量标志分组的目的,就是要区别各组在数量上的差别。  (  )

5.(3.2.2)在确定组限时,最大组的上限应大于最大变量值。      (  )

6.(3.3.1)按品质标志分组所形成的数列就是变量数列。        (  )

7.(3.3.1)某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。(  )

8.(3.3.1)连续变量的分组,只能是组距式的。              (  )

9.(3.4.1)统计表的横行标题就是统计表的主词。            (  )

10.(3.4.2)饼形图可以反映经济现象的内部结构。            (  )

二、单项选择题

1.(3.1.1)统计整理主要是针对(  )进行加工的过程。

A.综合统计数据  B.历史数据资料  C.统计分析数据  D.原始调查数据

2.(3.2.2)对职工的生活水平高低进行分组研究,正确地选择分组标志应当是(  )。

A.职工月工资总额  B.职工月人均收入额

C.职工家庭成员平均月收入额  D.职工的人均月岗位津贴及奖金

3.(3.2.2)下列属于品质分组的有(  )。

A.企业按职工人数分组  B.企业按工业总产值分组

C.企业按经济类型分组  D.企业按资金占用额分组

4.(3.2.2)区分简单分组和复合分组的主要依据是(  )。

A.分组对象的复杂程度不同  B.分组数目的多少不同

C.采用分组标志的多少不同  D.分组的目的和方式不同

5.(3.3.1)将某地区40个工业企业按产值多少分组而编制的变量数列中,变量值是(  )。

A.产值  B.工厂数  C.各组的产值数  D.各组的工厂数

6.(3.3.1)在组距数列中,下限就是(  )。

A.每个组的最小值  B.每个组的最大值

C.全距中的最大值  D.全距中的最小值

7.(3.3.1)某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组的组中值为(  )。

A.230  B.260  C.185  D.215

8.(3.3.1)某企业的生产计划完成百分比采用如下分组,请指出哪项是正确的(  )。

A.80%~89%,90%~99%,100%~109%,110%以上

B.80%以下,80.1%~90%,90.1%~100%,100.1%~110%

C.90%以下,90%~100%,100%~110%,110%以上

D.85%以下,85%~95%,95%~100%,105%~115%

9.(3.3.1)单项式分组适合运用于(  )。

A.连续型数量标志

B.品质标志

C.离散型数量标志中标志值变动范围比较小

D.离散型数量标志中标志值变动范围很大,标志值的项数又很多

10.(3.3.2)在分配数列中,比率是指(  )。

A.各组分布次数频率之比  B.各组分布次数与总次数之比

C.各组分布次数相互之比  D.各组频率相互之比

11.(3.3.2)变量数列中,各组频率之和应(  )。

A.小于1  B.等于1  C.大于1  D.不等于1

12.(3.3.2)组数与组距的关系是(  )。

A.组数越多,组距越小  B.组数越多,组距越大

C.组数与组距无关  D.组数越少,组距越小

13.(3.3.3)次数分配中,靠近中间的变量值分布的次数少,靠近两端的量值分布次数多,这种分布的类型是(  )。

A.钟形分布  B.U形分布  C.J形分布  D.倒J形分布

14.(3.4.1)统计表中的主词是指(  )。

A.表中全部统计资料的内容  B.描述研究对象的指标

C.各种指标所描述的研究对象  D.分布在各栏中的指标数值

三、多项选择题

1.(3.1.1)统计资料整理包括的内容有(  )。

A.原始资料的审核  B.原始资料的汇总

C.编制统计表  D.统计资料的分析

2.(3.2.1)统计分组同时具备两个方面的含义(  )。

A.对个体而言,是“分”  B.对总体而言,是“合”

C.对个体而言,是“合”  D.对总体而言,是“分”

3.(3.2.1)统计分组的作用在于(  )。

A.提高统计整理的准确性  B.划分现象的类型

C.揭示现象的内部结构  D.分析现象的依存关系

4.(3.2.2)下列按数量标志分组的有(  )。

A.教师按专业分组  B.学生按班级分组

C.企业按营业收入分组  D.职工按月平均工资分组

5.(3.3.2)编制组距数列时,组限的确定(  )。

A.最小组的下限应大于最小变量值   B.最小组的下限应略小于最小变量值

C.最大组的上限应小于最大变量值  D.最大组的上限应略大于最大变量值

6.(3.3.3)次数分布的主要类型有(  )。

A.U形分布  B.J形分布  C.S分布  D.钟形分布

7.(3.4.1)从外形看,统计表由(  )组成。

A.总标题  B.横行标题  C.数字资料  D.纵栏标题

8.(3.4.1)统计表按分组情况不同,可分为(  )。

A.简单表  B.汇总表   C.分组表  D.复合表

9.(3.4.1)填写统计表中指标数值的具体方法有(  )。

A.当数字为0时要填写“0”

B.如不应有数字时,要用符号“一”表示出来

C.如不应有数字时,就不用填

D.当缺某项数字或因数小可略而不计时,用符号“…”表示

E.统计表中数字部分不应留下空白,不可出现“同上”等字样

四、实践实训

请使用Excel软件,对你获得的调查资料进行整理,并绘制相应的统计表和统计图。

目录

同系列书

  • 经济学基础(第2版)

    张建伟 李鹏 叶超飞 王云晋

    为了更好地满足高职高专院校学生对经济学基础知识学习的需要,作者结合近几年的教学改革实践和广大读者的反馈意见,在...

    ¥39.80
  • 管理学理论与实务

    谭新兰 傅航 皮坚

    本书打破一般管理学教材从管理的4个职能(计划、组织、领导和控制)编排的传统模式,从管理岗位能力入手,以具体任务...

    ¥32.00
  • 管理学基础(第2版)

    张金成 胡永红

    本教材共10章,主要内容包括管理导论、管理思想的发展历程、计划、决策、组织、领导、激励与沟通、控制...

    ¥39.80
  • 应用统计学

    洑建红

      本书本着理论够用、强化应用、培养技能的原则,以一个实际统计调查项目为主线,系统讲解统计学的基本原理、工作方...

    ¥25.00
  • 管理理论与实务(第2版)

    万佳丽 韩磊 王保庆 惠建国

    本教材遵循“理论够用,重在实践”的原则;以实用性、应用性为准则;突出课程教学的职业性、开放性和综合性,以“激发...

    ¥35.00
  • 管理理论与实务

    万佳丽 张玉 刘娟 董萍

      本教材遵循“理论够用,重在实践”的原则;以实用性、应用性为准则;突出课程教学的职业性、开放性和综合性,以“...

    ¥32.00
  • 实用商务礼仪

    何爱华 张学娟 吕刘明 李鹏 栗军雄 袭亮

      本书系统地讲解了商务礼仪的相关知识。全书共有7个模块,论述了礼仪的基本理论、商务人员个人礼仪、日常交往礼仪...

    ¥25.00
  • 西方经济学

    张建伟 王帅 费小燕 王云晋 李鹏

      本书介绍了西方经济学的基本原理,全书共分12章,主要内容有导论,需求、供给与市场均衡,消费者行为理论,生产...

    ¥26.00
人邮微信
本地服务
人邮微信
教师服务
二维码
读者服务
读者服务
返回顶部
返回顶部