第三节 人口普查与抽样调查
一 人口普查
1.人口普查介绍
(1)人口普查的概念
人口普查是在统一的时间、按照同一的方法、根据统一的项目,对标准时点上的所有人口进行的全面调查与登记。人口普查是一个国家或地区在特定试点对所有居民进行的一次全面调查,是国家或地区全局性活动的重要部分,也是目前各国广泛采用的收集人口数据资料的方法。与前述的生命统计系统关注于人口的生命事件的登记从而使得其数据库成为动态并连续的数据库不同,人口普查数据是一个关于人口规模、结构和分布等的横截面的静态数据库。人口普查对一个国家或地区的社会经济发展起着重要作用。首先,人口普查为国家提供最全面、最权威、最准确的人口数据,是国家制定重要社会经济决策的重要依据;其次,人口普查为学者开展科学研究、分析人口发展特征及规律性提供重要信息,例如,婚姻家庭问题、老龄化问题、人口消费与市场问题等。人口普查是对所有人口进行的全面的调查与登记,因此,人口普查的对象是普查区域内的所有人口。1928年,民国北洋政府内政部颁布了《户口调查统计报告规则》并进行人口调查,但由于当时的政府几乎没有进行任何组织和技术上的准备,普查最终失败了。此后在1937年、1938年、1941年和1946年又多次提出了人口普查的计划,由于抗日战争、政权更替等原因都被迫搁置。
人口普查是在统一的时间、对标准时点的所有人口进行的调查与登记,采用标准时间登记的办法将人口从动态变为静态,得到人口数量特征的确切概念。1990年第四次人口普查之前,中国人口普查的标准时间为7月1日0时,因为这半个月工、农、学、商等类别人口流动量最小,而且处于年中,利于安排调查的系列工作(比如准备、培训、登记、统计与汇总等),但是几次普查后发现7月处于盛夏季节,高温、洪涝不利于普查工作的开展及资料的运送与保管,因此从2010年第六次人口普查开始将人口普查标准时点定为11月1日0时(水延凯、汪立华,2014:65)。中国2010年第六次人口普查的对象为“普查标准时点在中华人民共和国境内的自然人以及在中华人民共和国境外但未定居的中国公民,不包括在中华人民共和国境内短期停留的港澳台居民和外籍人员”(中华人民共和国国家统计局,2011)。根据登记口径不同,普查对象一般分为两类:一类是常住人口,即在一定时间和空间范围内经常居住的人,包括临时外出的人口,但不包括暂时居住的人口;另一类是现有人口,即在普查时点居住在普查小区的人,包括暂时外出的人,但是包括短暂居住的人口。当然,有的地方普查对象可能是三类,第三类是法定人口,在中国即指户籍人口(李永胜,2002)。
(2)人口普查的特点
与其他调查相比,人口普查具有诸多不可替代的重要特点,归纳如图2-2所示。
图2-2 人口普查的特点
第一,全面性:人口普查是在统一时间、对特定范围内的所有人进行的全面的调查与登记,要求对普查对象不重不漏的调查与登记,因而,人口普查数据具有全面性与完整性,可以为其他抽样调查提供依据。第二,定期性:人口普查不是单独的一次性调查,而是在统一的标准时点定期进行的。将各次人口普查的时点数据连续起来,就能在反映人口现象特征的同时,较好地反映人口的变动及发展。第三,同时性:人口普查是在统一的时间同时开展的,这可以避免数据重复或遗漏,而且保障数据的一致性,更有利于分析人口发展及变化。第四,基础性:人口普查覆盖面广,通常是对人口最基本、最主要的特征进行调查与登记,反映的是人口与社会发展的基本信息。
但是,人口普查也具有一些局限性。人口普查涉及范围广、调查单位多,因而人口普查相对较为耗时、耗力,而且成本也很高。同时,人口普查多是十年进行一次,因而数据的时效性不够强,不能有效并及时地反映人口动态变化。因此人口学家进行的很多政策研究还必须立足于自主的专项调查。
2.中国六次人口普查介绍
(1)第一次人口普查:1953年
中国在20世纪30年代曾有一次不完整的人口调查,从那时起,“四万万”这个数字就成为中国人口的代名词。这种状况一直持续到1949年。新中国成立后为摸清人口数,中国在1953年开展第一次人口普查。第一次人口普查与选民登记同时进行,它不仅标志着中国具有现代意义的人口普查的开始,更意味着人民第一次拥有了当家做主的权利。
第一次人口普查的标准时间为7月1日0时。调查内容相对简单,包括本户地址、姓名、性别、年龄、民族、与户主关系6项内容。调查结果显示,截至1953年7月1日0时的全国人口总数为601938035人。其中:直接调查登记的人口为574205940人;用其他办法调查的人口为27732095人。
(2)第二次人口普查:1964年
两次人口普查间隔的10年间,中国经历了1954年的特大洪水和三年困难时期,人口状况发生了很大变化,为了编制“三五”计划和长远规划,摸清人口底数特别是三年困难时期的人口变化状况,中共中央、国务院于1964年2月21日颁发《关于进行第二次人口普查工作的指示》。
第二次人口普查以1964年7月1日0时为人口调查标准时间,在第一次人口普查内容的基础上增加了本人成分、文化程度、职业3个调查项目。普查显示,1964年7月1日0时的全国人口总数为723070269人。
(3)第三次人口普查:1982年
第三次人口普查是改革开放后的第一次全国性普查工作,并且第一次使用电子计算机进行数据处理。第三次人口普查的标准时间为1982年7月1日0时,调查项目增加到19项,其中户的项目增加了户别、本户人数、1981年出生人数、1981年死亡人数、常住户口已外出一年以上人数5项;个人信息增加了常住人口的户口登记状况、行业、不在业人口状况、婚姻状况、生育子女数、1981年生育状况6项,去掉本人成分项。
(4)第四次人口普查:1990年
第四次人口普查以1990年7月1日0时为标准时间进行,登记的项目共21项,是历次人口普查调查项目最多的一次。与前三次人口普查采取的设立普查登记站的办法相比,这次人口普查主要采取普查员入户点查询问、当场填报的方式进行。
个人调查内容包括:姓名、与户主关系、性别、年龄、民族、户口状况和性质、1985年7月1日常住地状况、迁来本地的原因、文化程度、在业人口的行业、在业人口的职业、不在业人口状况、婚姻状况、妇女生育状况、存活子女数、1989年1月1日以来妇女的生育状况。
按户填报的项目有六项:本户编号、户别、本户人数、本户出生人数、本户死亡人数、本户户籍人口中离开本县(市)一年以上的人数。
(5)第五次人口普查:2000年
第五次中国人口普查在2000年举行,普查项目增加到49项,并首次采用光电录入技术,为中国经济社会进一步发展提供重要的人口依据。这次人口普查在中国普查史上添加了厚重的一笔,其主要的突破有如下几点。
第一,按人填报项目大增,增加了人口迁移内容,首次加进住房项目。满足市场经济条件下社会各界对普查需求的增长,这次人口普查,增加了一些普查项目,拓展了普查内容。比如,人口普查分为按户填报的项目和按人填报的项目,其中按人填报的有26项,按户填报的有23项,共计49项,比上一次人口普查增加了28项。按人填报的项目,增加了人口迁移的内容,比如出生地、何时从何地来本乡镇街道等,这里“何时从何地来本乡镇街道”不是指户口的迁移,而是人们实际居住地的变化,主要反映中国改革开放以来人口流动量增大的实际情况;增加了人口的经济活动的内容,比如上周是否在工作、未工作者的生活来源等,主要反映人们的就业和社会抚养状况。按户填报的项目,主要增加了住房的内容。由于人们的生活离不开住房,房屋相对于人而言也比较稳定,因此,要查准人的数量,应首先查准住房,然后再将每一所房屋居住的人查清楚。所以,在人口普查中了解人们的住房情况是顺理成章的,也是行之有效的,世界各国普遍采取了这种做法。
第二,本次人口普查设计了两种普查表,短表所有人都填报,长表一部分人填报。所谓短表、长表,是在人口普查中设计两种普查表,一种普查项目较少,由所有的人填报,这种表称作短表,也叫普查;另一种普查项目较多,由一部分人填报,这种表称作长表,也可以称为抽样调查。其实,短表长表技术就是在普查中结合抽样调查的一种技术。世界各国的人口普查大都采用这一做法。这次人口普查按国家规定的抽样方法,抽选出10%的户填报长表,其他90%的户填报短表。填报短表、长表的户一经被抽中,不能随意调换或增减,否则将影响长表资料的代表性,使人口普查的准确性出现偏差。这次设计的长表,前一部分包含了短表的内容,填报长表的户只需回答所有的问题,不必再另填一张短表。短表按人填报的普查项目有9项,按户填报的10项;长表按人填报的26项,按户填报的23项。
第三,常住人口的时间标准和空间标准不同了,首次增加了附表——《暂住人口调查表》。过去进行的四次人口普查,都是按常住人口的原则进行登记,常住人口的时间标准为一年,空间标准为县市。这次常住人口的时间标准缩短为半年,空间标准缩小到乡镇街道。即只要一个人在某个乡镇街道居住了半年以上,普查时就是该乡镇街道的常住人口,就必须在该乡镇街道进行登记。
第四,普查的标准时间定在11月1日。人口普查必须有一个标准时间,作为登记每个人以及人口各种特征的统一时点。由于人口的数量在不断地随时间变化,比如出生、死亡、迁出、迁入等,人口的各种特征也在变化,比如年龄、受教育程度、婚姻状况、就业情况等。如果没有统一的普查标准时间,人口数就有可能重登或漏登,各种特征的分布也不会准确。以往中国进行的四次人口普查都是以7月1日0时为普查登记的标准时间,即普查反映的是7月1日0时人口状况。这次人口普查改为11月1日0时。
(6)第六次人口普查:2010年
第六次人口普查的时间与第五次人口普查时点一致,为2010年11月1日0时。人口普查对象为普查标准时点在中华人民共和国境内的自然人以及在中华人民共和国境外但未定居的中国公民,不包括在中华人民共和国境内短期停留的境外人员。本次普查登记原则有以下几点。①人口普查采用按现住地登记的原则。每个人必须在现住地进行登记。普查对象不在户口登记地居住的,户口登记地要登记相应信息。②人口普查以户为单位进行登记,户分为家庭户和集体户。以家庭成员关系为主、居住一处共同生活的人口,作为一个家庭户,单身居住独自生活的也作为一个家庭户;相互之间没有家庭成员关系、集体居住共同生活的人口,作为集体户。
第六次人口普查个人信息包含出生、民族、户口、迁移、教育、工作、养老、健康等28项内容(短表12项内容)。第六次人口普查表分为《普查表短表》、《普查表长表》、《死亡人口调查表》和《境外人员普查表》四类。与第五次人口普查相比,第六次人口普查增加了《境外人员普查表》登记,同时减少了《暂住人口登记表》登记。第六次人口普查内容也有较大变化。短表和长表中增加“普查时点居住地”;对于流动时间的询问从第五次人口普查的“何时来本乡镇居住”改为“离开户口登记地时间”,从而得到第一次流动的信息;在长表中增加对老年人“身体健康状况”的询问,这为掌握老年人口现状、制定老年政策等提供重要的数据依据,尤其是在老龄化程度日益严重的今天显得尤为重要。
第六次人口普查采用“见人就登”的方式,按照“现住地”和“户籍地”原则进行登记,这是首次采用“现住地”登记原则。每个人必须在现住地进行登记,普查对象不在户口登记地居住的,户口登记地要登记相应信息(国家统计局、国务院第六次全国人口普查领导小组办公室,2010)。这样,流动人口在流入地和流出地均需要登记。同时,港澳台及外籍人员登记《境外人员普查表》。
最后,关于中国六次人口普查的更多信息,可以参见国家统计局网站的专门网页或者是中国网:http://www.china.com.cn/renkou/6thrkpc/node_70_98772.htm。
3.美国的人口普查介绍
(1)美国人口普查历史
1790年,美国第一次人口普查由特警骑马入户进行访问,所统计的人口总数为390万,之后每隔10年(在尾数为0的年份)进行一次人口普查;1880年,专业统计员取代美国特警成为人口普查员;1940年,美国人口普查局首次使用人口普查长表实施统计抽样调查;1950年,首次使用电子计算机汇总普查结果;1960年,随着人口快速增长、多元化及流动性增强,普查表格第一次通过邮寄方式分发到城市地区的家庭(在此之前是以入户访问的形式完成的),数据采集自动化进程引入光学标记识别设备;1990年,人口普查引入地理信息系统,美国人口普查局开发电子数据收集方法,包括电脑辅助个人访问和电脑辅助电话访问作为邮寄调查的补充,帮助降低成本;2000年,人口普查局雇用86万名临时工进行普查,雇用一家私人公司进行全国性宣传运动,以扭转自1970年以来邮件答复率持续下降的趋势。截至2000年,人口普查数据显示美国人口总数已超过2.18亿。
(2)美国人口普查的目的和重要性
人口普查主要目的是统计美国的人口总数,此外还有其他重要用途:决定着联邦和州政府如何分摊3000亿美元的年度资金;用于分配美国各州议会代表席位;用于分配学校经费、就业服务、公路补助、住房建设、医疗服务、养老计划等方面的联邦资金;银行、保险公司、卫生保健机构以及零售业等企业都需要普查数据;几乎所有的商业机构都需要目标销售地区的消费者信息;让美国的领导者了解到国民概况和需求。
(3)普查对象
人口普查的对象包括全美50个州所有居民,不管是什么身份、什么族裔、什么年龄或什么信仰,只要住在美国境内,都是普查的对象。
(4)普查内容
在过去的人口普查中,所有家庭都收到短表的调查问卷,1/6的家庭会收到长表的调查问卷。在2010年的人口普查中,问卷已经采用短表形式,而长表被美国社区调查问卷取代,这样极大简化了调查的操作程序,使2010年人口普查以统计人口为重点。
在2010年的普查问卷中,每户家庭只需填写7个问题的短表,包括姓名、年龄、性别、族裔、与户主的关系、住所是否租赁等。人口普查局对统计资料绝对保密,相关信息要保存72年才能解密,其他信息则通过美国社区调查收集。美国社区调查(American Community Survey, ACS)是从2003年开始美国人口普查局为收集社区信息新开发的调查,提供人口超过65000人以上的州、城市、郡等地区重要的经济、社会、人口以及家庭信息,包括:①社会特征,婚姻状况、生育情况、照顾祖父母情况、出生地点、入学时间、家里所用语言、所受教育、1年前居住地、兵役情况;②经济特点,收入、食品福利、劳动状况、行业职业和工作分类、工作地点、1年前工作的公司、使用车辆情况、医疗保险;③房屋特点,建筑物楼龄、房屋内的单元、居住在该房屋的时间、屋内(客厅、卧室、卫浴、厨房)设施、房屋取暖、所用电话服务、房屋价值、租住成本、按揭月供情况。关于美国人口普查及美国社区调查ACS的更多内容可以参见美国人口调查局官方网站:www.census.gov。
二 人口抽样调查
1.人口抽样调查介绍
(1)人口抽样调查的概念
人口普查耗时耗力,每十年举行一次,缺乏时效性,而且只能获取基本信息。人口抽样调查是按照某种原则从总体中抽取一部分个体作为样本进行调查,并根据样本调查结果对总人口的相应参数进行估计与推断的一种调查方法。1987年的《统计法实施细则》规定在两次人口普查中间年份进行一次1%人口抽样调查,即中国在尾数为“0”的年份进行人口普查,在尾数为“5”的年份进行1%人口抽样调查,也称为“人口小普查”。此外,政府机构、高校、科研机构也经常针对某些专题进行人口抽样调查。例如,生殖健康调查、生育调查、迁移流动调查、老年人口状况调查等。
人口抽样调查可以分为不同的类别。根据调查涉及主题多少,可以分为单主题调查与多个主题调查;根据是否重复调查,可以分为一次性调查与连续性调查;根据调查是否分期开展,可以分为单阶段调查、多阶段调查及固定样本调查。然而,人口抽样调查的划分方式并不是不可融合的,例如一次性调查可以是单主题调查也可以是多主题调查。
(2)人口抽样调查的特点
经济性:人口抽样调查涉及的调查单位相对较少,调查登记及相关的资料录入与整理的工作量少,可以大大缩减调查费用及调查人员的人力、物力;时效性:人口抽样调查涉及范围小,费用低,相应调查时间也会缩短,可以迅速、及时地获取所需信息,也可以较频繁地开展,收集具有时效性的信息;准确性:一般来说,调查时涉及范围越大,抽样误差也就越大,而人口抽样调查涉及范围小,工作人员少,工作中误差相对就减小,准确性高;适用性:人口抽样调查可以适用于多个领域的调查,例如生育状况调查、迁移流动调查、婚姻调查等,而且相比人口普查,人口抽样调查涉及的问题可以更为深入。此外,人口抽样调查还可以作为人口普查质量检查的一种方式,人口普查事后质量抽查就是一种人口抽查方式。
2.人口抽样调查的特殊方法
抽样调查中常用的简单随机抽样、系统抽样、分层抽样、整群抽样都是人口抽样调查中常用的组织方式。有时候是将各种方法相结合运用,以实现复杂的需要及简化调查。例如,在分层抽样中,确定好层级后,一般采用简单随机抽样或系统抽样的方式在每层中进行抽取子样本。与一般抽样调查相比,人口抽样调查经常采用一些特殊的方法进行,这样可以获得更详细的数据资料。
(1)普查中的长短表结合方法
在人口普查中采用长表短表相结合的方式也在人口抽样调查中成为一种特殊方法。2000年第五次人口普查开始采用长短表结合的方式,短表对所有人口进行基本状况调查,而长表则抽取10%的户填报,进行更深入、更详细的调查,例如职业状况、育龄妇女的生育状况、老年人口健康状况、人口迁移流动状况等。之后的人口抽样调查中也开始使用了这种方法。
(2)回顾性调查方法
回顾性调查也是人口抽样调查中常用的一种方式。通过回顾性调查,可以更深入地了解分析人口事件的发生历史、动态变化趋势以及变动特征等,并且可以依据人口的特征及变动对未来的人口发展做出相应的判断。
(3)追踪调查方法
追踪调查是严格地对同一个样本进行连续性的调查,它是人口抽样调查中较为特殊的一种方法。追踪调查可以避免记忆误差及对参考时期的误解,同时可以减少错报、漏报(尤其是死亡与迁出的漏报),而且分子、分母完全一致,不惜借助人口模型分析人口特征的水平及结构。但是,追踪调查需要足够大的规模,以保证有足够的出生、死亡人口数。而且,追踪调查涉及时间长,一般不低于两年时间。在追踪调查的最后一次调查中可以增加一个回顾性调查,与前几次调查结果进行比较,核实调查结果。
3.主要人口抽样调查介绍
在人口普查的时间间隔中,国家统计局会举行一次1%人口抽样调查,第一次是1987年,随后1995年、2005年各有举办一次,即尾数为5的年份举行1%人口抽样调查。国家统计局网站在2014年7月7日发布了《国务院办公厅关于开展2015年全国1%人口抽样调查的通知》,决定于2015年开展全国1%人口抽样调查以了解2010年以来中国人口在数量、素质、结构、分布以及居住等方面的变化情况,为制定国民经济和社会发展规划提供科学准确的统计信息支持。这次调查在中国境内抽取约6万个小区,调查对象为小区内的全部人口(不包括港澳台居民和外国人),共约1400万人。调查内容为人口和住户的基本情况,主要包括姓名、性别、年龄、民族、受教育程度、行业、职业、迁移流动、社会保障、婚姻、生育、死亡、住房情况等。调查时点为2015年11月1日0时。此外,在不举行人口普查和人口抽样调查的年份,国家统计局每年进行一次1‰人口抽样调查。国家人口和计划生育委员会(现国家卫生和计划生育委员会)举办的生育抽样调查、流动人口调查也是人口研究中重要的数据来源。
三 人口普查资料的常见分析视角与内容
1.分析视角
在社会科学领域最为关注的因果分析的视角下,利用普查资料可进行的分析包括:人口变量对人口变量的影响;人口变量对其他变量的影响;其他变量对人口变量的影响(例如不同经济发展水平对生育水平的影响)。
在横向比较的视角下,我们可以使用特定年份的普查或者1%人口抽样调查的数据资料进行分析:比如,同一内容、同一时点、不同区域/类别的比较。相比之下,纵向比较的视角下,我们可以利用多次普查或者1%人口抽样调查的数据资料进行分析:同一内容、不同时点、同一区域/类别的比较。
2.分析内容
这也正是人口学研究,尤其是正规人口学研究的主要分析内容,常见的研究与分析内容包括以下几个部分。
人口规模与分布:城镇与农村规模与分布、东中西区域规模与分布、各省市人口规模与分布、各民族人口规模与分布等。比如利用2000年人口普查抽样数据,对中国留守儿童的规模、结构、分布、家庭类型和受教育状况等基本情况进行了研究(段成荣、周福林,2005)。
人口结构:自然结构,如性别、年龄结构;社会结构,如受教育水平、职业与行业。比如根据第四次人口普查数据及有关数据,对中国不同人口变量、社会经济以及民族特征妇女的出生婴儿性别比做了具体分析(高凌,1995),或是据全国第五次人口普查资料,研究中国空巢老人年龄、性别、户口、婚姻及地区构成,探索空巢老人家庭产生的问题和形成的原因,提出空巢老人家庭生活照料对策和建议(黄润龙,2005)。
婚育分析:婚姻状况、生育水平。比如利用第四次人口普查资料,对北京、上海市的独生子女率及其对未来婚姻结构的影响进行分析(刘鸿雁、柳玉芝,1996)。
死亡分析:死亡水平及死亡模式。比如利用1982~2000年人口普查和抽样调查死亡数据及1989年、1995年和2000年卫生登记死亡数据,用人口因素分解方法研究了中国20世纪80年代初以来死亡水平性别差异的变化趋势、年龄别死亡率性别差异对男女出生期望寿命差异的影响及其发展趋势,比较了各种年龄—死因别死亡率的性别差异对出生期望寿命性别差异的影响(任强、郑晓瑛、曹桂英,2005)。
人口流动分析:人口流动规模、特征及模式。比如通过深入挖掘1982年以来历次全国人口普查和1%人口抽样调查数据资料,总结得出了改革开放30年来中国流动人口变动的九大趋势:流动人口的普遍化、流动原因的经济化、流动时间的长期化、流入地分布的沿海集中化、年龄结构的成年化、性别构成的均衡化、女性人口流动的自主化、流动方式的家庭化和学业构成的“知识化”(段成荣等,2008)。
人口寿命与健康:健康状况是第六次人口普查新增加的内容,因此我国学者可以借用以后相关的普查或者1%人口抽样调查的数据资料进行人口寿命与健康方面的分析。
住房状况:第五次人口普查和第六次人口普查的内容。比如根据中国2000年人口普查资料建立住房状况的综合评价体系,对中国农村家庭住房状况的省际差异进行研究(易成栋,2007)。通过对中国第五次人口普查数据中的城市住户的分析,可以了解不同职业阶层在住房产权、房屋面积和房屋质量等方面的情况(边燕杰、刘勇利,2005)。学者也利用人口普查数据对人口结构转变和中国住房需求的关系进行实证研究,经验观察表明,“婴儿潮”很可能是2004年以来中国住房价格快速上涨的重要原因,基于微观家户数据的实证研究发现,中国居民住房需求与年龄高度相关:个人在20岁以后住房需求快速上升,50岁以后开始逐步下降(陈斌开、徐帆、谭力,2012)。