2012年中山大学432统计学[专业硕士]考研真题及详解
一、单项选择题(20小题,每小题3分,共60分,在每小题给出的4个选择项中,只有一个符合题目要求,请将所选正确答案对英的字母写在答题纸上并标明题号)
1设两事件A与B独立,其概率分别为0.5与0.6,则P(A+B)=( )。
A.0.6
B.0.7
C.0.8
D.0.9
【答案】C
【解析】两事件A与B独立,故P(AB)=P(A)P(B)=0.5×0.6=0.3,P(A+B)=P(A)+P(B)-P(AB)=0.5+0.6-0.3=0.8。
2设事件C发生时事件D发生的条件概率P(D|C)=0.4,若P(C)=0.5,P(D)=0.4,则P(C|D)=( )。
A.0.4
B.0.5
C.0.6
D.0.7
【答案】B
【解析】P(C|D)=P(CD)/P(D)=P(C)P(D|C)/P(D)=0.5×0.4/0.4=0.5。
3设A,B,C都是事件,通过事件运算得到A,B,C,,,中某些事件的交及并的表达式,++表示( )。
A.事件A,B,C中至少有一个发生
B.事件A,B,C中至少有两个发生
C.事件A,B,C中至少有一个不发生
D.事件A,B,C中至少有两个不发生
【答案】C
【解析】事件A,B,C中至少有一个发生的表达式为:A+B+C;事件A,B,C中至少有两个发生的表达式为:AB+BC+AC;事件A,B,C中至少有两个不发生的表达式为:C+B+A+;事件A,B,C中至少有一个不发生的表达式为:++。也可以简单理解:++=即“三个都发生的对立”是“至少有一个不发生”。
4同时投掷2个骰子,以A表示事件“掷出的2个面的点数之和是6”,以B表示事件“掷出的2个面的点数之和是7”,则( )。
A.事件A,B独立
B.事件A,B概率相等
C.P(A)>P(B)
D.P(A)<P(B)
【答案】D
【解析】若事件A发生,则2个骰子的可能情况为(1,5)、(5,1),(4,2)、(2,4)、(3,3),因此事件A发生的概率为5/36;若事件B发生,则两个骰子的可能情况为(1,6)、(6,1)、(2,5)、(5,2)、(3,4)、(4,3),因此事件B发生的概率为6/36。AB同时发生的概率为0。
5设随机变量X与Y的相关系数为0.5,期望分别为2与3,标准差分别为1与2;则随机变量XY的期望为( )。
A.6
B.7
C.8
D.9
【答案】B
【解析】
代入数据得
解得E(XY)=7。
6设随机变量X与Y的相关系数为0.5,若两者的方差分别为16与9,则随机变量X+Y与X-Y的协方差为( )。
A.6
B.7
C.8
D.9
【答案】B
【解析】Cov(X+Y,X-Y)=Cov(X,X)-Cov(X,Y)+Cov(Y,X)-Cov(Y,Y)=Cov(X,X)-Cov(Y,Y)=Var(X)-Var(Y)=16-9=7。
7两个口袋中各有外观一致的球3个,分别标记号码-1,0,1;从这两个口袋中随机地各摸出一个球,摸出的两个球的号码分别记作X与Y,则随机变量X与随机变量函数XY的( )。
A.分布不同
B.期望不同
C.方差相同
D.中位数不同
【答案】A
【解析】随机变量X的分布为:
随机变量XY的分布为:
由此可知,两个随机变量的分布、方差不相同,但期望和中位数相同。
8设X1,X2,…,Xn,是随机样本,则哪个统计量能较好地反映样本值的分散程度( )。
A.样本平均
B.样本中位数
C.样本方差
D.样本的四分之一分位数
【答案】C
【解析】集中趋势是指一组数据向某一中心值靠拢的程度,反映了一组数据中心点的位置所在。反映数据集中趋势的统计量有平均数、中位数、众数和四分位数;离散程度反映的是各变量值远离其中心值的程度,反映数据离散程度的统计量有异众比率、方差、标准差和四分位差等。
9假设检验中,若零假设为简单假设,则显著性水平是指( )。
A.犯第一类错误的概率
B.犯第二类错误的概率
C.置信水平
D.P-值
【答案】A
【解析】假设检验遵循的原则是:在严格控制犯第一类错误概率的条件下,尽量控制犯第二类错误的概率。为了突出这个原则,把犯第一类错误的概率又称作为显著性水平。
10给定样本之后,降低置信水平会使得置信区间的宽度( )。
A.增加
B.减少
C.不变
D.可能增加也可能减少
【答案】B
【解析】在样本量相同的情况下,置信水平越高,置信区间越宽。从直觉上说,区间比较宽时,才会使这一区间有更大的可能性包含参数的真值。
11以回归方程Y=a+bX作相关分析与回归分析,关于样本相关系数r与回归系数b,下列各论断中哪一个更合理?( )
A.r>0时b<0
B.r>0时b>0
C.r=1时b=0
D.r=1时b=1
【答案】B
【解析】r>0说明y与x呈正线性相关关系,b表示的是直线的斜率,所以b>0。当|r|=1时,y的取值完全依赖于x,两者之间即为函数关系,此时b的取值不确定。
12在回归变量Y关于预测变量X的简单线性回归中,以x为横坐标y为纵坐标绘制散点图;那么,最小二乘法确定回归直线满足以下哪一条?( )
A.各点到该直线的距离之和最小
B.各点到该直线的距离的平方和最小
C.各点到该直线的纵向距离之和最小
D.各点到该直线的纵向距离的平方和最小
【答案】D
【解析】最小二乘法也称为最小平方法,它是用最小化垂直方向的离差平方和来估计参数的方法,故选D项。
13以下哪一种情形涉及定性数据的收集?( )
A.质量控制工程师测量电灯灯泡的寿命
B.社会学家通过抽样调查来估计广州市市民的平均年收入
C.运动器材厂家在区分各大俱乐部棒球选手是左撇子还是右撇子时作的调查
D.婚礼策划公司通过抽样调查来估计上海市市民举办婚礼的平均开销
【答案】C
【解析】定性数据包括分类数据和顺序数据,是一组表示事物性质、规定事物类别的文字表述型数据,不能将其量化,只能将其定性,因而也可称为品质数据;数值型数据是直接使用自然数或度量衡单位进行计量的具体的数值。因此也可称为定量数据或数量数据。
14关于方差分析,以下说法哪一项更合理?( )
A.方差分析的目的是分析各组总体方差是否有显著差异
B.方差分析的目的是分析各组总体标准差是否有显著差异
C.方差分析的目的是分析各组总体均值是否有显著差异
D.方差分析的目的是分析各组总体中位数是否有显著差异
【答案】C
【解析】表面上看,方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是变量之间的关系。方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
15考虑总体均值的95.44%置信区间,已知总体服从正态分布且标准差为10;要使得到的置信区间的半径不超过1,需要的最小样本容量为( )。
A.100
B.400
C.900
D.1600
【答案】B
【解析】
解得n≥400。
16以下哪一项不是估计量的优良性标准?( )
A.无偏性
B.充分性
C.有效性
D.相合性
【答案】B
【解析】无偏性是指估计量抽样分布的数学期望等于被估计的总体参数;有效性是指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效;一致性,又称为相合性,是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
17关于随机变量序列依分布收敛、依概率收敛与以概率1收敛,以下论断中哪一项成立?( )
A.“依分布收敛”蕴含“依概率收敛”
B.“依分布收敛”蕴含“以概率1收敛”
C.“依概率收敛”蕴含“依分布收敛”
D.“以概率1收敛”蕴含“依概率收敛”
【答案】A
【解析】“以概率1收敛”可以理解为随机变量序列在任意样本点几乎处处收敛,“几乎处处收敛”能够推出“依概率收敛”,反正则不成立。如果一个随机变量序列依概率收敛到某一个随机变量,则它也一定依分布收敛到这个随机变量,反过来则不然;只有当一个随机变量序列依分布收敛到一个常数的时候,才能够推出它们也依概率收敛到这个常数。
18以下关于估计量的论断中,哪一项成立?( )
A.极大似然估计量一定是无偏估计量
B.极大似然估计量一定是相合估计量
C.有效估计量一定是最小方差无偏估计量
D.相合估计量一定是最小方差无偏估计量
【答案】B
【解析】极大似然估计量是相合估计量,这是极大似然估计的优越性之一。最小方差无偏估计一定是有效估计量,但有效估计量不一定是最小方差无偏估计量。
19单因素方差分析中,以下哪种情形宜考虑非参数Kruskal-Wallis检验?( )
A.各组总体方差不等
B.各组样本容量不等
C.各组总体服从正态分布
D.各组总体不服从正态分布
【答案】D
【解析】Kruskal-Wallis检验是以确定k组样本是否来自同一总体为检验目的的检验,其基本思想是:首先,将多组样本数据混合并按升序排序,求出各变量值的秩;然后,考察各组秩的均值是否存在显著差异。容易理解:如果各组秩的均值不存在显著差异,则是多组数据充分混合、数值相差不大的结果,可以认为多个总体的分布无显著差异;反之,如果各组秩的均值存在显著差异,则是多组数据无法混合、某些组的数值普遍偏大、另一些组的数值普遍偏小的结果,可以认为多个总体的分布有显著差异。
20对于100名学生某一门课程的成绩,若想得到四分之一分位数、中位数与四分之三分位数,以下哪种描述统计的办法更有效?( )
A.直方图
B.茎叶图
C.饼图
D.点图
【答案】B
【解析】直方图、饼图描述的数值型数据是分组数据,而茎叶图描述的是未分组的数值型数据,点图描述的是两个变量之间的关系。茎叶图描述了极小值、四分之一分位数、中位数与四分之三分位数、极大值。
二、计算和证明题(本题包括1~5题共5个小题,前两题每题各15分,后三题每题各20分,共90分)
1一项研究是调查市场专业人员的公司伦理价值观念。数据列表见下(高分值表明伦理价值观念程度高)。在显著性水平α=0.01下,对上述数据进行单因素方差分析,请把下面未完成的ANOVA表补充完整,并完成方差分析,说出检验的结论。
解:
从方差分析表可以看到,由于F=7>F0.01(2,15)=6.3589,所以拒绝原假设H0,表明不同专业组之间的差异是显著的,即专业对市场专业人员的公司伦理价值观念有影响。
2已知某种病菌在全人口的带菌率为10%。在检测时,带菌者呈阳性和阴性反应的概率分别为95%和5%,而不带菌者呈阳性和阴性反应的概率分别为20%和80%。
1)随机地抽出一个人进行检测,求结果为阳性的概率;
2)已知某人检测的结果为阳性,求这个人是带菌者的条件概率。
解:设事件A1、A2分别代表“一个人带菌”,“一个人不带菌”,事件B1、B2分别代表“检测结果为阳性”,“检测结果为阴性”。
(1)根据全概率公式得P(B1)=P(A1B1)+P(A2B1)=P(A1)P(B1|A1)+P(A2)P(B1|A2)=10%×95%+90%×20%=27.5%,即随机地抽出一个人进行检测,结果为阳性的概率为27.5%。
(2)根据条件概率公式
P(A1|B1)=P(A1B1)/P(B1)=P(A1)P(B1|A1)/P(B1)=10%×95%/27.5%=34.5%,即已知某人检测结果为阳性,这个人是带菌者的条件概率是34.5%。
3炼铝厂测得所产铸模用的硬度X与抗张强度Y数据如下:
1)求Y关于X的回归方程;
2)检验所得回归直线的显著性(α=0.05);
3)预报当铝的硬度X0=65时的抗张强度Y。
解:根据表格中的数据计算可知,
=67.5
=315
(1)设估计的回归方程为=0+1x,则根据最小二乘法解得的位置参数的计算公式可得:
0=-1=188.978
所以Y关于X的回归方程为:=188.978+1.867x。
(2)
MSR=SSR/1=3822/1=3822
MSE=SSE/(n-2)=4048/(10-2)=506
线性关系的显著性检验:
假设:H0:β1=0;H1:β1≠0
计算统计量F=MSR/MSE=3822/506≈7.553
查表得,Fα=0.05(1,8)=5.318
由于F>Fα,所以拒绝H0,表明抗张强度Y和硬度X之间的线性关系是显著的。
回归系数的显著性检验:
假设:H0:β1=0;H1:β1≠0
计算统计量
查表得tα/2(8)=2.306。由于t>tα/2,拒绝原假设H0,表明硬度X是影响抗张强度Y的一个显著性因素。
(3)根据估计出的回归方程,当铝的硬度x0=65时,预测的抗张强度为:0=188.978+1.867×65=310.333。
4某卷烟厂向化验室送去A和B两种烟草,化验尼古丁的含量是否相同,从A和B中各随机抽取重量相同的五例进行化验,测得尼古丁的含量(mg)为
据经验知,尼古丁含量服从正态分布。
1)若已知A,B两种烟草尼古丁含量的方差分别为5和8,问两种烟草的尼古丁含量是否有差别(α=0.05)?
2)若未知两种烟草尼古丁含量的方差,问两种烟草的尼古丁含量是否有差别(α=0.05)?
解:A种烟草的均值:
A种烟草的样本方差:
B种烟草的均值:
B种烟草的样本方差:
(1)假设:H0:μ1=μ2 v.s. H1:μ1≠μ2。
计算统计量:
当α=0.05时,zα/2=1.96。因为|z|>zα/2所以拒绝原假设H0,即认为有证据表明两种烟草的尼古丁含量有差别。
(2)H0:μ1=μ2 v.s. H1:μ1≠μ2。
计算统计量:
当α=0.05时,tα(f)=1.895,因为|t|>|tα|所以拒绝原假设H0,即认为有证据表明两种烟草的尼古丁含量有差别。
5设总体ξ的密度函数为:
ξ1,…,ξn为其子样。
1)求参数θ的极大似然估计量。
2)证明子样平均及都是θ的无偏估计量,问哪个较有效?
解:(1)求解未知参数θ的极大似然估计量,可按如下步骤进行:
①写出似然函数。
②由总体ξ的密度函数的表达式可知,当θ-1/2≤ξi≤θ+1/2时,L(θ)取到最大值1,解得:
取该区间的中点可得参数θ的一个极大似然估计量为:
(2)
设ξ1,…,ξn的次序统计量为ξ(1),ξ(2),…ξ(n),又设ε(k)=ξ(k)+1/2-θ,那么ε(k)~U(0,1),ε(1)和ε(n)的联合密度函数为:
f(x,y)=n(n-1)(y-x)n-2I{0<x<y<1}
令Z=ε(n)+ε(1),那么Z的分布函数为:
所以Z的密度函数为:
进而得
所以,子样平均及都是θ的无偏估计量。
Var(ξ)=E(ξ2)-[E(ξ)]2=θ2+1/12-θ2=1/12
Var()=(1/n)Var(ξ)=1/(12n)
又
所以Var(Z)=E(Z2)-[E(Z)]2=2/(n+1)-2/(n+2)
当n>2,有2(n+1)(n+2)-12n=2(n-1)(n-2)>0,所以
说明更有效。
当n=1或者n=2时,二者相等,即两个估计量的效果相当。