【考纲要求】
1.基本概念与基本步骤:①统计学几个基本概念;②统计工作的基本步骤。
2.数值变量数据的统计描述:①集中趋势指标;②离散趋势指标;③正态分布的特点、面积分布规律。
3.数值变量数据的统计推断:①均数的抽样误差;②总体均数可信区间及其估计方法;③假设检验的基本步骤;④u检验和t检验;⑤假设检验的两类错误及注意事项。
4.分类变量资料的统计描述:①相对数常用指标及其意义;②相对数应用注意事项。
5.分类变量资料的统计推断:①率的抽样误差、总体率的可信区间及其估计方法;②u检验和χ2X检验。
6.直线相关和回归:①直线相关分析的用途,相关系数及其意义;②直线回归分析的作用,回归系数及其意义。
7.统计表和统计图:①统计表的基本结构和要求;②统计图的选择,制图通则。
【考点纵览】
1.总体、样本、抽样误差、计量资料、计数资料、概率。
2.样本必须能代表总体,为此要满足两个条件:抽样的随机化和具有足够的样本含量。
3.抽样误差是个体变异造成的,故在抽样研究中抽样误差是不可避免的。
4.统计工作由4个步骤组成:设计、搜索资料、整理资料、分析资料,其中以设计最为重要。因为它的错误无法用以后的步骤加以改变。
5.数值变量频数表能揭示数值变量的分布特征:集中趋势和离散趋势;揭示其频数分布类型,对称分布和偏态分布。描述计量资料集中趋势指标有:①均数:应用于正态分布资料;②几何均数:等比级数资料;③中位数:偏态分布资料,资料一端或两端无确切界限时尤其适用。
6.描述数值变量资料离散趋势的指标。全距和四分位数间距适用于偏态分布资料,对于一端或两端无确切界限时只能用四分位数间距。方差、标准差和变异系数都适用于正态分布资料。对于所比较两组资料单位不同或均数相差悬殊时,应用变异系数。描述离散趋势最常用的指标是标准差。
7.正态分布的特征及曲线下的面积分布规律。对称均数的两侧面积相等。
8.医学参考值范围的各种计算方法,特别注意各种方法适用场合及单、双侧问题。医学所用参考值是95%。
9.标准误的定义意义及与标准差和样本含量的关系。标准误是描述抽样误差大小的指标,标准误大。说明抽样误差大;利用标准误可进行总体均数可信区间估计和假设检验。
10.标准误是描述变量值变异程度大小的。可用来计算标准误、变异系数和医学参考值范围。二者关系:增加样本例数可减少抽样误差。
11.t分布的特征,与标准正态分布--u分布的关系。t分布和u分布都是以0为中心左右两侧完全对称的分布,只是t分布曲线顶端较u分布曲线略低,两尾端上翘。
12.总体均数估计方法,特别是区间估计的计算方法及两要素的关系。总体均数可信区间就是以一定的概率水准估计总体均数所在范围。小样本采用t分布原理,大样本采用。分布原理进行估计。增加样本例数可减少抽样误差,使估计的区间更可靠。
13.假设检验的基本步骤及每一步骤的注意事项。H0和H1假设都是对总体特征的检验假设。H0总是假设样本差别来自抽样误差,H1是来自非抽样误差,有单双侧之分。选择和计算检验统计量要注意资料类型和实验设计类型及样本量的问题,一般计量资料用t检验和检验;计数资料用χ2检验和u检验。
14.各种假设检验方法的适用条件及假设的特点、计算公式、自由度确定以及确定概率P值并做出推断结论。
15.Ⅰ和Ⅱ类错误及两者的关系。拒绝正确的H0称Ⅰ型错误,用α表示;接受错误的H0称Ⅱ型错误。用β表示。α愈大β愈小;反之α愈小β愈大。
16.描述计数资料的常用相对数的意义及应用时的注意事项。率是说明某现象发生强度的。构成比描述事物中各部分所占比重。相对比指两对比指标的对比水平。应用相对数时注意观察例数不能过少,不能犯以比代率的错误。率的比较要注意可比性问题,特别是混杂因素问题。消除混杂因素的影响可采用标准化方法或分层分析方法。
17.描述率的抽样误差大小的指标及计算。率的分布近似正态分布的条件:nπ和n(1-π)均大于5,或nP和n(1-P)均大于5。两个率的比较采用u检验,亦可采用χ2检验,两者关系为u2=χ2。
18.四格表资料基本数据的构成,一定是相互对立的两组数据。四格表资料自由度永远为1。四格表资料χ2检验的各种公式用适用条件,n>40且每个格子T>5,可用基本公式或专用公式,不用校正。若n>40,但出现只要有一个格子1<T<5的情况,需校正。若n<40或T<1,用确切概率法。配对设计四格表资料的结构特点及χ2,检验公式。
19.多个率比较,若χ2>χ2a,v,P<α结论拒绝H0时,只能说明总体率之间没有差别。但不能认为它们彼此之间都有差别。
20.相关系数及回归系数的统计学意义,确定回归方程的原理。相关系数r,描述两随机变量是否具有直乡鞋关系及关系的方向和密切程度。回归系数b,描述变量X每增加一个单位,Y平均改变b个单位。确定直线回归方程的原理是最小二乘法,即保证各实测点至回归直线的纵向距离平方和最小。
21.编制统计表的要求和如何正确选择统计图。
试题点评:本单元是整个预防医学部分的重点和难点,每年均出3~4题。
【历年考题点津】
1.正态分布的数值变量资料,描述离散趋势的指标最好选用
A.全距
B.百分位数
C.方差
D.标准差
E.变异系数
答案:D
2.若不知总体标准差,反映均数抽样误差大小的指标,用
A.S
B.Sx
C.SP
D.σP
E.σx
答案:B
3.正态分布的数值变量,两组资料的比较,检验统计量的计算用
A.(x-μ)/σ
B.(x-μ)/σx
C.(x-μ)/sx
D.(d-μ)/Sd
E.(x1-x2-μ)/Sx1-x2
答案:E
4.两个正态双变量资料,自变量记为X,真因变量记为Y,真进行回归分析,回归系数为0.2,经统计学检验,P=0.05,则
A. X增大一个单位,r增大0.2个单位
B. X增大一个单位,r减少0.05个单位
C. X增大一个单位,r增大0.05个单位
D. X增大一个单位,r减少0.2个单位
E. X增大一个单位,r减少或增大0.2个单位都有可能
5.从一个呈正态分布的总体中随机抽样,X≠μ,该差别被称为
A.系统误差
B.个体差异
C.过失误差
D.抽样误差
E.测量误差
答案:D
6.n足够大,P不接近于0或1,样本率与总体率比较,统计量u为
A.|P-π|/SP
B.|P1-P2|/σP
C.|P-π|/SP
D.|P-π|/σ
E.|P-π|/σP
答案:E
(7~9题共用题干)
7.统计学检验的无效假设应是
A. H0:P1=P2=P3=P4=P5
B. H0:P1=P2=p3=P4>P5
C. H0:π1=π2=π3=π4=π5
D. H0:π1≠π2≠π3≠π4≠π5
E. H0:π1=π2≠π3=π4=π5
答案:C
8.图示对比不同职业人群的冠心病患病率的高低,应绘制
A.普通线图
B.直线图
C.直方图
D.圆图
E.散点图
答案:B
9.比较不同职业人群的冠心病患病率的假设检验,应计算的统计量为
A. t
B. χ2
C. F
D. x
E. P
答案:B
10.两组呈正态分布的数值变量资料,但均数相差悬殊,若比较离散趋势,最好选用的指标为
A.全距
B.四分位数间距
C.方差
D.标准差
E.变异系数
答案:E
(11~13题共用题干)
为了研究45岁以上的男性中体重指数(BMI)≥25者是否糖尿病患病率高,某医生共调查了9550人,其中BMI≥25者有2110人(n1),糖尿病患病人数为226人(X1);BMI<25者7440人(n2),其中糖尿病患病人数为310人(χ2),问BMI≥25者糖尿病患病率是否高于BMI<25者。
11.统计学检验的无效假设和备选假设分别是
A. H0:P1=P2,H1:P1≠P2
B. H0:P1=P2,H1:P1<P2
C. H0:π1=P2,H1:π1≠P2
D. H0:π1=P2,H1:π1<P2
E. H0:π1=P2,H1:π1>P2
答案:E
12.若进行u检验,公式为
A. |P1-P2|/SP1
B. |P1-π|/Sp
C. |P1-P2|/σp
D. |p1-P2|/Sp
E. |P1-π|/σP1
答案:A
13.经u检验,若u值等于2.95,则最接近的概率P应是
A. P>0.05
B. P=0.05
C. P>0.01
D. P=0.01
E. P<0.01
答案:E
14.为比较工人、干部中高血压患者所占比例有无不同,进行了χ2检验,χ2值为9.56,χ2(0.05.1)=3.84,应得出的结论是
A.接受π1=π2
B.拒绝π1=π2
C.接受π1>π2
D.拒绝π1>π2
E.拒绝μ1=μ2
答案:B
15.正态分布曲线下横轴上,从-∞到μ+1.96σ的区间面积占总面积的
A. 90.0%
B. 95.0%
C. 97.5%
D. 99.0%
E. 99.5%
答案:C
16.下列说法正确的是
A.测定60名正常成年女性血小板数所得资料只能是计量资料
B.统计工作步骤中最重要的是分析资料
C.概率是描述某随机事件发生可能性大小的指标
D.样本一定具有随机性
E.样本的指标称为参数
答案:C
17.来自同一总体的两样本,下列哪个指标小的样本均数估计总体均数时更可靠
A. Sx
B. CV
C. S
D. t0.05 ,vS
E. x
答案:D
1、绪论
2、人类和环境
3、物理因素与健康
4、化学因素与健康
5、食物因素与健康
6、人群健康的研究方法
7、人群健康研究的流行病原理和方法
8、疾病的预防和控制