商品详情
书名:医学统计学(高职数字版)
定价:29.8
ISBN:9787030549075
作者:黎逢保
版次:1
出版时间:2018-01
在线试读:
第1章 绪论
在医学实践中,经常会遇到在相同条件下进行同一次试验或观察同一现象,其结果总是不完全一样,如同性别、同年龄、同民族的健康人,他们的体重却不完全一样,这种现象称为随机现象。随机现象有两个特征:一是条件相同,结果不确定;二是虽然结果不确定,但却有很强的统计规律性。统计学就是探索这种规律性的学科,是研究数据的科学,是通过搜索、整理和分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合学科,是认识世界的一个重要手段。
医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。医学统计学研究的对象主要是人体以及与人的健康有关的各种因素。医学统计学方法已成为医学科学研究的重要前提和手段。
案例1-1
国家基本公共卫生服务重点项目之一就是建立居民健康档案。小黄是一家社区卫生服务中心的工作人员,现欲为社区居民建立健康档案,了解辖区居民的身高、体重、空腹血糖等基本健康信息。
问题:要完成小黄的工作任务,需要学习下面哪些知识?
第1节 统计学的基本概念
一 个体与变量
1. 个体 也称观察单位或个体,它是统计研究中的*基本单位,是搜集资料的*小单元,它可以是一个人、一个采样点、一只动物、一个器官甚至是一个细胞,也可以是特指的一群人(如一个家庭、一所幼儿园、一个自然村等)。
2. 变量 表示观察单位的某项特征或属性,对每个变量的测得值称为变量值或观察值,通常用英文字母x表示。
二 总体与样本
1. 总体 根据研究目的确定的同质观察单位的全体,更确切地说是同质的所有观察单位某种变量值的集合,称为总体。例如,研究2015 年某地3 岁正常男童的身高,则观察对象是该地2015 年全体3 岁正常男童,观察单位是每个男童,变量值或观察值是测得的每位男童的身高值,该地2015 年所有3 岁男童的身高值就构成本次研究的总体。这里的总体只包括(确定的时间、空间范围内)有限的观察单位,称为有限总体。有时总体是假想的,如研究贫血患者用某药治疗后的疗效,是没有时间和空间范围限制的,因而观察单位数无限,称为无限总体。
2. 样本 在医学研究中经常会遇到无限总体或有限总体的观察单位数较多的情况。实际上不可能对总体中的每一个观察单位进行研究,只能从总体中随机抽取一部分观察单位进行研究。从总体中随机抽取的有代表性的部分个体称为样本,样本所包含的观察单位数称样本含量。
例如,从某地2015 年3 岁正常男童中随机抽取150 名男童,逐个进行身高测量,得到150 名3岁男童的身高测量值,就构成本次研究的样本,其样本含量n 为150。
三 同质与变异
1. 同质 同一个总体中包含许多个体,它们之间存在许多共性,即为同质。例如,研究2015 年某地3 岁正常男童的身高,该总体的同质基础是同一地区、同一年份、同一年龄的正常男童;又如,研究贫血患者用某药治疗后的疗效,该总体的同质基础是同为贫血患者、同用某药治疗。同质是相对的,没有同质性就不能构成一个总体。
2. 变异 由于个体差异存在的绝对性,同一性质的变量值或观察值,其大小可能参差不齐,如测定一组同年龄、同性别儿童的身高,我们会发现每个儿童的身高各不相同。这种个体间差异在统计学上称为变异。变异是绝对的,没有变异就没有统计学。
统计学的任务就是在同质的基础上,对个体变异进行分析研究,揭示由变异所掩盖的同质事物内在的本质和规律。
四 参数与统计量
1. 参数 根据分布特征而计算的总体指标,称为参数,常用希腊字母表示,如总体均数(μ)、总体率(π)、总体相关系数(ρ)、总体标准差(σ)等。
2. 统计量 由总体中随机抽取的样本所计算的样本指标,称为统计量。常用英文字母表示,如样本均数( x )、样本率( p )、样本相关系数( r )、样本标准差( s )等。
五 误差
误差是指测得值与真实值之差,或样本指标(统计量)与总体指标(参数)之差。误差主要有下列三种:
1. 系统误差 是由某种固定因素所造成的使测定结果呈倾向性地偏大或偏小,称为系统误差。产生系统误差的原因有方法上、操作上、试剂上、主观因素等多方面,如仪器不准、标准试剂未校正、医生掌握疗效的标准偏高或偏低等。其误差特点是单向性,找到原因可消除。
2. 随机测量误差 由于一些暂时无法控制的偶然因素造成对同一对象多次测定结果的不完全一致,称为随机测量误差。如测量同一个体的身高,在不同的时间、不同的地点,或使用不同的工具,或不同的测量者进行测定,其测量结果是不尽相同的。统计学处理时,常将多次测定结果取平均值。
3. 抽样误差 抽样研究中,由于个体差异造成的样本指标与总体指标之间的差异称为抽样误差。如随机抽取2015 年某地150 名3 岁正常男童,测量其身高值并计算其平均值为x (样本均数),由于个体差异的存在,一般不会恰好等于该地全体3 岁正常男童的身高平均值μ(总体均数),这种因为个体差异造成的,由抽样所致的? - x 为抽样误差。
随机测量误差与抽样误差都称为偶然误差或随机误差,其特点是双向性、随机出现,有统计规律(如正态分布规律),一般误差较小,不可消除,但可控制在一定范围。必要时可作统计处理,如对同一样本多次测定后取平均值,抽样时作分层处理后按比例随机抽样等。
六 概率
在一定条件下可能出现也可能不出现的现象,称为随机事件。例如,患者对药物的反应,可能有效,也可能无效;新生儿可能是男婴,也可能是女婴;投掷硬币后可能是正面朝上,也可能是背面朝上等,都是随机事件。概率是描述随机事件发生可能性大小的度量值,用符号P表示。概率的取值范围为0~1,即0≤P≤1,常用小数或百分数表示。P 越接近0,表示某事件发生的可能性越小;P 越接近1,表示某事件发生的可能性越大。在一定条件下必然出现的现象称为必然事件,其概率为1。在一定条件必然不出现的现象称为不可能事件,其概率为0。这两类事件具有特定性,不是随机事件,但可视为随机事件的特例。统计分析中的许多结论都是基于一定可信度下的概率推断,习惯上将P≤0.05 或P≤0.01 称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可视为不会发生,这就是小概率事件原理,是统计推断的理论依据之一。
第2节 统计资料的分类
一 数值变量资料
数值变量资料通常是使用仪器或某种尺度进行测定或衡量所取得的数据。主要是用来说明事物数字特征的一个名称,表现为数值大小,一般有度量衡单位,如身高(cm)、体重(kg)、血压(kPa)、脉搏(次/分)等,又称为计量资料、定量变量资料等。
二 分类变量资料
分类变量资料是说明事物类别的一个名称,按属性归类,其变量值是离散的、定性的,表现为互不相容,一般无度量衡单位,又称计数资料、定性资料等,可分为无序分类资料和有序分类资料。
1. 无序分类资料 又可以分为二项分类数据和多项分类数据。
(1)二项分类数据:将观察结果按两种属性分类,如性别(男/女)、皮试反应(阳性/阴性)、治疗效果(有效/无效)等。
(2)多项分类数据:将观察结果分为互不相容的多类,如血型、职业、民族、疾病预后等。
2. 有序分类资料 又称等级资料,表现为变量的不同取值间有大小、强弱、优劣等程度之别,给人以“半定量”的概念。如尿蛋白检查结果分类,可以有?、±、+、++;疗效分类可以分为痊愈、显效、有效、无效。
表1-1显示的是常见医学数据的定义、记录及其统计术语。
表1-1 常见医学数据的定义、记录及其统计术语
三 统计资料互换
根据分析需要,各类变量之间可以相互转化,如以人为观察单位观察某人群成年男子的血红蛋白量(g/L),属数值变量;若按血红蛋白正常与异常分两类,可按二项分类变量处理;若按血红蛋白量的多少分为五个等级:重度贫血、中度贫血、轻度贫血、正常、血红蛋有增加,可按等级资料处理。有时亦可将分类变量数量化,如将有序分类的疗效转化为评分,分别用0、1、2、3等表示,可按数值变量处理。因此,统计分析时应根据资料的不同类型选择不同的统计分析方法。
第3节 统计工作的基本步骤
医学统计是对医学实践中观察到的原始数据资料进行加工、解释并作出科学判断的全过程。这个过程包括四个基本步骤。
一 统计设计
统计设计是根据研究目的,从统计学角度对搜集资料、整理资料和分析资料提出周密的计划和要求,作为统计全过程实施的依据,以便能用尽可能少的人力、物力和时间获得准确可靠的结论。统计设计分为调查设计和实验设计。后者又可分为实验研究和临床试验两类。实验设计必须遵循“随机、重复、对照”三大原则。设计之前,先要对研究的问题有较多的了解,需要广泛查阅文献,需要与专家共同协作,需弄清什么是研究目的和假说,什么是观察对象和观察单位,需要搜集哪些原始资料,用什么方式和方法取得这些原始资料,怎样对取得的资料作进一步的整理汇总和计算统计指标,如何控制误差,预期会得到什么结果,需要多少经费,时间和人员的分工,等等。凡此种种,都要结合实际、周密考虑、妥善安排,设计是后续步骤的依据,是*关键的一环。
二 搜集资料
搜集资料即按设计的要求获取完整、准确、可靠资料的过程。其特点是要求搜集资料要完整、准确、及时,这是统计分析准确可靠的基础。完整是指搜集资料的项目不能遗漏;准确是指观察、测量准确,记录、计算无误,数据真实可靠;即使是指经常性资料的搜集也应按规定时间完成,一时性资料的搜集者对数据的记录应在观察、测量的同时完成,不得以“回忆”方式记录数据。资料的来源主要有经常性资料与一时性资料两种,经常性资料包括从日常医疗卫生工作原始记录(如病历)、专门报告卡(如出生、死亡报告卡)、统计报表(如疫情月报表、年报表)等中搜集到的资料;一时性资料是指由专门组织的现场调查或实验研究中收集的资料。搜集资料是统计分析的前提和基础。
三 整理资料
整理资料即把搜集到的资料进行适当的分组,把性质相同的资料归纳到一起,用表格或图形的方式展示出来,以反映研究对象的规律性。任务是净化原始数据,使其系统化、条理化,便于进一步计算指标和分析。整理资料的过程中要核对原始资料的准确性、完整性和可靠性,是需要耐心从事的基础工作,特别是数据较多时必须反复检查与核对,一定要在修正错误、去伪存真后再开始按分析要求和分组汇总资料。汇总可采用计算机汇总和手工汇总两种形式。
四 分析资料
分析资料又称统计分析,即通过计算有关指标来反映数据的综合特征(亦称综合指标),阐明事物内在联系和规律。统计分析包括:①统计描述,指用统计指标、统计表、统计图等方法对资料的数量特征及其分布规律进行测定和描述,不涉及由样本推论总体的问题;②统计推断,指如何在一定的可信度下由样本信息推断总体特征,包括如何由样本统计指标(统计量)来推断总体相应指标(参数),称参数估计;如何由样本差异来推断总体之间是否可能存在差异,称假设检验。医学统计工作基本步骤见图1-1。
图1-1 医学统计工作基本步骤示意图
案例1-1 解析 在小黄需要完成的任务中,首先以辖区内居民为观察单位,确定该辖区内所有居民为总体,从每个居民点抽取部分居民为样本,按照统计工作的步骤要求操作,分性别进行身高、体重、空腹血糖等数据的测量。其他任务在第2章学习完成。
第4节 如何学好医学统计学
医学统计学是医学专业学生今后从事医学相关工作的一门重要工具,为解决工作实际问题打下必要的统计学基础。学习医学统计学的目的:运用统计学的思维方法,探索生命科学领域的内部规律,研究提高人群健康状况及卫生事业管理水平等,促进医学和卫生管理的科技进步,提高医务工作者的科研能力和工作能力。
在学习本课程时,应该注意:
1. 掌握医学统计学的基本概念、基本原理、基本知识和基本方法。注意结合专业、联系实际,重点学习应用技能。
2. 培养科学严谨、实事求是的工作态度。重视医学数据的完整性、准确性、及时性和真实性,不能伪造或篡改。
3. 树立统计学思维。变异是客观存在的,抽样误差是不可避免的,统计学就是从现象探讨本质的行为,依据概率作出统计结论的过程。
(黎逢保)
目录检测
单项选择题
A1/A2 型题
1. 下列资料中,属于定量资料的是( )
A. 性别 B. 体重 C. 血型
D. 职业 E. 民族
2. 某研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本研究总体为( )
A. 所有成年男子
B. 该市所有成年男子
C. 该市所有健康成年男子
D. 该市120 名成年男子
E. 该市120 名健康成年男子
3. 下列属于小概率事件的为( )
A. P=0.09 B. P=0.10 C. P=0.15
D. P=0.03 E. 以上都不是
4. 参数是指( )
A. 参与个体数 B. 研究个体数
C. 总体的统计指标 D. 样本的总和
E. 样本的统计指标
5. 统计工作的基本步骤是( )
A. 设计、调查、审核、整理资料
B. 收集、审核、整理、分析资料
C. 设计、搜集、整理、分析资料
D. 调查、审核、整理、分析资料
E. 以上都不对
A3/A4 型题
(6~8 题共用题干)
2015 年某市调查了留住该市1 年以上,无明显肝、肾疾病,无汞作业接触史的238 名居民的发汞含量。
6. 此研究的总体是( )
A. 该市所有居民
B. 留住该市1 年以上的所有居民
C. 该市所有健康居民
D. 上述238 名居民
E. 留住该市1 年以上,无明显肝、肾疾病,无汞作业接触史的所有居民
7. 此研究的样本是( )
A. 该市所有居民
B. 留住该市1 年以上的居民
C. 该市所有健康居民
D. 上述238 名居民
E. 留住该市1 年以上,无明显肝、肾疾病,无汞作业接触史的所有居民
8. 此资料属于( )
A. 定量资料 B. 定性资料
C. 等级资料 D. 无序分类资料
E. 以上都不是
定价:29.8
ISBN:9787030549075
作者:黎逢保
版次:1
出版时间:2018-01
在线试读:
第1章 绪论
在医学实践中,经常会遇到在相同条件下进行同一次试验或观察同一现象,其结果总是不完全一样,如同性别、同年龄、同民族的健康人,他们的体重却不完全一样,这种现象称为随机现象。随机现象有两个特征:一是条件相同,结果不确定;二是虽然结果不确定,但却有很强的统计规律性。统计学就是探索这种规律性的学科,是研究数据的科学,是通过搜索、整理和分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合学科,是认识世界的一个重要手段。
医学统计学是运用概率论与数理统计的原理及方法,结合医学实际,研究数字资料的搜集、整理分析与推断的一门学科。医学统计学研究的对象主要是人体以及与人的健康有关的各种因素。医学统计学方法已成为医学科学研究的重要前提和手段。
案例1-1
国家基本公共卫生服务重点项目之一就是建立居民健康档案。小黄是一家社区卫生服务中心的工作人员,现欲为社区居民建立健康档案,了解辖区居民的身高、体重、空腹血糖等基本健康信息。
问题:要完成小黄的工作任务,需要学习下面哪些知识?
第1节 统计学的基本概念
一 个体与变量
1. 个体 也称观察单位或个体,它是统计研究中的*基本单位,是搜集资料的*小单元,它可以是一个人、一个采样点、一只动物、一个器官甚至是一个细胞,也可以是特指的一群人(如一个家庭、一所幼儿园、一个自然村等)。
2. 变量 表示观察单位的某项特征或属性,对每个变量的测得值称为变量值或观察值,通常用英文字母x表示。
二 总体与样本
1. 总体 根据研究目的确定的同质观察单位的全体,更确切地说是同质的所有观察单位某种变量值的集合,称为总体。例如,研究2015 年某地3 岁正常男童的身高,则观察对象是该地2015 年全体3 岁正常男童,观察单位是每个男童,变量值或观察值是测得的每位男童的身高值,该地2015 年所有3 岁男童的身高值就构成本次研究的总体。这里的总体只包括(确定的时间、空间范围内)有限的观察单位,称为有限总体。有时总体是假想的,如研究贫血患者用某药治疗后的疗效,是没有时间和空间范围限制的,因而观察单位数无限,称为无限总体。
2. 样本 在医学研究中经常会遇到无限总体或有限总体的观察单位数较多的情况。实际上不可能对总体中的每一个观察单位进行研究,只能从总体中随机抽取一部分观察单位进行研究。从总体中随机抽取的有代表性的部分个体称为样本,样本所包含的观察单位数称样本含量。
例如,从某地2015 年3 岁正常男童中随机抽取150 名男童,逐个进行身高测量,得到150 名3岁男童的身高测量值,就构成本次研究的样本,其样本含量n 为150。
三 同质与变异
1. 同质 同一个总体中包含许多个体,它们之间存在许多共性,即为同质。例如,研究2015 年某地3 岁正常男童的身高,该总体的同质基础是同一地区、同一年份、同一年龄的正常男童;又如,研究贫血患者用某药治疗后的疗效,该总体的同质基础是同为贫血患者、同用某药治疗。同质是相对的,没有同质性就不能构成一个总体。
2. 变异 由于个体差异存在的绝对性,同一性质的变量值或观察值,其大小可能参差不齐,如测定一组同年龄、同性别儿童的身高,我们会发现每个儿童的身高各不相同。这种个体间差异在统计学上称为变异。变异是绝对的,没有变异就没有统计学。
统计学的任务就是在同质的基础上,对个体变异进行分析研究,揭示由变异所掩盖的同质事物内在的本质和规律。
四 参数与统计量
1. 参数 根据分布特征而计算的总体指标,称为参数,常用希腊字母表示,如总体均数(μ)、总体率(π)、总体相关系数(ρ)、总体标准差(σ)等。
2. 统计量 由总体中随机抽取的样本所计算的样本指标,称为统计量。常用英文字母表示,如样本均数( x )、样本率( p )、样本相关系数( r )、样本标准差( s )等。
五 误差
误差是指测得值与真实值之差,或样本指标(统计量)与总体指标(参数)之差。误差主要有下列三种:
1. 系统误差 是由某种固定因素所造成的使测定结果呈倾向性地偏大或偏小,称为系统误差。产生系统误差的原因有方法上、操作上、试剂上、主观因素等多方面,如仪器不准、标准试剂未校正、医生掌握疗效的标准偏高或偏低等。其误差特点是单向性,找到原因可消除。
2. 随机测量误差 由于一些暂时无法控制的偶然因素造成对同一对象多次测定结果的不完全一致,称为随机测量误差。如测量同一个体的身高,在不同的时间、不同的地点,或使用不同的工具,或不同的测量者进行测定,其测量结果是不尽相同的。统计学处理时,常将多次测定结果取平均值。
3. 抽样误差 抽样研究中,由于个体差异造成的样本指标与总体指标之间的差异称为抽样误差。如随机抽取2015 年某地150 名3 岁正常男童,测量其身高值并计算其平均值为x (样本均数),由于个体差异的存在,一般不会恰好等于该地全体3 岁正常男童的身高平均值μ(总体均数),这种因为个体差异造成的,由抽样所致的? - x 为抽样误差。
随机测量误差与抽样误差都称为偶然误差或随机误差,其特点是双向性、随机出现,有统计规律(如正态分布规律),一般误差较小,不可消除,但可控制在一定范围。必要时可作统计处理,如对同一样本多次测定后取平均值,抽样时作分层处理后按比例随机抽样等。
六 概率
在一定条件下可能出现也可能不出现的现象,称为随机事件。例如,患者对药物的反应,可能有效,也可能无效;新生儿可能是男婴,也可能是女婴;投掷硬币后可能是正面朝上,也可能是背面朝上等,都是随机事件。概率是描述随机事件发生可能性大小的度量值,用符号P表示。概率的取值范围为0~1,即0≤P≤1,常用小数或百分数表示。P 越接近0,表示某事件发生的可能性越小;P 越接近1,表示某事件发生的可能性越大。在一定条件下必然出现的现象称为必然事件,其概率为1。在一定条件必然不出现的现象称为不可能事件,其概率为0。这两类事件具有特定性,不是随机事件,但可视为随机事件的特例。统计分析中的许多结论都是基于一定可信度下的概率推断,习惯上将P≤0.05 或P≤0.01 称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可视为不会发生,这就是小概率事件原理,是统计推断的理论依据之一。
第2节 统计资料的分类
一 数值变量资料
数值变量资料通常是使用仪器或某种尺度进行测定或衡量所取得的数据。主要是用来说明事物数字特征的一个名称,表现为数值大小,一般有度量衡单位,如身高(cm)、体重(kg)、血压(kPa)、脉搏(次/分)等,又称为计量资料、定量变量资料等。
二 分类变量资料
分类变量资料是说明事物类别的一个名称,按属性归类,其变量值是离散的、定性的,表现为互不相容,一般无度量衡单位,又称计数资料、定性资料等,可分为无序分类资料和有序分类资料。
1. 无序分类资料 又可以分为二项分类数据和多项分类数据。
(1)二项分类数据:将观察结果按两种属性分类,如性别(男/女)、皮试反应(阳性/阴性)、治疗效果(有效/无效)等。
(2)多项分类数据:将观察结果分为互不相容的多类,如血型、职业、民族、疾病预后等。
2. 有序分类资料 又称等级资料,表现为变量的不同取值间有大小、强弱、优劣等程度之别,给人以“半定量”的概念。如尿蛋白检查结果分类,可以有?、±、+、++;疗效分类可以分为痊愈、显效、有效、无效。
表1-1显示的是常见医学数据的定义、记录及其统计术语。
表1-1 常见医学数据的定义、记录及其统计术语
三 统计资料互换
根据分析需要,各类变量之间可以相互转化,如以人为观察单位观察某人群成年男子的血红蛋白量(g/L),属数值变量;若按血红蛋白正常与异常分两类,可按二项分类变量处理;若按血红蛋白量的多少分为五个等级:重度贫血、中度贫血、轻度贫血、正常、血红蛋有增加,可按等级资料处理。有时亦可将分类变量数量化,如将有序分类的疗效转化为评分,分别用0、1、2、3等表示,可按数值变量处理。因此,统计分析时应根据资料的不同类型选择不同的统计分析方法。
第3节 统计工作的基本步骤
医学统计是对医学实践中观察到的原始数据资料进行加工、解释并作出科学判断的全过程。这个过程包括四个基本步骤。
一 统计设计
统计设计是根据研究目的,从统计学角度对搜集资料、整理资料和分析资料提出周密的计划和要求,作为统计全过程实施的依据,以便能用尽可能少的人力、物力和时间获得准确可靠的结论。统计设计分为调查设计和实验设计。后者又可分为实验研究和临床试验两类。实验设计必须遵循“随机、重复、对照”三大原则。设计之前,先要对研究的问题有较多的了解,需要广泛查阅文献,需要与专家共同协作,需弄清什么是研究目的和假说,什么是观察对象和观察单位,需要搜集哪些原始资料,用什么方式和方法取得这些原始资料,怎样对取得的资料作进一步的整理汇总和计算统计指标,如何控制误差,预期会得到什么结果,需要多少经费,时间和人员的分工,等等。凡此种种,都要结合实际、周密考虑、妥善安排,设计是后续步骤的依据,是*关键的一环。
二 搜集资料
搜集资料即按设计的要求获取完整、准确、可靠资料的过程。其特点是要求搜集资料要完整、准确、及时,这是统计分析准确可靠的基础。完整是指搜集资料的项目不能遗漏;准确是指观察、测量准确,记录、计算无误,数据真实可靠;即使是指经常性资料的搜集也应按规定时间完成,一时性资料的搜集者对数据的记录应在观察、测量的同时完成,不得以“回忆”方式记录数据。资料的来源主要有经常性资料与一时性资料两种,经常性资料包括从日常医疗卫生工作原始记录(如病历)、专门报告卡(如出生、死亡报告卡)、统计报表(如疫情月报表、年报表)等中搜集到的资料;一时性资料是指由专门组织的现场调查或实验研究中收集的资料。搜集资料是统计分析的前提和基础。
三 整理资料
整理资料即把搜集到的资料进行适当的分组,把性质相同的资料归纳到一起,用表格或图形的方式展示出来,以反映研究对象的规律性。任务是净化原始数据,使其系统化、条理化,便于进一步计算指标和分析。整理资料的过程中要核对原始资料的准确性、完整性和可靠性,是需要耐心从事的基础工作,特别是数据较多时必须反复检查与核对,一定要在修正错误、去伪存真后再开始按分析要求和分组汇总资料。汇总可采用计算机汇总和手工汇总两种形式。
四 分析资料
分析资料又称统计分析,即通过计算有关指标来反映数据的综合特征(亦称综合指标),阐明事物内在联系和规律。统计分析包括:①统计描述,指用统计指标、统计表、统计图等方法对资料的数量特征及其分布规律进行测定和描述,不涉及由样本推论总体的问题;②统计推断,指如何在一定的可信度下由样本信息推断总体特征,包括如何由样本统计指标(统计量)来推断总体相应指标(参数),称参数估计;如何由样本差异来推断总体之间是否可能存在差异,称假设检验。医学统计工作基本步骤见图1-1。
图1-1 医学统计工作基本步骤示意图
案例1-1 解析 在小黄需要完成的任务中,首先以辖区内居民为观察单位,确定该辖区内所有居民为总体,从每个居民点抽取部分居民为样本,按照统计工作的步骤要求操作,分性别进行身高、体重、空腹血糖等数据的测量。其他任务在第2章学习完成。
第4节 如何学好医学统计学
医学统计学是医学专业学生今后从事医学相关工作的一门重要工具,为解决工作实际问题打下必要的统计学基础。学习医学统计学的目的:运用统计学的思维方法,探索生命科学领域的内部规律,研究提高人群健康状况及卫生事业管理水平等,促进医学和卫生管理的科技进步,提高医务工作者的科研能力和工作能力。
在学习本课程时,应该注意:
1. 掌握医学统计学的基本概念、基本原理、基本知识和基本方法。注意结合专业、联系实际,重点学习应用技能。
2. 培养科学严谨、实事求是的工作态度。重视医学数据的完整性、准确性、及时性和真实性,不能伪造或篡改。
3. 树立统计学思维。变异是客观存在的,抽样误差是不可避免的,统计学就是从现象探讨本质的行为,依据概率作出统计结论的过程。
(黎逢保)
目录检测
单项选择题
A1/A2 型题
1. 下列资料中,属于定量资料的是( )
A. 性别 B. 体重 C. 血型
D. 职业 E. 民族
2. 某研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本研究总体为( )
A. 所有成年男子
B. 该市所有成年男子
C. 该市所有健康成年男子
D. 该市120 名成年男子
E. 该市120 名健康成年男子
3. 下列属于小概率事件的为( )
A. P=0.09 B. P=0.10 C. P=0.15
D. P=0.03 E. 以上都不是
4. 参数是指( )
A. 参与个体数 B. 研究个体数
C. 总体的统计指标 D. 样本的总和
E. 样本的统计指标
5. 统计工作的基本步骤是( )
A. 设计、调查、审核、整理资料
B. 收集、审核、整理、分析资料
C. 设计、搜集、整理、分析资料
D. 调查、审核、整理、分析资料
E. 以上都不对
A3/A4 型题
(6~8 题共用题干)
2015 年某市调查了留住该市1 年以上,无明显肝、肾疾病,无汞作业接触史的238 名居民的发汞含量。
6. 此研究的总体是( )
A. 该市所有居民
B. 留住该市1 年以上的所有居民
C. 该市所有健康居民
D. 上述238 名居民
E. 留住该市1 年以上,无明显肝、肾疾病,无汞作业接触史的所有居民
7. 此研究的样本是( )
A. 该市所有居民
B. 留住该市1 年以上的居民
C. 该市所有健康居民
D. 上述238 名居民
E. 留住该市1 年以上,无明显肝、肾疾病,无汞作业接触史的所有居民
8. 此资料属于( )
A. 定量资料 B. 定性资料
C. 等级资料 D. 无序分类资料
E. 以上都不是