商品详情
书名:概率论与数理统计(第二版)
定价:57.5
ISBN:9787030578136
作者:无
版次:1
出版时间:2018-08
内容提要:
本书是“十三五”江苏省高等学校重点教材,内容包括引言、随机事件及概率、随机变量及其分布、随机变量的数字特征、大数定律与中心极限定理、数理统计的基本概念、参数估计、假设检验、方差分析及线性回归分析初步等内容。书中每节都安排了习题,习题分为两个部分,横线以上为基础题,横线以下部分为提高题,以适应不同层次学生的学习需求每章结尾都增设了本章概要、常用术语和常用公式,帮助学生复习。
目录:
目录
第二版前言
**版前言
引言 1
一、必然现象与随机现象 1
二、随机试验 1
三、概率论与数理统计的研究对象 2
四、概率论与数理统计发展简史 2
第1章随机事件及概率 4
1.1随机事件与样本空间 4
1.1.1基本事件与样本空间 4
1.1.2随机事件 5
1.1.3事件的关系与运算 6
1.1.4事件域 10
习题1.1 11
1.2概率定义及概率的性质 12
1.2.1概率的描述性定义 12
1.2.2概率的统计定义 12
1.2.3概率的公理化定义 14
1.2.4概率的性质 15
习题1.2 17
1.3古典概型与几何概型 18
1.3.1古典概型 18
1.3.2几何概型 23
习题1.3 26
1.4条件概率的计算公式 27
1.4.1条件概率 27
1.4.2乘法公式 28
1.4.3全概率公式 29
1.4.4贝叶斯公式 31
习题1.4 32
1.5独立性与伯努利概型 33
1.5.1事件的独立性 33
1.5.2伯努利概型 37
习题1.5 39
本章概要 40
常用术语 41
常用公式 41
第2章随机变量及其分布 43
2.1随机变量及分布函数 43
2.1.1随机变量及其分类 43
2.1.2一维随机变量的分布函数 44
2.1.3多维随机变量的联合分布函数 47
2.1.4随机变量的独立性 48
习题2.1 49
2.2离散型随机变量及其分布列 50
2.2.1一维离散型随机变量及分布列 50
2.2.2多维离散型随机变量及其联合分布列 56
2.2.3离散型随机变量的独立性 59
习题2.2 61
2.3连续型随机变量及其分布 63
2.3.1一维连续型随机变量 63
2.3.2二维连续型随机变量及其密度函数 69
2.3.3连续型随机变量的独立性条件 72
习题2.3 73
2.4随机变量函数的分布 74
2.4.1一维随机变量函数的分布 74
2.4.2连续型随机变量函数的分布 76
习题2.4 85
2.5条件分布 87
2.5.1条件分布的概念 87
2.5.2离散型随机变量的条件分布 88
2.5.3连续型随机变量的条件密度 91
习题2.5 93
本章概要 94
常用术语 94
常用公式 95
第3章随机变量的数字特征 101
3.1随机变量的数学期望 101
3.1.1数学期望的概念 101
3.1.2几种常用分布的期望 105
3.1.3随机变量函数的数学期望 107
3.1.4数学期望的性质 110
习题3.1 113
3.2随机变量的方差 114
3.2.1方差的概念 115
3.2.2几种常用分布的方差 115
3.2.3方差的性质 118
3.2.4切比雪夫不等式 120
习题3.2 121
3.3协方差、相关系数 122
3.3.1协方差 122
3.3.2相关系数 125
3.3.3矩 129
3.3.4协方差矩阵 129
3.3.5n维正态分布的概率密度 130
习题3.3 130
3.4条件期望与条件方差 132
3.4.1条件期望 132
3.4.2条件方差 135
习题3.4 136
本章概要 136
常用术语 137
常用公式 137
第4章大数定律与中心极限定理 140
4.1大数定律 140
4.1.1大数定律的意义 140
4.1.2几种常用大数定律 141
习题4.1 144
4.2随机变量序列的两种收敛性 145
4.2.1依概率收敛 145
4.2.2依分布收敛 149
习题4.2 150
4.3中心极限定理 151
4.3.1中心极限定理的概念 151
4.3.2独立同分布的中心极限定理 152
4.3.3棣莫弗-拉普拉斯中心极限定理 154
习题4.3 158
本章概要 158
常用术语 159
常用公式 159
第5章数理统计的基本概念 161
5.1总体与样本 161
5.1.1总体与个体 161
5.1.2简单随机样本 162
5.1.3参数与参数空间 163
习题5.1 164
5.2直方图与经验分布函数 164
5.2.1直方图 164
5.2.2经验分布函数 165
习题5.2 167
5.3统计量及其分布 167
5.3.1统计量的概念 168
5.3.2统计量的分布 169
5.3.3分位数 173
5.3.4正态总体的抽样分布 174
习题5.3 176
本章概要 178
常用术语 178
常用公式 178
第6章参数估计 180
6.1参数的点估计 180
6.1.1点估计的概念 180
6.1.2矩法估计 180
6.1.3极大似然估计 183
习题6.1 188
6.2估计量的评价准则 189
6.2.1无偏性 189
6.2.2*小方差性和有效性 192
6.2.3一致性(相合性) 195
习题6.2 195
6.3参数的区间估计 197
6.2.1区间估计的一般步骤 197
6.3.2单个正态总体参数的区间估计 198
6.3.3双正态总体参数的区间估计 201
习题6.3 203
本章概要 204
常用术语 204
常用公式 205
第7章假设检验 206
7.1假设检验的基本思想和程序 206
7.1.1假设检验的基本思想 206
7.1.2假设检验的程序 209
习题7.1 209
7.2正态总体参数的假设检验 210
7.2.1U检验 211
7.2.2T检验 217
7.2.3χ2检验 223
7.2.4F检验 226
习题7.2 228
7.3检验的实际意义及两类错误 230
7.3.1检验结果的实际意义 230
7.3.2检验中的两类错误 231
7.3.3样本容量确定问题 233
习题7.3 235
7.4非参数假设检验 235
7.4.1χ2拟合检验法 236
7.4.2独立性检验 240
习题7.4 243
本章概要 244
常用术语 244
常用公式 245
第8章方差分析及线性回归分析初步 246
8.1方差分析 246
8.1.1方差分析的基本原理 246
8.1.2单因子方差分析方法 247
8.1.3单因子方差分析中的参数估计 254
8.1.4二因子方差分析 255
习题8.1 261
8.2线性回归分析初步 263
8.2.1回归分析的相关概念 263
8.2.2一元线性回归 264
8.2.3多元线性回归 272
习题8.2 278
本章概要 279
常用术语 280
常用公式 280
习题答案 282
参考文献 301
附录常用分布表 302
附表1常用的概率分布、数学期望及方差 302
附表2标准正态分布表 303
附表3t分布表 304
附表4χ2分布表 305
附表6泊松分布表 314
附表7相关系数临界值表 315
在线试读:
引言
一、必然现象与随机现象
在自然界和人的实践活动中经常遇到各种各样的现象,这些现象大体可分为两类:一类是确定的,例如“在一个标准大气压下,纯水加热到100℃时必然沸腾”,“向上抛一块石头必然下落”,“同性电荷相斥,异性电荷相吸”等等,这种在一定条件下有确定结果的现象称为必然现象(确定性现象)。
另一类现象是随机的,例如,在相同的条件下,向上抛一枚质地均匀的硬币,其结果可能是正面朝上,也可能是反面朝上,不论如何控制抛掷条件,在每次抛掷之前无法肯定抛掷的结果是什么,这个试验多于一种可能结果,但是在试验之前不能肯定试验会出现哪一个结果。同样地,同一门大炮对同一目标进行多次射击(同一型号的炮弹),各次弹着点可能不尽相同,并且每次射击之前无法肯定弹着点的确切位置,以上所举的现象都具有随机性,即在一定条件下进行试验或观察会出现不同的结果(也就是说,多于一种可能的试验结果),而且在每次试验之前都无法预言会出现哪一个结果(不能肯定试验会出现哪一个结果),这种现象称为随机现象。
再看两个试验。
试验Ⅰ:一盒中有十个完全相同的白球,搅匀后从中摸出一球;
试验Ⅱ:一盒中有十个相同的球,其中5个白球,5个黑球,搅匀后从中任意摸取一球。
对于试验Ⅰ而言,在球没有取出之前,我们就能确定取出的球必是白球,也就是说在试验之前就能判定它只有一个确定的结果,这种现象就是必然现象(确定性现象)。
对于试验Ⅱ来说,在球没有取出之前,不能确定试验的结果(取出的球)是白球还是黑球,也就是说一次试验的结果(取出的球)出现白球还是黑球,在试验之前无法肯定。对于这一类试验而言,骤然一看,似乎没有什么规律而言,但是实践告诉我们,如果从盒子中反复多次取球(每次取一球,记录球的颜色后仍把球放回盒子中搅匀),那么总可以观察到这样的事实,当试验次数相当大时,出现白球的次数和出现黑球的次数是很接近的,比值会逐渐稳定于,出现这个事实是完全可以理解的,因为盒子中的黑球数与白球数相等,从中任意摸一球取得白球或黑球的“机会”相等。
试验Ⅱ所代表的类型,它有多于一种可能的结果,但在试验之前不能确定试验会出现哪一种结果,这类试验所代表的现象称为随机现象,对于试验而言,一次试验看不出什么规律,但是“大数次”地重复这个试验,试验的结果又遵循某些规律,这些规律称为“统计规律”。在客观世界中,随机现象是极为普遍的,例如“某地区的年降雨量”,“某电话交换台在单位时间内收到的用户的呼唤次数”,“一年全省的经济总量”等等,这些都是随机现象。
二、随机试验
如果一个试验满足下述条件:
(1)试验可以在相同的条件下重复进行(可重复性);
(2)试验的所有可能结果是明确的、可知道的(在试验之前就可以知道的),并且不止一个(明确性);
(3)每次试验总是恰好出现这些可能结果中的一个,但在一次试验之前却不能肯定这次试验出现哪一个结果(不确定性)。
称这样的试验是一个随机试验,为方便起见,也简称为试验,今后讨论的试验都是指随机试验。
三、概率论与数理统计的研究对象
概率论是从数量侧面研究随机现象及其统计规律性的数学学科,它的理论严谨,应用广泛,并且有独特的概念和方法,同时与其他数学分支有着密切的联系,是近代数学的重要组成部分。
数理统计是对随机现象统计规律归纳的研究,就是利用概率论的结果,深入研究统计资料,观察这些随机现象并发现其内在的规律性,进而作出一定精确程度的判断,将这些研究结果加以归纳整理,形成一定的数学模型。虽然概率论与数理统计在方法上有所不同,但作为一门学科,它们却相互渗透,相互联系。
概率论与数理统计这门学科的应用相当广泛,不仅在天文、气象、水文、地质、物理、化学、生物、医学等学科有其应用,而且在农业、工业、商业、军事、电信部门等也有广泛的应用。
四、概率论与数理统计发展简史
概率论被称为“赌博起家”的理论。
概率论产生于17世纪中叶,是一门比较古老的数学学科,有趣的是:尽管任何一门的数学分支的产生与发展都不外乎是生产、科学或数学自身发展的推动,但是概率论的产生,却起始于对赌博的研究,当时两个赌徒约定赌若干局,并且谁先赢c局便是赢家,若一个赌徒赢a局(a<c),另一赌徒赢b局(b<c)时终止赌博,问应当如何分赌本?*初正是一个赌徒将问题求教于帕斯卡,促使帕斯卡同费马讨论这个问题,从而他们共同建立了概率论的**基本概念—数学期望。
1657年惠更斯也给出了一个与他们类似的解法。
在他们之后,对于研究这种随机(或称偶然)现象规律的概率论做出了贡献的是伯努利家族的几位成员,雅各布给出了赌徒输光问题的详尽解法,并证明了被称为“大数定律”的一个定理(伯努利定理),这是研究偶然事件的古典概率论中极其重要的结果,它表明在大量观察中,事件的频率与概率是极其接近的。历史上**个发表有关概率论论文的人是伯努利,他于1713年发表了一篇关于极限定理的论文,概率论产生后的很长一段时间内都是将古典概型作为概率来研究的,直到1812年拉普拉斯在他的著作《分析概率论》中给出概率明确的定义,并且还建立了观察误差理论和*小二乘法估计法,从这时开始对概率的研究,实现了从古典概率论向近代概率论的转变。
概率论在20世纪再度迅速发展起来,这是由于科学技术发展迫切地需要研究有关一个或多个连续变化着的参变量的随机变数理论,即随机过程论,1906年俄国数学家马尔可夫(1856~1922)提出了所谓“马尔可夫链”的数学模型,对发展这一理论做出贡献的还有柯尔莫哥洛夫(苏联)、费勒(美国);1934年苏联数学家辛钦又提出了一种在时间中均匀进行着的平稳过程的理论。随机过程理论在科学技术中有着重要的应用,现在已建立了马尔可夫过程与随机微分方程之间的联系。
1960年,卡尔曼(1930~2016)建立了数字滤波论,进一步发展了随机过程在制导系统中的应用。1917年苏联科学家伯恩斯坦首先给出了概率论的公理体系。1933年柯尔莫哥洛夫又以更完整的形式提出了概率论的公理结构,从此,更现代意义上的完整的概率论臻于完成。
相对于其他许多数学分支而言,数理统计是一个比较年轻的数学分支,它是研究怎样去有效地收集、整理和分析带有随机性的数据,以对所观察的问题作出推断或预测,直至为采取一定的决策和行动提供依据与建议。数理统计学是伴随着概率论的发展而发展起来的。当人们认识到必须把数据看成是来自具有一定概率分布的总体,所研究的对象是这个总体而不能局限于数据本身之日,也就是数理统计学诞生之时(确切时间至今难定论)。
从现有资料看,19世纪中叶以前已出现了若干重要工作,特别是高斯和勒让德关于观测数据误差分析和*小二乘法的研究。到19世纪末,经过包括皮尔逊在内的一些学者的努力,这门学科已经开始形成。
数理统计学发展成一门成熟的学科,则是20世纪上半叶的事,它很大程度上要归功于皮尔逊、费希尔等的工作。特别是费希尔的贡献,对这门学科的建立起了决定性的作用。1946年,克拉默发表的《统计学数学方法》,是**部严谨且比较系统的数理统计学著作,可以把它作为数理统计学进入成熟阶段的标志。
我国的概率论研究起步较晚,从1957年开始,先驱者是许宝騄先生。1957年暑期许老师在北京师范大学举办了一个概率论与数理统计的讲习班,从此,我国对概率论与数理统计的研究有了较大的发展。现在概率论与数理统计是数学系各专业的必修课之一,也是工科、经济类专业学生的公共课,许多高校都设了统计学(特别是财经类高校)。近年来,我国科学家对概率论与数理统计也取得了较大的成果。
第1章 随机事件及概率
1.1 随机事件与样本空间
随机事件与样本空间是概率论中的两个*基本的概念。
1.1.1 基本事件与样本空间
对于随机试验来说,我们感兴趣的往往是随机试验的所有可能结果。例如,掷一枚硬币,我们关心的是出现正面还是出现反面这两个可能结果。若观察的是掷两枚硬币的试验,则可能出现的结果有(正、正),(正、反),(反、正),(反、反)四种,如果掷三枚硬币,其结果还要复杂,但还是可以将它们描述出来的,总之为了研究随机试验,必须知道随机试验的所有可能结果。
1.基本事件
通常,根据我们研究的目的,将随机试验的每一个可能的结果,称为基本事件。因为随机试验的所有可能结果是明确的,从而所有的基本事件也是明确的。例如,在抛掷硬币的试验中“出现反面”“出现正面”是两个基本事件;又如,在掷骰子试验中“出现一点”,“出现两点”,“出现三点”,…,“出现六点”都是基本事件。
2.样本空间
基本事件的全体,称为样本空间。也就是试验所有可能结果的全体是样本空间,样本空间通常用大写的希腊字母表示,中的点即基本事件,也称为样本点,常用表示,有时也用A,B,C等表示。
在具体问题中,给定样本空间是研究随机现象的**步。
例1.1.1 一盒中有十个完全相同的球,分别有号码,从中任取一球,观察其标号,写出其样本空间。
解其中,为基本事件(样本点)。
例1.1.2 写出下列试验的样本空间:
(1)同时抛掷红色与白色的骰子各一粒,记录其向上一面(简称出现)的点数;
(2)同时抛掷两粒骰子,记录出现的点数之和。
解 (1)用有序数组表示红色骰子出现点,白色骰子出现点,则样本空间可表示为共36个样本点;
(2)试验和(1)类似,但观察的内容不相同,其样本点也不相同,不难看出(2)的样本空间可表示为。
例1.1.1和例1.1.2讨论的样本空间只有有限个样本点,是比较简单的样本空间。
例1.1.3 讨论某寻呼台在单位时间内收到的呼叫次数,可能结果一定是非负整数而且很难制定一个数为它的上界。这样就可以把样本空间取为。
这样的样本空间含有无穷个样本点,但这些样本点可以依照某种顺序排列起来,称它为可列样本空间。
例1.1.4 讨论某地区的气温时自然把样本空间取为或,这样的样本空间含有无穷个样本点,它充满一个区间,称它为无穷样本空间。
从这些例子可以看出,样本空间是由试验完全确定的。随着问题的不同,样本空间可以相当 简单,也可以相当复杂。在今后的讨论中,都认为样本空间是预先给定的。
注意 对于一个实际问题或一个随机现象,考虑问题的角度不同,样本空间也可能选择得不同。
例如,掷骰子这个随机试验,若考虑的是出现的点数,则样本空间;若考虑的是出现奇数点还是出现偶数点,则样本空间。
由此说明,同一个随机试验可以有不同的样本空间。在实际问题中,选择恰当的样本空间来研究随机现象是概率论中值得研究的一个问题。
1.1.2 随机事件
随机试验总有一定的观察目的,除了考察其所有可能结果组成的样本空间外,还需观察其他各种各样的结果。如在例1.1。1中,样本空间,研究下面这些问题:
其中为一个基本事件,而与则由基本事件所组成。
例如,发生(出现)必须而且只需下列样本点之一发生,它由五个基本事件组成。
同样地,发生必须而且只需下列样本点之一发生。
这些结果在一次试验中既可能发生,也可能不发生,体现了随机性。这样的结果称为随机事件,简称事件。习惯上用大写英文字母等表示,在试验中如果出现中包含了某一个基本事件,则称作发生,并记作。
我们知道,样本空间包含了全体基本事件(样本点),而随机事件不过是由某些特征的基本事件组成的,从集合论的角度来看,一个随机事件不过是样本空间的一个子集而已。
如例1.1.1中,显然都是的子集,它们可以简单地表示为
因为由所有基本事件组成,所以在一次试验中,必然要出现中的某一基本事件,即,也就是在试验中必然要发生(出现),今后用表示一个必然事件,它本身就是的子集。例如,掷骰子这个随机试验,“掷出的点数不小于1”,“掷出的点数是自然数”等,它们在每次试验中必然出现,都是必然事件。
相应地,空集在任意一次试验中不能有,也就是说永远不可能发生,所以称为不可能事件。又如,在掷骰子这个试验中,“掷出的点数大于6”,“掷出的点数是负数”等,它们在每次试验中都不会出现,都是不可能事件。
实质上必然事件就是在每次试验中都发生的事件,不可能事件就是在每次试验中都不发生的事件,必然事件与不可能事件的发生与否,已经失去了“不确定性”,即随机性,因而本质上不是随机事件,但为了讨论问题方便,还是将它看作随机事件。
例1.1.5 一批产品共10件,其中2件次品,其余为正品,从中任取3件,则,,,D={3件中至少有1件次品},这些都是随机事件,而为必然事件,为不可能事件。
对于这个随机试验来说,基本事件总数为个。
1.1.3 事件的关系与运算
对于随机试验而言,它的样本空间可以包含很多随机事件,概率论的任务之一就是研究随机事件的规律,通过对较简单事件规律的研究再掌握更复杂事件的规律,为此需要研究事件和事件之间的关系与运算。
若没有特殊说明,认为样本空间是给定的,且还定义了中的一些事件,等,由于随机事件是样本空间的子集,从而事件的关系与运算和集合的关系与运算完全类似。
1.事件的包含关系
定义1.1.1 若事件发生必然导致事件发生,则称事件包含,或称是的特款,也称为的子事件,记作或。
比如前面提到过的,这一事件就导致了事件的发生,因为摸到标号为6的球意味着标号为偶数的球出现了,所以。
可以给定义1.1.1一个几何解释,设样本空间是一个长方形,用一个圆表示一个随机事件,这类图形称为维恩(Venn)图。如图1-1所示,是两个事件,也就是说,它们是的子集,“发生必然导致发生”意味着属于的样本点都在中,由此可见,事件的含义与集合论是一致的。图1-1
特别地,对任何事件。
例1.1.6 设某种动物从出生活到20岁记为,从出生活到25岁记为,则,因为某种动物从出生活到25岁,肯定先要活到20岁。
2.事件的相等
定义1.1.2 设,若,同时有,称与相等,记为。易知相等的两个事件总是同时发生或同时不发生,在同一样本空间中两个事件相等意味着它们含有相同的样本点。
定价:57.5
ISBN:9787030578136
作者:无
版次:1
出版时间:2018-08
内容提要:
本书是“十三五”江苏省高等学校重点教材,内容包括引言、随机事件及概率、随机变量及其分布、随机变量的数字特征、大数定律与中心极限定理、数理统计的基本概念、参数估计、假设检验、方差分析及线性回归分析初步等内容。书中每节都安排了习题,习题分为两个部分,横线以上为基础题,横线以下部分为提高题,以适应不同层次学生的学习需求每章结尾都增设了本章概要、常用术语和常用公式,帮助学生复习。
目录:
目录
第二版前言
**版前言
引言 1
一、必然现象与随机现象 1
二、随机试验 1
三、概率论与数理统计的研究对象 2
四、概率论与数理统计发展简史 2
第1章随机事件及概率 4
1.1随机事件与样本空间 4
1.1.1基本事件与样本空间 4
1.1.2随机事件 5
1.1.3事件的关系与运算 6
1.1.4事件域 10
习题1.1 11
1.2概率定义及概率的性质 12
1.2.1概率的描述性定义 12
1.2.2概率的统计定义 12
1.2.3概率的公理化定义 14
1.2.4概率的性质 15
习题1.2 17
1.3古典概型与几何概型 18
1.3.1古典概型 18
1.3.2几何概型 23
习题1.3 26
1.4条件概率的计算公式 27
1.4.1条件概率 27
1.4.2乘法公式 28
1.4.3全概率公式 29
1.4.4贝叶斯公式 31
习题1.4 32
1.5独立性与伯努利概型 33
1.5.1事件的独立性 33
1.5.2伯努利概型 37
习题1.5 39
本章概要 40
常用术语 41
常用公式 41
第2章随机变量及其分布 43
2.1随机变量及分布函数 43
2.1.1随机变量及其分类 43
2.1.2一维随机变量的分布函数 44
2.1.3多维随机变量的联合分布函数 47
2.1.4随机变量的独立性 48
习题2.1 49
2.2离散型随机变量及其分布列 50
2.2.1一维离散型随机变量及分布列 50
2.2.2多维离散型随机变量及其联合分布列 56
2.2.3离散型随机变量的独立性 59
习题2.2 61
2.3连续型随机变量及其分布 63
2.3.1一维连续型随机变量 63
2.3.2二维连续型随机变量及其密度函数 69
2.3.3连续型随机变量的独立性条件 72
习题2.3 73
2.4随机变量函数的分布 74
2.4.1一维随机变量函数的分布 74
2.4.2连续型随机变量函数的分布 76
习题2.4 85
2.5条件分布 87
2.5.1条件分布的概念 87
2.5.2离散型随机变量的条件分布 88
2.5.3连续型随机变量的条件密度 91
习题2.5 93
本章概要 94
常用术语 94
常用公式 95
第3章随机变量的数字特征 101
3.1随机变量的数学期望 101
3.1.1数学期望的概念 101
3.1.2几种常用分布的期望 105
3.1.3随机变量函数的数学期望 107
3.1.4数学期望的性质 110
习题3.1 113
3.2随机变量的方差 114
3.2.1方差的概念 115
3.2.2几种常用分布的方差 115
3.2.3方差的性质 118
3.2.4切比雪夫不等式 120
习题3.2 121
3.3协方差、相关系数 122
3.3.1协方差 122
3.3.2相关系数 125
3.3.3矩 129
3.3.4协方差矩阵 129
3.3.5n维正态分布的概率密度 130
习题3.3 130
3.4条件期望与条件方差 132
3.4.1条件期望 132
3.4.2条件方差 135
习题3.4 136
本章概要 136
常用术语 137
常用公式 137
第4章大数定律与中心极限定理 140
4.1大数定律 140
4.1.1大数定律的意义 140
4.1.2几种常用大数定律 141
习题4.1 144
4.2随机变量序列的两种收敛性 145
4.2.1依概率收敛 145
4.2.2依分布收敛 149
习题4.2 150
4.3中心极限定理 151
4.3.1中心极限定理的概念 151
4.3.2独立同分布的中心极限定理 152
4.3.3棣莫弗-拉普拉斯中心极限定理 154
习题4.3 158
本章概要 158
常用术语 159
常用公式 159
第5章数理统计的基本概念 161
5.1总体与样本 161
5.1.1总体与个体 161
5.1.2简单随机样本 162
5.1.3参数与参数空间 163
习题5.1 164
5.2直方图与经验分布函数 164
5.2.1直方图 164
5.2.2经验分布函数 165
习题5.2 167
5.3统计量及其分布 167
5.3.1统计量的概念 168
5.3.2统计量的分布 169
5.3.3分位数 173
5.3.4正态总体的抽样分布 174
习题5.3 176
本章概要 178
常用术语 178
常用公式 178
第6章参数估计 180
6.1参数的点估计 180
6.1.1点估计的概念 180
6.1.2矩法估计 180
6.1.3极大似然估计 183
习题6.1 188
6.2估计量的评价准则 189
6.2.1无偏性 189
6.2.2*小方差性和有效性 192
6.2.3一致性(相合性) 195
习题6.2 195
6.3参数的区间估计 197
6.2.1区间估计的一般步骤 197
6.3.2单个正态总体参数的区间估计 198
6.3.3双正态总体参数的区间估计 201
习题6.3 203
本章概要 204
常用术语 204
常用公式 205
第7章假设检验 206
7.1假设检验的基本思想和程序 206
7.1.1假设检验的基本思想 206
7.1.2假设检验的程序 209
习题7.1 209
7.2正态总体参数的假设检验 210
7.2.1U检验 211
7.2.2T检验 217
7.2.3χ2检验 223
7.2.4F检验 226
习题7.2 228
7.3检验的实际意义及两类错误 230
7.3.1检验结果的实际意义 230
7.3.2检验中的两类错误 231
7.3.3样本容量确定问题 233
习题7.3 235
7.4非参数假设检验 235
7.4.1χ2拟合检验法 236
7.4.2独立性检验 240
习题7.4 243
本章概要 244
常用术语 244
常用公式 245
第8章方差分析及线性回归分析初步 246
8.1方差分析 246
8.1.1方差分析的基本原理 246
8.1.2单因子方差分析方法 247
8.1.3单因子方差分析中的参数估计 254
8.1.4二因子方差分析 255
习题8.1 261
8.2线性回归分析初步 263
8.2.1回归分析的相关概念 263
8.2.2一元线性回归 264
8.2.3多元线性回归 272
习题8.2 278
本章概要 279
常用术语 280
常用公式 280
习题答案 282
参考文献 301
附录常用分布表 302
附表1常用的概率分布、数学期望及方差 302
附表2标准正态分布表 303
附表3t分布表 304
附表4χ2分布表 305
附表6泊松分布表 314
附表7相关系数临界值表 315
在线试读:
引言
一、必然现象与随机现象
在自然界和人的实践活动中经常遇到各种各样的现象,这些现象大体可分为两类:一类是确定的,例如“在一个标准大气压下,纯水加热到100℃时必然沸腾”,“向上抛一块石头必然下落”,“同性电荷相斥,异性电荷相吸”等等,这种在一定条件下有确定结果的现象称为必然现象(确定性现象)。
另一类现象是随机的,例如,在相同的条件下,向上抛一枚质地均匀的硬币,其结果可能是正面朝上,也可能是反面朝上,不论如何控制抛掷条件,在每次抛掷之前无法肯定抛掷的结果是什么,这个试验多于一种可能结果,但是在试验之前不能肯定试验会出现哪一个结果。同样地,同一门大炮对同一目标进行多次射击(同一型号的炮弹),各次弹着点可能不尽相同,并且每次射击之前无法肯定弹着点的确切位置,以上所举的现象都具有随机性,即在一定条件下进行试验或观察会出现不同的结果(也就是说,多于一种可能的试验结果),而且在每次试验之前都无法预言会出现哪一个结果(不能肯定试验会出现哪一个结果),这种现象称为随机现象。
再看两个试验。
试验Ⅰ:一盒中有十个完全相同的白球,搅匀后从中摸出一球;
试验Ⅱ:一盒中有十个相同的球,其中5个白球,5个黑球,搅匀后从中任意摸取一球。
对于试验Ⅰ而言,在球没有取出之前,我们就能确定取出的球必是白球,也就是说在试验之前就能判定它只有一个确定的结果,这种现象就是必然现象(确定性现象)。
对于试验Ⅱ来说,在球没有取出之前,不能确定试验的结果(取出的球)是白球还是黑球,也就是说一次试验的结果(取出的球)出现白球还是黑球,在试验之前无法肯定。对于这一类试验而言,骤然一看,似乎没有什么规律而言,但是实践告诉我们,如果从盒子中反复多次取球(每次取一球,记录球的颜色后仍把球放回盒子中搅匀),那么总可以观察到这样的事实,当试验次数相当大时,出现白球的次数和出现黑球的次数是很接近的,比值会逐渐稳定于,出现这个事实是完全可以理解的,因为盒子中的黑球数与白球数相等,从中任意摸一球取得白球或黑球的“机会”相等。
试验Ⅱ所代表的类型,它有多于一种可能的结果,但在试验之前不能确定试验会出现哪一种结果,这类试验所代表的现象称为随机现象,对于试验而言,一次试验看不出什么规律,但是“大数次”地重复这个试验,试验的结果又遵循某些规律,这些规律称为“统计规律”。在客观世界中,随机现象是极为普遍的,例如“某地区的年降雨量”,“某电话交换台在单位时间内收到的用户的呼唤次数”,“一年全省的经济总量”等等,这些都是随机现象。
二、随机试验
如果一个试验满足下述条件:
(1)试验可以在相同的条件下重复进行(可重复性);
(2)试验的所有可能结果是明确的、可知道的(在试验之前就可以知道的),并且不止一个(明确性);
(3)每次试验总是恰好出现这些可能结果中的一个,但在一次试验之前却不能肯定这次试验出现哪一个结果(不确定性)。
称这样的试验是一个随机试验,为方便起见,也简称为试验,今后讨论的试验都是指随机试验。
三、概率论与数理统计的研究对象
概率论是从数量侧面研究随机现象及其统计规律性的数学学科,它的理论严谨,应用广泛,并且有独特的概念和方法,同时与其他数学分支有着密切的联系,是近代数学的重要组成部分。
数理统计是对随机现象统计规律归纳的研究,就是利用概率论的结果,深入研究统计资料,观察这些随机现象并发现其内在的规律性,进而作出一定精确程度的判断,将这些研究结果加以归纳整理,形成一定的数学模型。虽然概率论与数理统计在方法上有所不同,但作为一门学科,它们却相互渗透,相互联系。
概率论与数理统计这门学科的应用相当广泛,不仅在天文、气象、水文、地质、物理、化学、生物、医学等学科有其应用,而且在农业、工业、商业、军事、电信部门等也有广泛的应用。
四、概率论与数理统计发展简史
概率论被称为“赌博起家”的理论。
概率论产生于17世纪中叶,是一门比较古老的数学学科,有趣的是:尽管任何一门的数学分支的产生与发展都不外乎是生产、科学或数学自身发展的推动,但是概率论的产生,却起始于对赌博的研究,当时两个赌徒约定赌若干局,并且谁先赢c局便是赢家,若一个赌徒赢a局(a<c),另一赌徒赢b局(b<c)时终止赌博,问应当如何分赌本?*初正是一个赌徒将问题求教于帕斯卡,促使帕斯卡同费马讨论这个问题,从而他们共同建立了概率论的**基本概念—数学期望。
1657年惠更斯也给出了一个与他们类似的解法。
在他们之后,对于研究这种随机(或称偶然)现象规律的概率论做出了贡献的是伯努利家族的几位成员,雅各布给出了赌徒输光问题的详尽解法,并证明了被称为“大数定律”的一个定理(伯努利定理),这是研究偶然事件的古典概率论中极其重要的结果,它表明在大量观察中,事件的频率与概率是极其接近的。历史上**个发表有关概率论论文的人是伯努利,他于1713年发表了一篇关于极限定理的论文,概率论产生后的很长一段时间内都是将古典概型作为概率来研究的,直到1812年拉普拉斯在他的著作《分析概率论》中给出概率明确的定义,并且还建立了观察误差理论和*小二乘法估计法,从这时开始对概率的研究,实现了从古典概率论向近代概率论的转变。
概率论在20世纪再度迅速发展起来,这是由于科学技术发展迫切地需要研究有关一个或多个连续变化着的参变量的随机变数理论,即随机过程论,1906年俄国数学家马尔可夫(1856~1922)提出了所谓“马尔可夫链”的数学模型,对发展这一理论做出贡献的还有柯尔莫哥洛夫(苏联)、费勒(美国);1934年苏联数学家辛钦又提出了一种在时间中均匀进行着的平稳过程的理论。随机过程理论在科学技术中有着重要的应用,现在已建立了马尔可夫过程与随机微分方程之间的联系。
1960年,卡尔曼(1930~2016)建立了数字滤波论,进一步发展了随机过程在制导系统中的应用。1917年苏联科学家伯恩斯坦首先给出了概率论的公理体系。1933年柯尔莫哥洛夫又以更完整的形式提出了概率论的公理结构,从此,更现代意义上的完整的概率论臻于完成。
相对于其他许多数学分支而言,数理统计是一个比较年轻的数学分支,它是研究怎样去有效地收集、整理和分析带有随机性的数据,以对所观察的问题作出推断或预测,直至为采取一定的决策和行动提供依据与建议。数理统计学是伴随着概率论的发展而发展起来的。当人们认识到必须把数据看成是来自具有一定概率分布的总体,所研究的对象是这个总体而不能局限于数据本身之日,也就是数理统计学诞生之时(确切时间至今难定论)。
从现有资料看,19世纪中叶以前已出现了若干重要工作,特别是高斯和勒让德关于观测数据误差分析和*小二乘法的研究。到19世纪末,经过包括皮尔逊在内的一些学者的努力,这门学科已经开始形成。
数理统计学发展成一门成熟的学科,则是20世纪上半叶的事,它很大程度上要归功于皮尔逊、费希尔等的工作。特别是费希尔的贡献,对这门学科的建立起了决定性的作用。1946年,克拉默发表的《统计学数学方法》,是**部严谨且比较系统的数理统计学著作,可以把它作为数理统计学进入成熟阶段的标志。
我国的概率论研究起步较晚,从1957年开始,先驱者是许宝騄先生。1957年暑期许老师在北京师范大学举办了一个概率论与数理统计的讲习班,从此,我国对概率论与数理统计的研究有了较大的发展。现在概率论与数理统计是数学系各专业的必修课之一,也是工科、经济类专业学生的公共课,许多高校都设了统计学(特别是财经类高校)。近年来,我国科学家对概率论与数理统计也取得了较大的成果。
第1章 随机事件及概率
1.1 随机事件与样本空间
随机事件与样本空间是概率论中的两个*基本的概念。
1.1.1 基本事件与样本空间
对于随机试验来说,我们感兴趣的往往是随机试验的所有可能结果。例如,掷一枚硬币,我们关心的是出现正面还是出现反面这两个可能结果。若观察的是掷两枚硬币的试验,则可能出现的结果有(正、正),(正、反),(反、正),(反、反)四种,如果掷三枚硬币,其结果还要复杂,但还是可以将它们描述出来的,总之为了研究随机试验,必须知道随机试验的所有可能结果。
1.基本事件
通常,根据我们研究的目的,将随机试验的每一个可能的结果,称为基本事件。因为随机试验的所有可能结果是明确的,从而所有的基本事件也是明确的。例如,在抛掷硬币的试验中“出现反面”“出现正面”是两个基本事件;又如,在掷骰子试验中“出现一点”,“出现两点”,“出现三点”,…,“出现六点”都是基本事件。
2.样本空间
基本事件的全体,称为样本空间。也就是试验所有可能结果的全体是样本空间,样本空间通常用大写的希腊字母表示,中的点即基本事件,也称为样本点,常用表示,有时也用A,B,C等表示。
在具体问题中,给定样本空间是研究随机现象的**步。
例1.1.1 一盒中有十个完全相同的球,分别有号码,从中任取一球,观察其标号,写出其样本空间。
解其中,为基本事件(样本点)。
例1.1.2 写出下列试验的样本空间:
(1)同时抛掷红色与白色的骰子各一粒,记录其向上一面(简称出现)的点数;
(2)同时抛掷两粒骰子,记录出现的点数之和。
解 (1)用有序数组表示红色骰子出现点,白色骰子出现点,则样本空间可表示为共36个样本点;
(2)试验和(1)类似,但观察的内容不相同,其样本点也不相同,不难看出(2)的样本空间可表示为。
例1.1.1和例1.1.2讨论的样本空间只有有限个样本点,是比较简单的样本空间。
例1.1.3 讨论某寻呼台在单位时间内收到的呼叫次数,可能结果一定是非负整数而且很难制定一个数为它的上界。这样就可以把样本空间取为。
这样的样本空间含有无穷个样本点,但这些样本点可以依照某种顺序排列起来,称它为可列样本空间。
例1.1.4 讨论某地区的气温时自然把样本空间取为或,这样的样本空间含有无穷个样本点,它充满一个区间,称它为无穷样本空间。
从这些例子可以看出,样本空间是由试验完全确定的。随着问题的不同,样本空间可以相当 简单,也可以相当复杂。在今后的讨论中,都认为样本空间是预先给定的。
注意 对于一个实际问题或一个随机现象,考虑问题的角度不同,样本空间也可能选择得不同。
例如,掷骰子这个随机试验,若考虑的是出现的点数,则样本空间;若考虑的是出现奇数点还是出现偶数点,则样本空间。
由此说明,同一个随机试验可以有不同的样本空间。在实际问题中,选择恰当的样本空间来研究随机现象是概率论中值得研究的一个问题。
1.1.2 随机事件
随机试验总有一定的观察目的,除了考察其所有可能结果组成的样本空间外,还需观察其他各种各样的结果。如在例1.1。1中,样本空间,研究下面这些问题:
其中为一个基本事件,而与则由基本事件所组成。
例如,发生(出现)必须而且只需下列样本点之一发生,它由五个基本事件组成。
同样地,发生必须而且只需下列样本点之一发生。
这些结果在一次试验中既可能发生,也可能不发生,体现了随机性。这样的结果称为随机事件,简称事件。习惯上用大写英文字母等表示,在试验中如果出现中包含了某一个基本事件,则称作发生,并记作。
我们知道,样本空间包含了全体基本事件(样本点),而随机事件不过是由某些特征的基本事件组成的,从集合论的角度来看,一个随机事件不过是样本空间的一个子集而已。
如例1.1.1中,显然都是的子集,它们可以简单地表示为
因为由所有基本事件组成,所以在一次试验中,必然要出现中的某一基本事件,即,也就是在试验中必然要发生(出现),今后用表示一个必然事件,它本身就是的子集。例如,掷骰子这个随机试验,“掷出的点数不小于1”,“掷出的点数是自然数”等,它们在每次试验中必然出现,都是必然事件。
相应地,空集在任意一次试验中不能有,也就是说永远不可能发生,所以称为不可能事件。又如,在掷骰子这个试验中,“掷出的点数大于6”,“掷出的点数是负数”等,它们在每次试验中都不会出现,都是不可能事件。
实质上必然事件就是在每次试验中都发生的事件,不可能事件就是在每次试验中都不发生的事件,必然事件与不可能事件的发生与否,已经失去了“不确定性”,即随机性,因而本质上不是随机事件,但为了讨论问题方便,还是将它看作随机事件。
例1.1.5 一批产品共10件,其中2件次品,其余为正品,从中任取3件,则,,,D={3件中至少有1件次品},这些都是随机事件,而为必然事件,为不可能事件。
对于这个随机试验来说,基本事件总数为个。
1.1.3 事件的关系与运算
对于随机试验而言,它的样本空间可以包含很多随机事件,概率论的任务之一就是研究随机事件的规律,通过对较简单事件规律的研究再掌握更复杂事件的规律,为此需要研究事件和事件之间的关系与运算。
若没有特殊说明,认为样本空间是给定的,且还定义了中的一些事件,等,由于随机事件是样本空间的子集,从而事件的关系与运算和集合的关系与运算完全类似。
1.事件的包含关系
定义1.1.1 若事件发生必然导致事件发生,则称事件包含,或称是的特款,也称为的子事件,记作或。
比如前面提到过的,这一事件就导致了事件的发生,因为摸到标号为6的球意味着标号为偶数的球出现了,所以。
可以给定义1.1.1一个几何解释,设样本空间是一个长方形,用一个圆表示一个随机事件,这类图形称为维恩(Venn)图。如图1-1所示,是两个事件,也就是说,它们是的子集,“发生必然导致发生”意味着属于的样本点都在中,由此可见,事件的含义与集合论是一致的。图1-1
特别地,对任何事件。
例1.1.6 设某种动物从出生活到20岁记为,从出生活到25岁记为,则,因为某种动物从出生活到25岁,肯定先要活到20岁。
2.事件的相等
定义1.1.2 设,若,同时有,称与相等,记为。易知相等的两个事件总是同时发生或同时不发生,在同一样本空间中两个事件相等意味着它们含有相同的样本点。