商品详情
书名:数理统计
定价:38.0
ISBN:9787030368652
作者:赵彦晖 著作
版次:1
出版时间:2013-05
内容提要:
本书比较系统地介绍了数理统计的基本概念、基本原理和基本方法.全书共6章,内容包括样本与抽样分布、参数估计、假设检验、方差分析、回归分析和数理统计的MATLAB命令实现.
本书简明易懂,概念引人自然实用,易于教学.在讲述统计方法时,尽量采用图表形式,既减少篇幅,又易于学生理解和掌握.
目录:
目录
前言
第1章 样本与抽样分布 1
1.1基本概念 1
1.1.1 总体与样本 1
1.1.2统计量与样本矩 2
1.1.3计算器的使用 4
1.2基本分布 6
1.2.1 标准正态分布 6
1.2.2 x2分布 6
1.2.3 t分布 11
1.2.4 F分布 13
1.3 正态总体的抽样分布 14
1.3.1 一个正态总体的情况 15
1.3.2 两个正态总体的情况 16
习题1 18
第2章 参数估计 21
2.1 参数的点估计 21
2.1.1 矩估计法 21
2.1.2 极大似然估计法 23
2.2 估计量的评价标准 28
2.2.1 相合性 28
2.2.2 无偏性 28
2.2.3 有效性 29
2.3 参数的区间估计 36
2.3.1 一个正态总体均值的区问估汁(方差已知时) 37
2.3.2 一个正态总体均值的区间估计(方差未知时) 38
2.3.3 大样本非正态总体均值的区间估计 40
2.3.4 一个正态总体方差的区问估计 40
2.3.5 两个正态总体均值差的区间估计 42
2.3.6 两个正态总体方差比的区问估计 43
2.4 总体分布的估计 45
2.4.1 经验分布函数 45
2.4.2 经验分布律 45
2.4.3 经验分布密度 46
习题2 48
第3章 假设检验 52
3.1 假设检验的基本概念 52
3.1.1 假设检验的基本思想和推理方法 52
3.1.2 假设检验的一般步骤 54
3.1.3 两类错误 55
3.2 参数的假设检验 56
3.2.1 一个正态总体均值的假设检验(方差已知时) 56
3.2.2 一个正态总体均值的假设检验(方差未知时) 57
3.2.3 大样本非正态总体均值的假设检验 59
3.2.4 一个正态总体方差的假设检验 59
3.2.5 两个正态总体均值的假设检验 61
3.2.6 两个正态总体方差的假设检验 63
3.3总体分布的假设检验 65
习题3 68
第4章 方差分析 72
4.1 一元方差分析 72
4.1.1 问题的提 72
4.1.2 离差分解与抽样分布 73
4.1.3 检验方法 76
4.1.4 元方差分析模型的重新认识 78
4.1.5 两种水平均值差的置信区间 80
4.2 二元方差分析 81
4.2.1 等重复试验的二元方差分析 81
4.2.2 非重复试验的二元方差分析 88
习题4 92
第5章 回归分析 95
5.1 回归分析的基本概念 95
5.1.1 相关关系 95
5.1.2 回归方程 96
5.1.3 *小二乘法 96
5.2 元线性回归模型 97
5.2.1 参数a,b的无偏估计及其分布 98
5.2.2 参数σ2的无偏估计及其分布 IOO
5.2.3 元线性回归参数的计算 102
5.3 元线性回归中的假设检验与预测 105
5.3.1 线性相关关系的显著性检验 105
5.3.2 利用线性同归模型进行预测 105
5.4 可线性化的一元非线性回归分析 109
习题5 112
第6章 数理统计的MATLAB命令实现 115
6.1 数理统计的基本命令 115
6.1.1 排列组合的计算 115
6.1.2 常用统计量 116
6.1.3 常用的随机生成数 118
6.1.4 协方差和相关系数 119
6.1.5 经验分布函数与概率图纸 120
6.2 常用的随机分布 121
6.2.1 离散型随机变量的随机生成 121
6.2.2 连续型随机变量的随机生成 122
6.2.3 连续型随机变量密度函数的计算 124
6.2.4 连续型随机变量分布函数值的计算 126
6.2.5 连续型随机变量分位数的计算 128
6.3 正态总体的参数估计 129
6.4 假设检验 130
6.4.1 方差已知时单个正态总体均值的检验法——U榆验法 130
6.4.2 方差未知时单个正态总体均值的检验法——t检验法 131
6.4.3 两个正态总体均值差的检验法——t检验法 132
6.5 方差分析 132
6.5.1 一元方差分析 132
6.5.2 二元方差分析 134
6.6 回归分析 135
6.6.1 一元/多元线性回归 135
6.6.2 非线性同归 137
部分习题参考答案 138
参考文献 142
附录 概率论内容梗概 143
A.1 随机事件及其概率 143
A.1.1 基本概念 143
A.1.2 事件问的关系与运算规律 143
A.1.3 事件的频率及其性质 144
A.1.4 事件的概率及其性质 144
A.1.5 随机事件的概率计算 145
A.1.6 关于事件独立性的定义与性质 146
A.2 随机变量及其分布 146
A.2.1 基本概念 146
A.2.2 分布函数、分布律及分布密度的定义、性质与计算 147
A.2.3 构成分布函数、分布律及分布密度的充要条件 147
A.2.4 概率论与数理统计巾的常用分布 147
A.2.5 利用已知分布计算概率 148
A.2.6 正态分布的重要性质 148
A.3 随机向量及其分布 148
A.3.1 基本概念 149
A.3.2 有关分布函数的定义、性质与计算 149
A.3.3 有关分布律的定义、性质与计算 150
A.3.4 有关分布密度的定义、性质与计算 150
A.3.5 构成分布函数、分布律及分布密度的充要条件 151
A.3.6 关于随机变量独立的定义与性质 151
A.3.7 二维正态分布的重要性质 152
A.4 随机变量的函数及其分布 152
A.4.1 随机变量函数的分布函数 152
A.4.2 离散型随机变量函数的分布律 153
A.4.3 连续型随机变量函数的分布密度 153
A.4.4 两种典型随机变量函数的分布 154
A.4.5 正态分布的重要性质 154
A.5 随机变量的数字特征 155
A.5.1 数学期望的定义、性质与计算 155
A.5.2 方差与协方差的定义、性质与计算 155
A.5.3 原点矩与巾心矩 156
A.5.4 常用分布的数学期望与方差 156
A.6 大数定律与中心极限定理 156
A.6.1 人数定律与巾心极限定理 157
A.6.2 实际推断原理 157
A.6.3 概率计算 158
附表 159
附表1 常用分布及其数学期望与方差表 159
附表2 泊松分布表 160
附表3 标准正态分布表 162
附表4 t分布的上侧分位数tα(n)表 163
附表5 x2分布的上侧分位数X2(n)表 164
附表6 F分布的上侧分位数Fα(n1,n2)表 166
附表7 正态总体均值和方差的区间估计表 170
附表8 正态总体均值和方差的假设检验表 172
在线试读:
第1章 样本与抽样分布
和概率论一样,数理统计也是研究随机现象统计规律性的一门数学学科.二者的区别在于概率论是在已知随机变量服从某种分布的情况下,研究随机变量分布(如分布函数、分布律、分布密度等)的性质和随机变量的数字特征(如数学期望、方差、相关系数等)的性质及其应用.而数理统计则是以概率论为基础,研究如何合理地采集或收集资料,并根据观测得到的资料对随机变量的分布、数字特征等作出科学的推断.
1.1 基本概念
从理论上讲,只要对随机现象进行足够多次的试验,被研究的随机现象的规律性就能清楚地呈现出来,但实际上,试验的次数只能是有限的,有时甚至是很少的,凶为采集某些数据时,常要将研究的对象破坏.例如,观测灯泡的寿命时,就一定要把它用坏;检查炮弹性能时,就需要将它发射出去,有时即使不破坏对象,时问、财力和人力也不允许.特别当信息具有很强的时效性时,旷日持久的大量检查或试验,只能获得陈旧的、毫无意义的信息,因此,数理统计要研究的问题便是怎样选择有效的抽样方法采集数据(抽样),并利用抽样获得的有限数据,对被研究的随机现象的规律性作出尽可能精确而可靠的结论(推断).
在数理统计中研究的基本问题有四个:参数估计、假设检验、方差分析和回归分析,为此,先引入几个基本概念.
1.1.1 总体与样本
在数理统计中,通常把所研究对象的全体称为总体(或母体),而把组成总体的每个元素称为个体,例如,某工厂生产的灯泡的寿命就是一个总体,而每个灯泡的寿命则是一个个体.
代表总体的指标(如灯泡寿命、钢筋强度等)的取值都有一定的随机性,因此,它们都是随机变量.所以,总体就是某个随机变量可能取值的全体,常用X,Y,Z(或∈,7,})等表示,总体的概率分布就是该随机变量的概率分布.
从总体X中抽取一个个体,就是对代表总体的随机变量X进行一次试验(观测).从总体巾随机地抽取九个个体:
(1.1)
就是对随机变量X进行了一组试验.通常把由这n个试验组成的试验组(1.1)称为总体X的一个样本(或子样),样本小个体的数目n称为样本容量,其中Xi称为样本的第i个分量.
由于每个X,都是从总体X中随机抽取的,在抽取之前,它可能取得X所有可能取值中的任何一个,可见这里的每个X,都是一个随机变量,因此(X1,X2,…,Xn)就是一个n维随机变量.在抽取之后,每一个Xi的值已完全确定,它是一个数,是对Xi的一次观测值,记作xi,这时称
(1.2)
为样本(1.1)的一个观测值,简称样本观测值.
我们抽取样本的目的是为了对总体的分布进行分析和推断,因此要求抽样具有代表性,即应使总体的每个个体都有同等的机会被抽到,或每个样本分量X都与总体X有相同的概率分布.此外,还要求抽样必须是独立的,即要求样本X1,X2,…,Xn为相互独立的随机变量,或每个分量的观测结果不影响其他分量的观测结果,也不受其他观测结果的影响.这样抽取的样本称为简单随机样本.获得简单随机样本的方法称为简单随机抽样.今后,凡是提到样本和抽样,都是指简单随机样本和简单随机抽样.
1.1.2 统计量与样本矩
样本来自总体,是总体的代表,是统计推断的依据,但是我们抽取样本之后,并不直接用样本进行推断,而常需要对样本进行一番加工和提炼,把样本中包含的我们所关心的信息集中起来,以便对总体的某种特性作推断.
例如,当我们取得总体X的一个样本X1,X2,…,Xn时,常构造样本的平均值
来推断总体的均值.当然,为了推断总体的其他特性,还要用到样本的其他函数.为此,我们引入下面的定义.
定义1.1.1 设X1,X2,…,Xn是来自总体X的一个样本,如果函数为的一个实值函数,且(P中不包含任何米知参数,那么称
(1.3)
为一个统计量.
由于构成统计量(1.3)的X1,X2,…,Xn是随机变量,所以,作为n维随机变量的函数,统计量也是随机变量.
若为样本的一个观测值,则称
(1.4)
为统计量(1.3)的一个观测值.
例1.1.1 设X1,X2,…,Xn为来自正态总体N(μ,σ2)的样本,则当μ已知,σ未知时,样本均值X,Y= X1+X2和
都是统计量,而
不是统计量(因为它包含未知参数σ).
数理统计中,常用的统计量有
(1.8)
它们分别称为样本均值、样本方差、样本标准差、样本足阶原点矩和样本k阶中心矩,当取为样本X1,X2,…,Xn的观测值时,这些统计量的观测值分别为
显然上述统计量之间有如下的关系:
(1.11)
应用中还有一种常用的统计量称为次序统计量,设X1,X2,…,Xn是取自总体X的样本,是相应的观测值,把它们由小到大排列并用z(1),z(2),…,z(n)表示,即
取值为的变量都是X1,X2,…,Xn的函数,记作,显然,都是统计量,称它们为次序统计量,其中的X(1)称为*小次序统计量,称为*大次序统计量,次序统计量满足关系
(1.12)
它们的观测值为.由次序统计量构成的
(1.13)
和
(1.111)
分别称为样本中位数和样本极差,它们也是常用统计量.
1.1.3 计算器的使用
应用中,可用计算器方便地计算出某些常用统计量的值.常见的学生计算器型号有北雁C2-118B、学考XK-80、三帝DDD118B、天雁TY-82MS,信康SC-82MS、海进HJ-82MSC等,下面分功能介绍如何使用各种计算器计算某些统计量的值.
(1)进入统计计算状态
类型1:按并选择1进入统计计算状态,屏幕上出现STAT.
类型2:按选择2进入统计计算功能状态,屏幕上出现SD.
类型3:按进入统计计算状态,屏幕上出现STAT.
类型4:按进入统计计算状态,屏幕上出现SD.
类型5:按进入统计计算状态,屏幕上出现SD.
(2)输入数据(或样本观测值)x1,x2,xn
类型1:输入即可.
类型2:输入即可.
若某个数字xi重复多次出现,则可一次输入多个,其方法是
类型1:输入重复次数.
类型2:输入(即)重复次数.
(3)清除某个错误数据
如果输入过程中发现某个数字xi输入错误,则可通过下列方法清除:
类型1:输入(即).
类型2:输入(即).
类型3:输入(即).
(4)获取统计量的值
类型1:按获得样本均值x;
按获得样本标准差s.
类型2:按获得样本均值x;
按获得样本标准差s.
类型3:按匡习国目获得样本均值x.
按获得样本标准差s.
其他统计量按相应的键名类似获得,其中(或)代表样本二阶中心矩的平方根.
(5)清空统计数据
一般计算器都有统计数据记忆功能,如果不进行清空操作,则在下次统计(哪怕重新开机)时计算器会将以前记忆的数据与新输入的数据合并成一组进行统计计算,因此,在统计一组新数据时常需要清空以前输入的数据,为新一组数据的统计计算做好准备.其方法是
类型1:按.
类型2:按.
类型3:按.
类型4:按.
这时屏幕上STAT(或SD)消失,以前输入的数据全部被清除.
当然,上述列举的操作方法并不是全部,不同计算器有不同的操作方法,也许是某两种类型的组合.随着科技的发展,计算器也在不断更新,功能也越来越强,其操作方法也在不断改进.因此,具体的操作方法应以厂家提供的说明书为准.
1.2 基本分布
本节介绍在数理统计中常用的几个基本分布.为此,先引进分位数定义.
定义1.2.1 设X为随机变量,则称满足
(1.15)
的Vα为X的上侧α分位数,简称为(上侧)分位数.
1.2.1 标准正态分布
标准正态分布N(0,1)是构造其他分布的基础,其密度函数为
(1.16)
图1.1 上侧分位数μ。
它的图形关于y轴对称(图1.1).
本书附表3给出了标准正态分布函数的取值情况.对于数d(0<d<1),通过查表,可求出满足等式
(1.17)
的上侧分位数uα(显然).当a=0.020时,可查得.
1.2.2 x2分布
定理1.2.1设X1,X2,…,Xn是独立同分布的随机变量,且都服从标准正态分布N(0,1),则它们的平方和
(1.18)
的分布密度是
定价:38.0
ISBN:9787030368652
作者:赵彦晖 著作
版次:1
出版时间:2013-05
内容提要:
本书比较系统地介绍了数理统计的基本概念、基本原理和基本方法.全书共6章,内容包括样本与抽样分布、参数估计、假设检验、方差分析、回归分析和数理统计的MATLAB命令实现.
本书简明易懂,概念引人自然实用,易于教学.在讲述统计方法时,尽量采用图表形式,既减少篇幅,又易于学生理解和掌握.
目录:
目录
前言
第1章 样本与抽样分布 1
1.1基本概念 1
1.1.1 总体与样本 1
1.1.2统计量与样本矩 2
1.1.3计算器的使用 4
1.2基本分布 6
1.2.1 标准正态分布 6
1.2.2 x2分布 6
1.2.3 t分布 11
1.2.4 F分布 13
1.3 正态总体的抽样分布 14
1.3.1 一个正态总体的情况 15
1.3.2 两个正态总体的情况 16
习题1 18
第2章 参数估计 21
2.1 参数的点估计 21
2.1.1 矩估计法 21
2.1.2 极大似然估计法 23
2.2 估计量的评价标准 28
2.2.1 相合性 28
2.2.2 无偏性 28
2.2.3 有效性 29
2.3 参数的区间估计 36
2.3.1 一个正态总体均值的区问估汁(方差已知时) 37
2.3.2 一个正态总体均值的区间估计(方差未知时) 38
2.3.3 大样本非正态总体均值的区间估计 40
2.3.4 一个正态总体方差的区问估计 40
2.3.5 两个正态总体均值差的区间估计 42
2.3.6 两个正态总体方差比的区问估计 43
2.4 总体分布的估计 45
2.4.1 经验分布函数 45
2.4.2 经验分布律 45
2.4.3 经验分布密度 46
习题2 48
第3章 假设检验 52
3.1 假设检验的基本概念 52
3.1.1 假设检验的基本思想和推理方法 52
3.1.2 假设检验的一般步骤 54
3.1.3 两类错误 55
3.2 参数的假设检验 56
3.2.1 一个正态总体均值的假设检验(方差已知时) 56
3.2.2 一个正态总体均值的假设检验(方差未知时) 57
3.2.3 大样本非正态总体均值的假设检验 59
3.2.4 一个正态总体方差的假设检验 59
3.2.5 两个正态总体均值的假设检验 61
3.2.6 两个正态总体方差的假设检验 63
3.3总体分布的假设检验 65
习题3 68
第4章 方差分析 72
4.1 一元方差分析 72
4.1.1 问题的提 72
4.1.2 离差分解与抽样分布 73
4.1.3 检验方法 76
4.1.4 元方差分析模型的重新认识 78
4.1.5 两种水平均值差的置信区间 80
4.2 二元方差分析 81
4.2.1 等重复试验的二元方差分析 81
4.2.2 非重复试验的二元方差分析 88
习题4 92
第5章 回归分析 95
5.1 回归分析的基本概念 95
5.1.1 相关关系 95
5.1.2 回归方程 96
5.1.3 *小二乘法 96
5.2 元线性回归模型 97
5.2.1 参数a,b的无偏估计及其分布 98
5.2.2 参数σ2的无偏估计及其分布 IOO
5.2.3 元线性回归参数的计算 102
5.3 元线性回归中的假设检验与预测 105
5.3.1 线性相关关系的显著性检验 105
5.3.2 利用线性同归模型进行预测 105
5.4 可线性化的一元非线性回归分析 109
习题5 112
第6章 数理统计的MATLAB命令实现 115
6.1 数理统计的基本命令 115
6.1.1 排列组合的计算 115
6.1.2 常用统计量 116
6.1.3 常用的随机生成数 118
6.1.4 协方差和相关系数 119
6.1.5 经验分布函数与概率图纸 120
6.2 常用的随机分布 121
6.2.1 离散型随机变量的随机生成 121
6.2.2 连续型随机变量的随机生成 122
6.2.3 连续型随机变量密度函数的计算 124
6.2.4 连续型随机变量分布函数值的计算 126
6.2.5 连续型随机变量分位数的计算 128
6.3 正态总体的参数估计 129
6.4 假设检验 130
6.4.1 方差已知时单个正态总体均值的检验法——U榆验法 130
6.4.2 方差未知时单个正态总体均值的检验法——t检验法 131
6.4.3 两个正态总体均值差的检验法——t检验法 132
6.5 方差分析 132
6.5.1 一元方差分析 132
6.5.2 二元方差分析 134
6.6 回归分析 135
6.6.1 一元/多元线性回归 135
6.6.2 非线性同归 137
部分习题参考答案 138
参考文献 142
附录 概率论内容梗概 143
A.1 随机事件及其概率 143
A.1.1 基本概念 143
A.1.2 事件问的关系与运算规律 143
A.1.3 事件的频率及其性质 144
A.1.4 事件的概率及其性质 144
A.1.5 随机事件的概率计算 145
A.1.6 关于事件独立性的定义与性质 146
A.2 随机变量及其分布 146
A.2.1 基本概念 146
A.2.2 分布函数、分布律及分布密度的定义、性质与计算 147
A.2.3 构成分布函数、分布律及分布密度的充要条件 147
A.2.4 概率论与数理统计巾的常用分布 147
A.2.5 利用已知分布计算概率 148
A.2.6 正态分布的重要性质 148
A.3 随机向量及其分布 148
A.3.1 基本概念 149
A.3.2 有关分布函数的定义、性质与计算 149
A.3.3 有关分布律的定义、性质与计算 150
A.3.4 有关分布密度的定义、性质与计算 150
A.3.5 构成分布函数、分布律及分布密度的充要条件 151
A.3.6 关于随机变量独立的定义与性质 151
A.3.7 二维正态分布的重要性质 152
A.4 随机变量的函数及其分布 152
A.4.1 随机变量函数的分布函数 152
A.4.2 离散型随机变量函数的分布律 153
A.4.3 连续型随机变量函数的分布密度 153
A.4.4 两种典型随机变量函数的分布 154
A.4.5 正态分布的重要性质 154
A.5 随机变量的数字特征 155
A.5.1 数学期望的定义、性质与计算 155
A.5.2 方差与协方差的定义、性质与计算 155
A.5.3 原点矩与巾心矩 156
A.5.4 常用分布的数学期望与方差 156
A.6 大数定律与中心极限定理 156
A.6.1 人数定律与巾心极限定理 157
A.6.2 实际推断原理 157
A.6.3 概率计算 158
附表 159
附表1 常用分布及其数学期望与方差表 159
附表2 泊松分布表 160
附表3 标准正态分布表 162
附表4 t分布的上侧分位数tα(n)表 163
附表5 x2分布的上侧分位数X2(n)表 164
附表6 F分布的上侧分位数Fα(n1,n2)表 166
附表7 正态总体均值和方差的区间估计表 170
附表8 正态总体均值和方差的假设检验表 172
在线试读:
第1章 样本与抽样分布
和概率论一样,数理统计也是研究随机现象统计规律性的一门数学学科.二者的区别在于概率论是在已知随机变量服从某种分布的情况下,研究随机变量分布(如分布函数、分布律、分布密度等)的性质和随机变量的数字特征(如数学期望、方差、相关系数等)的性质及其应用.而数理统计则是以概率论为基础,研究如何合理地采集或收集资料,并根据观测得到的资料对随机变量的分布、数字特征等作出科学的推断.
1.1 基本概念
从理论上讲,只要对随机现象进行足够多次的试验,被研究的随机现象的规律性就能清楚地呈现出来,但实际上,试验的次数只能是有限的,有时甚至是很少的,凶为采集某些数据时,常要将研究的对象破坏.例如,观测灯泡的寿命时,就一定要把它用坏;检查炮弹性能时,就需要将它发射出去,有时即使不破坏对象,时问、财力和人力也不允许.特别当信息具有很强的时效性时,旷日持久的大量检查或试验,只能获得陈旧的、毫无意义的信息,因此,数理统计要研究的问题便是怎样选择有效的抽样方法采集数据(抽样),并利用抽样获得的有限数据,对被研究的随机现象的规律性作出尽可能精确而可靠的结论(推断).
在数理统计中研究的基本问题有四个:参数估计、假设检验、方差分析和回归分析,为此,先引入几个基本概念.
1.1.1 总体与样本
在数理统计中,通常把所研究对象的全体称为总体(或母体),而把组成总体的每个元素称为个体,例如,某工厂生产的灯泡的寿命就是一个总体,而每个灯泡的寿命则是一个个体.
代表总体的指标(如灯泡寿命、钢筋强度等)的取值都有一定的随机性,因此,它们都是随机变量.所以,总体就是某个随机变量可能取值的全体,常用X,Y,Z(或∈,7,})等表示,总体的概率分布就是该随机变量的概率分布.
从总体X中抽取一个个体,就是对代表总体的随机变量X进行一次试验(观测).从总体巾随机地抽取九个个体:
(1.1)
就是对随机变量X进行了一组试验.通常把由这n个试验组成的试验组(1.1)称为总体X的一个样本(或子样),样本小个体的数目n称为样本容量,其中Xi称为样本的第i个分量.
由于每个X,都是从总体X中随机抽取的,在抽取之前,它可能取得X所有可能取值中的任何一个,可见这里的每个X,都是一个随机变量,因此(X1,X2,…,Xn)就是一个n维随机变量.在抽取之后,每一个Xi的值已完全确定,它是一个数,是对Xi的一次观测值,记作xi,这时称
(1.2)
为样本(1.1)的一个观测值,简称样本观测值.
我们抽取样本的目的是为了对总体的分布进行分析和推断,因此要求抽样具有代表性,即应使总体的每个个体都有同等的机会被抽到,或每个样本分量X都与总体X有相同的概率分布.此外,还要求抽样必须是独立的,即要求样本X1,X2,…,Xn为相互独立的随机变量,或每个分量的观测结果不影响其他分量的观测结果,也不受其他观测结果的影响.这样抽取的样本称为简单随机样本.获得简单随机样本的方法称为简单随机抽样.今后,凡是提到样本和抽样,都是指简单随机样本和简单随机抽样.
1.1.2 统计量与样本矩
样本来自总体,是总体的代表,是统计推断的依据,但是我们抽取样本之后,并不直接用样本进行推断,而常需要对样本进行一番加工和提炼,把样本中包含的我们所关心的信息集中起来,以便对总体的某种特性作推断.
例如,当我们取得总体X的一个样本X1,X2,…,Xn时,常构造样本的平均值
来推断总体的均值.当然,为了推断总体的其他特性,还要用到样本的其他函数.为此,我们引入下面的定义.
定义1.1.1 设X1,X2,…,Xn是来自总体X的一个样本,如果函数为的一个实值函数,且(P中不包含任何米知参数,那么称
(1.3)
为一个统计量.
由于构成统计量(1.3)的X1,X2,…,Xn是随机变量,所以,作为n维随机变量的函数,统计量也是随机变量.
若为样本的一个观测值,则称
(1.4)
为统计量(1.3)的一个观测值.
例1.1.1 设X1,X2,…,Xn为来自正态总体N(μ,σ2)的样本,则当μ已知,σ未知时,样本均值X,Y= X1+X2和
都是统计量,而
不是统计量(因为它包含未知参数σ).
数理统计中,常用的统计量有
(1.8)
它们分别称为样本均值、样本方差、样本标准差、样本足阶原点矩和样本k阶中心矩,当取为样本X1,X2,…,Xn的观测值时,这些统计量的观测值分别为
显然上述统计量之间有如下的关系:
(1.11)
应用中还有一种常用的统计量称为次序统计量,设X1,X2,…,Xn是取自总体X的样本,是相应的观测值,把它们由小到大排列并用z(1),z(2),…,z(n)表示,即
取值为的变量都是X1,X2,…,Xn的函数,记作,显然,都是统计量,称它们为次序统计量,其中的X(1)称为*小次序统计量,称为*大次序统计量,次序统计量满足关系
(1.12)
它们的观测值为.由次序统计量构成的
(1.13)
和
(1.111)
分别称为样本中位数和样本极差,它们也是常用统计量.
1.1.3 计算器的使用
应用中,可用计算器方便地计算出某些常用统计量的值.常见的学生计算器型号有北雁C2-118B、学考XK-80、三帝DDD118B、天雁TY-82MS,信康SC-82MS、海进HJ-82MSC等,下面分功能介绍如何使用各种计算器计算某些统计量的值.
(1)进入统计计算状态
类型1:按并选择1进入统计计算状态,屏幕上出现STAT.
类型2:按选择2进入统计计算功能状态,屏幕上出现SD.
类型3:按进入统计计算状态,屏幕上出现STAT.
类型4:按进入统计计算状态,屏幕上出现SD.
类型5:按进入统计计算状态,屏幕上出现SD.
(2)输入数据(或样本观测值)x1,x2,xn
类型1:输入即可.
类型2:输入即可.
若某个数字xi重复多次出现,则可一次输入多个,其方法是
类型1:输入重复次数.
类型2:输入(即)重复次数.
(3)清除某个错误数据
如果输入过程中发现某个数字xi输入错误,则可通过下列方法清除:
类型1:输入(即).
类型2:输入(即).
类型3:输入(即).
(4)获取统计量的值
类型1:按获得样本均值x;
按获得样本标准差s.
类型2:按获得样本均值x;
按获得样本标准差s.
类型3:按匡习国目获得样本均值x.
按获得样本标准差s.
其他统计量按相应的键名类似获得,其中(或)代表样本二阶中心矩的平方根.
(5)清空统计数据
一般计算器都有统计数据记忆功能,如果不进行清空操作,则在下次统计(哪怕重新开机)时计算器会将以前记忆的数据与新输入的数据合并成一组进行统计计算,因此,在统计一组新数据时常需要清空以前输入的数据,为新一组数据的统计计算做好准备.其方法是
类型1:按.
类型2:按.
类型3:按.
类型4:按.
这时屏幕上STAT(或SD)消失,以前输入的数据全部被清除.
当然,上述列举的操作方法并不是全部,不同计算器有不同的操作方法,也许是某两种类型的组合.随着科技的发展,计算器也在不断更新,功能也越来越强,其操作方法也在不断改进.因此,具体的操作方法应以厂家提供的说明书为准.
1.2 基本分布
本节介绍在数理统计中常用的几个基本分布.为此,先引进分位数定义.
定义1.2.1 设X为随机变量,则称满足
(1.15)
的Vα为X的上侧α分位数,简称为(上侧)分位数.
1.2.1 标准正态分布
标准正态分布N(0,1)是构造其他分布的基础,其密度函数为
(1.16)
图1.1 上侧分位数μ。
它的图形关于y轴对称(图1.1).
本书附表3给出了标准正态分布函数的取值情况.对于数d(0<d<1),通过查表,可求出满足等式
(1.17)
的上侧分位数uα(显然).当a=0.020时,可查得.
1.2.2 x2分布
定理1.2.1设X1,X2,…,Xn是独立同分布的随机变量,且都服从标准正态分布N(0,1),则它们的平方和
(1.18)
的分布密度是