商品详情
书名:应用数理统计(第三版)
定价:45.0
ISBN:9787030392015
作者:孙荣恒
版次:1
出版时间:2018-11
内容提要:
本书是为应用数学专业、数学专业、概率统计专业、信息与计算科学专业本科大学生和 非数学专业的硕士生学习数理统计而编写的教材.主要内容有:抽样分布、参数估计、假设 检验、方差分析与正交试验设计、线性回归模型.本书每章末附有习题,书后附有答案.
目录:
目录
序
第二版序
**版序
**章抽样分布1
§11基本概念、顺序统计量与经验分布函数1
111基本概念1
112顺序统计量3
113经验分布函数6
114几个重要分布8
§12多元正态分布与正态二次型11
§13抽样分布定理18
§14分位数21
习题一23
第二章参数估计28
§21点估计常用方法28
211矩法28
212极大似然法30
§22评价估计量好坏的标准34
221无偏性与有效性34
222一致*小方差无偏估计量42
223一致性(相合性)45
§23充分性与完备性46
231充分性47
232完备性50
§24区间估计54
241一个正态总体的情况55
242两个正态总体的情况58
243指数分布与0—1分布参数的区间估计62
§25贝叶斯(Bayes)估计64
251决策论的基本概念64
252*大风险*小化估计66
253后验分布68
254贝叶斯估计68
255先验分布的选取73
256*大后验估计77
257贝叶斯区间估计78
258离散型分布中参数的贝叶斯估计与极大似然估计80
§26截尾寿命试验中指数分布和几何分布的参数估计88
261指数分布中参数的点估计88
262指数分布中参数的区间估计92
263指数分布参数λ的贝叶斯估计93
2.6.4几何分布中参数q的估计94
习题二97
第三章假设检验105
§3.1假设检验的基本思想与基本概念105
§3.2参数假设检验109
3.2.1单个正态总体均值的假设检验110
3.2.2单个正态总体方差的假设检验116
3.2.3两个正态总体均值的假设检验120
3.2.4两个正态总体方差的假设检验124
3.2.5广义似然比检验131
3.2.6*似然比检验134
327指数分布中参数λ的假设检验135
328截尾试验中指数分布参数的假设检验137
§3.3非参数假设检验138
3.3.1分布函数的拟合检验138
3.3.2两总体之间关系的假设检验148
333伯努利过程与泊松过程的检验156
§3.4一致*优势检验158
3.4.1势函数159
3.4.2奈曼皮尔逊基本引理161
§3.5质量控制166
3.5.1验收抽样方案的制订167
3.5.2计量控制170
3.5.3计件控制与计点控制173
习题三175
第四章方差分析与正交试验设计180
§4.1单因素方差分析180
4.1.1数学模型180
4.1.2方差分析181
§4.2双因素方差分析186
4.2.1数学模型186
4.2.2方差分析187
§4.3正交试验设计193
4.3.1正交表193
4.3.2正交表的分析196
习题四200
第五章线性回归模型202
§5.1线性模型202
§5.2*小二乘法估计205
5.2.1β的*小二乘法估计205
5.2.2*小二乘法估计量的性质207
5.2.3例子213
§5.3检验、预测与控制218
5.3.1线性模型与回归系数的检验218
5.3.2预测与控制222
§5.4带有线性约束的线性回归模型227
5.4.1拉格朗日乘子法228
5.4.2H的性质229
5.4.3对假设H0:Hβ=d的检验230
习题五234
附录一定理2.6.2的证明239
附录二定理2.6.4的证明242
附录三常用数理统计表245
附录四常见随机变量分布表265
答案268
参考文献274
在线试读:
**章抽样分布 §11基本概念、顺序统计量与经验分布函数 **章抽 样 分 布 与概率论一样,数理统计也是研究随机现象统计规律性的一门数学学科.概率论研究的基本内容是:在已知随机变量分布的情况下,着重讨论了随机变量的性质.但是对一个具体的随机变量来说,如何判断它服从某种分布?如果知道它服从某种分布又该如何确定它的各个参数?对于这些问题在概率论中都没有涉及,它们都是数理统计所要研究的内容,并且这些问题的研究都直接或间接建立在试验的基础上.数理统计学是利用概率论的理论对所要研究的随机现象进行多次的观察或试验,研究如何合理地获得数据,如何对所获得的数据进行整理、分析,如何对所关心的问题作出估计或判断的一门数学学科.其内容非常丰富.一般可分为两大类:一类是试验的设计与研究,一类是统计推断.我们着重讨论统计推断. 本章首先介绍数理统计的基本概念,然后介绍多元正态分布与正态二次型,*后介绍有关抽样分布的几个定理,为以后各章作必要的准备. §11基本概念、顺序统计量与经验分布函数〖1〗 111基本概念 总体、个体、样本是数理统计学中三个*基本的概念.我们称研究对象的全体为总体或母体.称组成总体的每个单元为个体.从总体中随机抽取n个个体,称这n个个体为容量是n的样本. 例如,为了研究某厂生产的一批灯泡质量的好坏,规定使用寿命低于1000小时的为次品.则该批灯泡的全体就为总体,每个灯泡就是个体.实际上,数理统计学中的总体是指与总体相联系的某个(或某几个)数量指标ξ取值的全体.比如,该批灯泡的使用寿命ξ的取值全体就是研究对象的总体.由于对不同的个体,ξ取不同的值,且事先无法准确预言,所以ξ是随机变量,这时,我们就称ξ的概率分布或更简单地就称ξ为总体.为了判断该批灯泡的次品率,*精确的办法是把每个灯泡的寿命都测出来.然而,寿命试验是破坏性试验(即使试验是非破坏性的,由于试验要花费人力、物力和时间),我们只能从总体中抽取一部分,比如说,n个个体进行试验.试验结果可得一组数值(x1,x2,…,xn),其中每个xi是一次抽样观察的结果.由于我们要根据这些观察结果对总体进行推断,所以对每次抽取就有一定的要求,要求每次抽取必须是随机的、独立的,这样才能较好地反映总体情况.所谓随机的是指每个个体被抽到的机会是均等的,这样抽到的个体才具有代表性.所谓独立的是指每次抽取之后不能改变总体的成分.这就要求:如果试验是非破坏性的且总体是有限的,抽取应该是有放回的;如果试验是破坏性的总体应该是无限的或是很大的.基于上述思想的抽样方法称为简单随机抽样.用简单随机抽样方法抽取n个个体进行试验,其结果是 确定的一组数值(x1,…,xn),但是这组数值(x1,…,xn)是随着每次抽样而改变的.因此(x1,…,xn)实际上是一个n维随机向量(ξ1,…,ξn)的一次观察值 .即在试验之前,(x1,x2,…,xn)实际上是随机向量(ξ1,…,ξn).又因抽样是随机的、独立的,所以ξ1,…,ξn是相互独立的n个随机变量,且每个都与总体ξ同分布 .我们称(ξ1,…,ξn)或ξ1,…,ξn为总体ξ的容量为n的简单随机样本,简称为样本(如无特别说明我们今后只讨论简单随机样本), 称每个ξi为样品.样本(ξ1,…,ξn)的所有可能的观察值组成的集合X称为样本空间.它是n维空间或其一个子集.这样样本(ξ1,…,ξn)的一次观察值(x1,…,xn)就是样本空间X中的一个点,即(x1,…,xn)∈X. 由于对总体进行统计推断的依据是样本提供的信息,然而样本是n维随机变量或n个随机变量,讨论起来很不方便.人们自然会想到能否用样本的函数代替样本对总体进行统计推断.当然,这个函数不能太任意了,*好是一个随机变量,这样使用起来才方便;同时这个函数中不能含有任何未知参数.由此,我们引入如下定义. 定义111设(ξ1,…,ξn)为总体ξ的样本,T(x1,…,xn)为样本空间X上的实值(波雷尔可测)函数.如果T(ξ1,…,ξn)中不包含任何未知参数,则称T(ξ1,…,ξn)为一个统计量. 例111设(ξ1,…,ξn)为总体ξ的样本,记 =1n∑ni=1ξi, S2=1n∑ni=1(ξi-)2,( 1.1.1) 则称,S2与S分别为样本(ξ1,…,ξn)的均值、方差与标准差.它们都是统计量.当D(ξ)存在有限时,显然有 E()=E(ξ),D()=D(ξ)n,E(S2)=n -1nD(ξ),(1.1.2) 因此可用来估计E(ξ),用S2估计D(ξ). 当(ξ1,ξ2,…,ξn)的观察值为(x1,x2,…,xn)时,记,S2 的观察值分别为,s2,即 =1n∑ni=1xi,s2=1n∑ni=1(xi-)2.(1.1.3) 注意:统计量中不能包含任何未知参数.例如,设总体ξ~N(a,σ2),其中a,σ2都是未知参数.设(ξ1,ξ2)为ξ的样本,则12(ξ1+ξ2)-a 与ξ1σ都不是统计量,而ξ2与ξ1+ξ2都是统计量. 定义112设(ξ1,…,ξn)为总体ξ 的样本,记 Ar=1n∑ni=1ξri, Br=1n∑ni=1(ξi-)r,(114) 则称Ar,Br分别为样本(ξ1,…,ξn)的r阶原点矩与r阶中心矩.显然A1=,B2=S2,且Ar,Br都是统计量. 定义113设(ξ1,η1),(ξ2,η 2),…,(ξn,ηn)为二维总体(ξ,η)的样本,记 =1n∑ni=1ξi,S 21=1n∑ni=1(ξi-)2, =1n∑ni=1ηi,S22=1n∑ni=1(ηi-)2, S12=1n∑ni=1(ξi-)(ηi -),(1.1.5) R=S12S1S2,(1.1.6) 则称S12,R分别为二维样本的协方差与二维样本的相关系数. 显然有 S12=1n∑ni=1ξiηi -.(1.1.7) 设φξ(t)为总体ξ的特征函数,ξ1,…,ξn为总体ξ的样本,则样本均值的特征函数为 φ(t)=Eejt =Eejtn∑ni=1ξi=φξtnn,j2= -1.(1.1.8) 利用上式与特征函数的**性定理,由总体ξ的分布,常可求得的分布.例如, 设ξ1,…,ξn为总体ξ~N(a,σ2)的样本,因为有 φξ(t)=ejta-12t2σ2, 从而样本均值的特征函数为 φ(t)=φξtnn=ejta-12t2σn2,此为正态分布特征函数,由特征函数**性定理知~Na,σn2=Na,σ2n. 112顺序统计量定义114设ξ1,ξ2,…,ξn为总体ξ的样本,现由样本ξ1,ξ2,…,ξn建立n个函数:ξ(k)=ξ(k)(ξ1,ξ2,…,ξn),k=1,2,…,n,其中ξ(k)为这样的统计量,其观察值为x(k),而x(k)为样本的观察值x1,x2,…,xn按递增次序排列成x(1)≤x(2)≤…≤x(k)≤…≤x(n)后的第k个数值.则称ξ(1),ξ(2),…,ξ(n)为样本ξ1,ξ2,…,ξn的顺序统计量或次序统计量.称ξ(k)为样本ξ1,ξ2,…,ξn的第k个顺序统计量(1≤k≤n).实际上ξ(k)是样本ξ1,ξ2,…,ξn中第k个*小的样品,1≤k≤n.显然有ξ(1)≤ξ(2)≤…≤ξ(k)≤…≤ξ(n),(1.1.9) ξ(1)=min1≤k≤nξ(k),ξ(n)=max 1≤k≤nξ(k).(1.1.10) 记 =ξn+1〖 〗2,当n为奇数, 12ξn2 +ξn2+1,当n为偶数,(1.1.11) 则称为样本中位数(中值).称Rn≡ξ(n)-ξ(1)为 样本极差 .样本中位数的基本思想是把样本分为两个相等的部分(大数部分与小数部分),而样本中位 数是分界线.样本极差是样本中*大值与*小值之差,它反映样本观察值波动程度,它与样 本标准差S一样反映观察值的离散程度. 设F(x)为总体 ξ 的分布函数,由文献[21]中定理276的推论1知, ξ (1) , ξ (n) 的分布函数分别为 F ξ (1) (x)=1-[1-F(x)]n, F ξ (n) (x)=[F(x)]n.(1.1.12) 如果总体 ξ 为连续型随机变量,且有密度函数f(x),则 ξ (1) , ξ (n) 为连续型随机变 量,其密度函数分别为 f ξ (1) (x)=nf(x)[1-F(x)]n-1, f ξ (n) (x)=nf(x)[F(x)]n-1.(1.1.13) 由文献[21]中定理2.7.7知( ξ (1) , ξ (n) )的联合分布函数为 F 1,n (x,y)= [F(y)]n-[F(y)-F(x)]n,x<y, [F(y)]n,x≥y. (1.1.14) 如果总体 ξ 为连续型的且有密度f(x),则( ξ (1) , ξ (n) )为二维连续型随机向量,其密 度为 f 1,n (x,y)= n(n-1)f(x)f(y)[F(y)-F(x)]n-2,x<y, 0,x≥y. (1.1.15) 从而极差R n = ξ (n) - ξ (1) 有密度 f R n (z)= n(n-1) ∫ ∞ -∞ f(x)f(z+x)[F(z+x)-F(x)] n-2dx, z>0, 0, z≤0. (1.1.16) 当总体 ξ ′~N(0,1)时,记R′ n 为相应样本极差,且记C n =E(R′ n ),v2 n =D(R′ n ). 由式(1116)可计算出C n 与v2 n 的值(见表111).当总体 ξ ~N(a,σ2)时,设R n 为其样本极差,令 ξ ′= ξ -a σ , ξ ′ i = ξ i -a σ , i=1,2,…,n, 表111 nC n 1 C n v n 1 k1 煏128380 bX88620 & 853 3 k1 煏692570 bX59080 & 888 4 k2 煏058750 bX48570 & 880 5 k2 煏325930 bX42990 & 864 6 k2 煏534410 bX39460 & 848 7 k2 煏704360 bX36980 & 833 8 k2 煏847200 bX35120 & 820 9 k2 煏970030 bX33670 & 808 103 煏077510 bX32490 & 797 则 ξ ′ 1 , ξ ′ 2 ,…, ξ ′ n 为总体 ξ ′~N(0,1)的样本.记R′ n 为样本 ξ ′ 1 , ξ ′ 2 ,…, ξ ′ n 的极差,则 R′ n = ξ ′ (n) - ξ ′ (1) =max 1≤i≤n ξ i -a σ -min 1≤i≤n ξ i -a σ = R n σ , 故 C n =E(R′ n )= 1 σ E(R n ), 从而 σ=E R n C n , D R n C n =D σR′ n C n = v2 n C2 n σ2. 所以,我们可用 R n C n 来估计正态总体标准差σ.将用 R n C n 估计σ与用S来估计σ进行比 较,当n≤10时,其效率相当高;然而当n>10时,其效率迅速下降.为提高效率,当 n>10时,可随机地把样本观察值分成每组只有少数几个(*好5个)样品的若干 组,然后由各组分别估计σ,*后再取平均值. 113 经验分布函数 定义115 设 ξ 1 , ξ 2 ,…, ξ n 为总体 ξ 的样本, ξ (1) , ξ (2) ,…, ξ (n) 为样本 ξ 1 , ξ 2 ,…, ξ n 的顺序统计量.对任意实数x,记 F n (x)= 0,x≤ ξ (1) , k n , ξ (k) <x≤ ξ (k+1) ,k=1,2,…,n-1, 1,x> ξ (n) , (1.1.17) 则称F n (x)为总体 ξ 的经验分布函数.F n (x)是分段函数不便于使用,为此引入单 位阶跃函数: μ (x)= 1, x>0, 0, x≤0, (1.1.18) 则式(1117)可改写为 F n (x)= 1 n ∑ n k=1 μ (x- ξ k ), x∈R,(11.19) ∑ n k=1 μ (x- ξ k )表示小于x的那些样品 ξ k 的个数.因为对样本 ξ 1 , ξ 2 ,…, ξ n 的任一观 察值x 1 ,x 2 ,…,x n ,F n (x)是x的单调不减、左连续函数,且 0≤F n (x)≤1, F n (-∞)=0, F n (+∞)=1. 所以F n (x)是分布函数,其图形如图1-1所示. 图1-1 由式(1119)知,对固定的x,F n (x)是样本 ξ 1 , ξ 2 ,…, ξ n 的函数.又因 μ (x- ξ 1 ), μ (x- ξ 2 ),…, μ (x- ξ n )独立同分布且 P μ (x- ξ 1 )=1=Px- ξ 1 >0=F(x), P μ (x- ξ 1 )=0=1-F(x),
定价:45.0
ISBN:9787030392015
作者:孙荣恒
版次:1
出版时间:2018-11
内容提要:
本书是为应用数学专业、数学专业、概率统计专业、信息与计算科学专业本科大学生和 非数学专业的硕士生学习数理统计而编写的教材.主要内容有:抽样分布、参数估计、假设 检验、方差分析与正交试验设计、线性回归模型.本书每章末附有习题,书后附有答案.
目录:
目录
序
第二版序
**版序
**章抽样分布1
§11基本概念、顺序统计量与经验分布函数1
111基本概念1
112顺序统计量3
113经验分布函数6
114几个重要分布8
§12多元正态分布与正态二次型11
§13抽样分布定理18
§14分位数21
习题一23
第二章参数估计28
§21点估计常用方法28
211矩法28
212极大似然法30
§22评价估计量好坏的标准34
221无偏性与有效性34
222一致*小方差无偏估计量42
223一致性(相合性)45
§23充分性与完备性46
231充分性47
232完备性50
§24区间估计54
241一个正态总体的情况55
242两个正态总体的情况58
243指数分布与0—1分布参数的区间估计62
§25贝叶斯(Bayes)估计64
251决策论的基本概念64
252*大风险*小化估计66
253后验分布68
254贝叶斯估计68
255先验分布的选取73
256*大后验估计77
257贝叶斯区间估计78
258离散型分布中参数的贝叶斯估计与极大似然估计80
§26截尾寿命试验中指数分布和几何分布的参数估计88
261指数分布中参数的点估计88
262指数分布中参数的区间估计92
263指数分布参数λ的贝叶斯估计93
2.6.4几何分布中参数q的估计94
习题二97
第三章假设检验105
§3.1假设检验的基本思想与基本概念105
§3.2参数假设检验109
3.2.1单个正态总体均值的假设检验110
3.2.2单个正态总体方差的假设检验116
3.2.3两个正态总体均值的假设检验120
3.2.4两个正态总体方差的假设检验124
3.2.5广义似然比检验131
3.2.6*似然比检验134
327指数分布中参数λ的假设检验135
328截尾试验中指数分布参数的假设检验137
§3.3非参数假设检验138
3.3.1分布函数的拟合检验138
3.3.2两总体之间关系的假设检验148
333伯努利过程与泊松过程的检验156
§3.4一致*优势检验158
3.4.1势函数159
3.4.2奈曼皮尔逊基本引理161
§3.5质量控制166
3.5.1验收抽样方案的制订167
3.5.2计量控制170
3.5.3计件控制与计点控制173
习题三175
第四章方差分析与正交试验设计180
§4.1单因素方差分析180
4.1.1数学模型180
4.1.2方差分析181
§4.2双因素方差分析186
4.2.1数学模型186
4.2.2方差分析187
§4.3正交试验设计193
4.3.1正交表193
4.3.2正交表的分析196
习题四200
第五章线性回归模型202
§5.1线性模型202
§5.2*小二乘法估计205
5.2.1β的*小二乘法估计205
5.2.2*小二乘法估计量的性质207
5.2.3例子213
§5.3检验、预测与控制218
5.3.1线性模型与回归系数的检验218
5.3.2预测与控制222
§5.4带有线性约束的线性回归模型227
5.4.1拉格朗日乘子法228
5.4.2H的性质229
5.4.3对假设H0:Hβ=d的检验230
习题五234
附录一定理2.6.2的证明239
附录二定理2.6.4的证明242
附录三常用数理统计表245
附录四常见随机变量分布表265
答案268
参考文献274
在线试读:
**章抽样分布 §11基本概念、顺序统计量与经验分布函数 **章抽 样 分 布 与概率论一样,数理统计也是研究随机现象统计规律性的一门数学学科.概率论研究的基本内容是:在已知随机变量分布的情况下,着重讨论了随机变量的性质.但是对一个具体的随机变量来说,如何判断它服从某种分布?如果知道它服从某种分布又该如何确定它的各个参数?对于这些问题在概率论中都没有涉及,它们都是数理统计所要研究的内容,并且这些问题的研究都直接或间接建立在试验的基础上.数理统计学是利用概率论的理论对所要研究的随机现象进行多次的观察或试验,研究如何合理地获得数据,如何对所获得的数据进行整理、分析,如何对所关心的问题作出估计或判断的一门数学学科.其内容非常丰富.一般可分为两大类:一类是试验的设计与研究,一类是统计推断.我们着重讨论统计推断. 本章首先介绍数理统计的基本概念,然后介绍多元正态分布与正态二次型,*后介绍有关抽样分布的几个定理,为以后各章作必要的准备. §11基本概念、顺序统计量与经验分布函数〖1〗 111基本概念 总体、个体、样本是数理统计学中三个*基本的概念.我们称研究对象的全体为总体或母体.称组成总体的每个单元为个体.从总体中随机抽取n个个体,称这n个个体为容量是n的样本. 例如,为了研究某厂生产的一批灯泡质量的好坏,规定使用寿命低于1000小时的为次品.则该批灯泡的全体就为总体,每个灯泡就是个体.实际上,数理统计学中的总体是指与总体相联系的某个(或某几个)数量指标ξ取值的全体.比如,该批灯泡的使用寿命ξ的取值全体就是研究对象的总体.由于对不同的个体,ξ取不同的值,且事先无法准确预言,所以ξ是随机变量,这时,我们就称ξ的概率分布或更简单地就称ξ为总体.为了判断该批灯泡的次品率,*精确的办法是把每个灯泡的寿命都测出来.然而,寿命试验是破坏性试验(即使试验是非破坏性的,由于试验要花费人力、物力和时间),我们只能从总体中抽取一部分,比如说,n个个体进行试验.试验结果可得一组数值(x1,x2,…,xn),其中每个xi是一次抽样观察的结果.由于我们要根据这些观察结果对总体进行推断,所以对每次抽取就有一定的要求,要求每次抽取必须是随机的、独立的,这样才能较好地反映总体情况.所谓随机的是指每个个体被抽到的机会是均等的,这样抽到的个体才具有代表性.所谓独立的是指每次抽取之后不能改变总体的成分.这就要求:如果试验是非破坏性的且总体是有限的,抽取应该是有放回的;如果试验是破坏性的总体应该是无限的或是很大的.基于上述思想的抽样方法称为简单随机抽样.用简单随机抽样方法抽取n个个体进行试验,其结果是 确定的一组数值(x1,…,xn),但是这组数值(x1,…,xn)是随着每次抽样而改变的.因此(x1,…,xn)实际上是一个n维随机向量(ξ1,…,ξn)的一次观察值 .即在试验之前,(x1,x2,…,xn)实际上是随机向量(ξ1,…,ξn).又因抽样是随机的、独立的,所以ξ1,…,ξn是相互独立的n个随机变量,且每个都与总体ξ同分布 .我们称(ξ1,…,ξn)或ξ1,…,ξn为总体ξ的容量为n的简单随机样本,简称为样本(如无特别说明我们今后只讨论简单随机样本), 称每个ξi为样品.样本(ξ1,…,ξn)的所有可能的观察值组成的集合X称为样本空间.它是n维空间或其一个子集.这样样本(ξ1,…,ξn)的一次观察值(x1,…,xn)就是样本空间X中的一个点,即(x1,…,xn)∈X. 由于对总体进行统计推断的依据是样本提供的信息,然而样本是n维随机变量或n个随机变量,讨论起来很不方便.人们自然会想到能否用样本的函数代替样本对总体进行统计推断.当然,这个函数不能太任意了,*好是一个随机变量,这样使用起来才方便;同时这个函数中不能含有任何未知参数.由此,我们引入如下定义. 定义111设(ξ1,…,ξn)为总体ξ的样本,T(x1,…,xn)为样本空间X上的实值(波雷尔可测)函数.如果T(ξ1,…,ξn)中不包含任何未知参数,则称T(ξ1,…,ξn)为一个统计量. 例111设(ξ1,…,ξn)为总体ξ的样本,记 =1n∑ni=1ξi, S2=1n∑ni=1(ξi-)2,( 1.1.1) 则称,S2与S分别为样本(ξ1,…,ξn)的均值、方差与标准差.它们都是统计量.当D(ξ)存在有限时,显然有 E()=E(ξ),D()=D(ξ)n,E(S2)=n -1nD(ξ),(1.1.2) 因此可用来估计E(ξ),用S2估计D(ξ). 当(ξ1,ξ2,…,ξn)的观察值为(x1,x2,…,xn)时,记,S2 的观察值分别为,s2,即 =1n∑ni=1xi,s2=1n∑ni=1(xi-)2.(1.1.3) 注意:统计量中不能包含任何未知参数.例如,设总体ξ~N(a,σ2),其中a,σ2都是未知参数.设(ξ1,ξ2)为ξ的样本,则12(ξ1+ξ2)-a 与ξ1σ都不是统计量,而ξ2与ξ1+ξ2都是统计量. 定义112设(ξ1,…,ξn)为总体ξ 的样本,记 Ar=1n∑ni=1ξri, Br=1n∑ni=1(ξi-)r,(114) 则称Ar,Br分别为样本(ξ1,…,ξn)的r阶原点矩与r阶中心矩.显然A1=,B2=S2,且Ar,Br都是统计量. 定义113设(ξ1,η1),(ξ2,η 2),…,(ξn,ηn)为二维总体(ξ,η)的样本,记 =1n∑ni=1ξi,S 21=1n∑ni=1(ξi-)2, =1n∑ni=1ηi,S22=1n∑ni=1(ηi-)2, S12=1n∑ni=1(ξi-)(ηi -),(1.1.5) R=S12S1S2,(1.1.6) 则称S12,R分别为二维样本的协方差与二维样本的相关系数. 显然有 S12=1n∑ni=1ξiηi -.(1.1.7) 设φξ(t)为总体ξ的特征函数,ξ1,…,ξn为总体ξ的样本,则样本均值的特征函数为 φ(t)=Eejt =Eejtn∑ni=1ξi=φξtnn,j2= -1.(1.1.8) 利用上式与特征函数的**性定理,由总体ξ的分布,常可求得的分布.例如, 设ξ1,…,ξn为总体ξ~N(a,σ2)的样本,因为有 φξ(t)=ejta-12t2σ2, 从而样本均值的特征函数为 φ(t)=φξtnn=ejta-12t2σn2,此为正态分布特征函数,由特征函数**性定理知~Na,σn2=Na,σ2n. 112顺序统计量定义114设ξ1,ξ2,…,ξn为总体ξ的样本,现由样本ξ1,ξ2,…,ξn建立n个函数:ξ(k)=ξ(k)(ξ1,ξ2,…,ξn),k=1,2,…,n,其中ξ(k)为这样的统计量,其观察值为x(k),而x(k)为样本的观察值x1,x2,…,xn按递增次序排列成x(1)≤x(2)≤…≤x(k)≤…≤x(n)后的第k个数值.则称ξ(1),ξ(2),…,ξ(n)为样本ξ1,ξ2,…,ξn的顺序统计量或次序统计量.称ξ(k)为样本ξ1,ξ2,…,ξn的第k个顺序统计量(1≤k≤n).实际上ξ(k)是样本ξ1,ξ2,…,ξn中第k个*小的样品,1≤k≤n.显然有ξ(1)≤ξ(2)≤…≤ξ(k)≤…≤ξ(n),(1.1.9) ξ(1)=min1≤k≤nξ(k),ξ(n)=max 1≤k≤nξ(k).(1.1.10) 记 =ξn+1〖 〗2,当n为奇数, 12ξn2 +ξn2+1,当n为偶数,(1.1.11) 则称为样本中位数(中值).称Rn≡ξ(n)-ξ(1)为 样本极差 .样本中位数的基本思想是把样本分为两个相等的部分(大数部分与小数部分),而样本中位 数是分界线.样本极差是样本中*大值与*小值之差,它反映样本观察值波动程度,它与样 本标准差S一样反映观察值的离散程度. 设F(x)为总体 ξ 的分布函数,由文献[21]中定理276的推论1知, ξ (1) , ξ (n) 的分布函数分别为 F ξ (1) (x)=1-[1-F(x)]n, F ξ (n) (x)=[F(x)]n.(1.1.12) 如果总体 ξ 为连续型随机变量,且有密度函数f(x),则 ξ (1) , ξ (n) 为连续型随机变 量,其密度函数分别为 f ξ (1) (x)=nf(x)[1-F(x)]n-1, f ξ (n) (x)=nf(x)[F(x)]n-1.(1.1.13) 由文献[21]中定理2.7.7知( ξ (1) , ξ (n) )的联合分布函数为 F 1,n (x,y)= [F(y)]n-[F(y)-F(x)]n,x<y, [F(y)]n,x≥y. (1.1.14) 如果总体 ξ 为连续型的且有密度f(x),则( ξ (1) , ξ (n) )为二维连续型随机向量,其密 度为 f 1,n (x,y)= n(n-1)f(x)f(y)[F(y)-F(x)]n-2,x<y, 0,x≥y. (1.1.15) 从而极差R n = ξ (n) - ξ (1) 有密度 f R n (z)= n(n-1) ∫ ∞ -∞ f(x)f(z+x)[F(z+x)-F(x)] n-2dx, z>0, 0, z≤0. (1.1.16) 当总体 ξ ′~N(0,1)时,记R′ n 为相应样本极差,且记C n =E(R′ n ),v2 n =D(R′ n ). 由式(1116)可计算出C n 与v2 n 的值(见表111).当总体 ξ ~N(a,σ2)时,设R n 为其样本极差,令 ξ ′= ξ -a σ , ξ ′ i = ξ i -a σ , i=1,2,…,n, 表111 nC n 1 C n v n 1 k1 煏128380 bX88620 & 853 3 k1 煏692570 bX59080 & 888 4 k2 煏058750 bX48570 & 880 5 k2 煏325930 bX42990 & 864 6 k2 煏534410 bX39460 & 848 7 k2 煏704360 bX36980 & 833 8 k2 煏847200 bX35120 & 820 9 k2 煏970030 bX33670 & 808 103 煏077510 bX32490 & 797 则 ξ ′ 1 , ξ ′ 2 ,…, ξ ′ n 为总体 ξ ′~N(0,1)的样本.记R′ n 为样本 ξ ′ 1 , ξ ′ 2 ,…, ξ ′ n 的极差,则 R′ n = ξ ′ (n) - ξ ′ (1) =max 1≤i≤n ξ i -a σ -min 1≤i≤n ξ i -a σ = R n σ , 故 C n =E(R′ n )= 1 σ E(R n ), 从而 σ=E R n C n , D R n C n =D σR′ n C n = v2 n C2 n σ2. 所以,我们可用 R n C n 来估计正态总体标准差σ.将用 R n C n 估计σ与用S来估计σ进行比 较,当n≤10时,其效率相当高;然而当n>10时,其效率迅速下降.为提高效率,当 n>10时,可随机地把样本观察值分成每组只有少数几个(*好5个)样品的若干 组,然后由各组分别估计σ,*后再取平均值. 113 经验分布函数 定义115 设 ξ 1 , ξ 2 ,…, ξ n 为总体 ξ 的样本, ξ (1) , ξ (2) ,…, ξ (n) 为样本 ξ 1 , ξ 2 ,…, ξ n 的顺序统计量.对任意实数x,记 F n (x)= 0,x≤ ξ (1) , k n , ξ (k) <x≤ ξ (k+1) ,k=1,2,…,n-1, 1,x> ξ (n) , (1.1.17) 则称F n (x)为总体 ξ 的经验分布函数.F n (x)是分段函数不便于使用,为此引入单 位阶跃函数: μ (x)= 1, x>0, 0, x≤0, (1.1.18) 则式(1117)可改写为 F n (x)= 1 n ∑ n k=1 μ (x- ξ k ), x∈R,(11.19) ∑ n k=1 μ (x- ξ k )表示小于x的那些样品 ξ k 的个数.因为对样本 ξ 1 , ξ 2 ,…, ξ n 的任一观 察值x 1 ,x 2 ,…,x n ,F n (x)是x的单调不减、左连续函数,且 0≤F n (x)≤1, F n (-∞)=0, F n (+∞)=1. 所以F n (x)是分布函数,其图形如图1-1所示. 图1-1 由式(1119)知,对固定的x,F n (x)是样本 ξ 1 , ξ 2 ,…, ξ n 的函数.又因 μ (x- ξ 1 ), μ (x- ξ 2 ),…, μ (x- ξ n )独立同分布且 P μ (x- ξ 1 )=1=Px- ξ 1 >0=F(x), P μ (x- ξ 1 )=0=1-F(x),