商品详情
书名:高维统计学:非渐近视角
定价:149.0
ISBN:9787111716761
作者:温赖特
版次:1
内容提要:
在所有科学学科和工业环境中收集的数据量和种类都出现了爆炸式增长。如此庞大的数据集给统计和机器学习领域的研究人员带来了许多挑战。本书对高维统计学进行了详尽介绍,重点介绍核心方法论和理论,包括尾部界、集中不等式、一致律和经验过程以及随机矩阵。此外还深入探索了特定的模型类,包括稀疏线性模型、用秩约束矩阵模型、图模型和各种类型的非参数模型。书中提供了数百个工作示例和练习,既适合统计学相关课程使用,也适合统计学、机器学习和相关领域的研究生与研究人员自学。
目录:
本书赞誉
译者序
致谢
第1章 简介1
1.1 经典理论和高维理论1
1.2 高维会产生什么问题2
1.2.1 线性判别分析2
1.2.2 协方差估计4
1.2.3 非参数回归6
1.3 高维中什么能帮助我们8
1.3.1 向量的稀疏性8
1.3.2 协方差矩阵中的结构10
1.3.3 回归形式的结构11
1.4 什么是非渐近的观点12
1.5 全书概述13
1.5.1 各章内容13
1.5.2 阅读背景要求14
1.5.3 教学建议和流程图15
1.6 参考文献和背景16
第2章 基本尾部概率界和集中不等式18
2.1 经典的界18
2.1.1 从马尔可夫不等式到Chernoff界18
2.1.2 次高斯随机变量和Hoeffding界19
2.1.3 次指数随机变量和Bernstein界22
2.1.4 一些单边结果26
2.2 基于鞅的方法28
2.2.1 背景28
2.2.2 鞅差序列的集中度界30
2.3 高斯随机变量的Lipschitz函数35
2.4 附录A:次高斯随机变量的等价性39
2.5 附录B:次指数随机变量的等价性42
2.6 参考文献和背景43
2.7 习题44
第3章 测度集中度51
3.1 基于熵技巧的集中度51
3.1.1 熵及其相关性质51
3.1.2 Herbst方法及其延伸52
3.1.3 可分凸函数和熵方法54
3.1.4 张量化和可分凸函数56
3.2 集中度的几何观点58
3.2.1 集中度函数59
3.2.2 与Lipschitz函数的联系60
3.2.3 从几何到集中度63
3.3 Wasserstein距离和信息不等式66
3.3.1 Wasserstein距离66
3.3.2 传输成本和集中不等式67
3.3.3 传输成本的张量化70
3.3.4 马尔可夫链的传输成本不等式71
3.3.5 非对称耦合成本72
3.4 经验过程的尾部概率界75
3.4.1 一个泛函Hoeffding不等式75
3.4.2 一个泛函Bernstein不等式77
3.5 参考文献和背景79
3.6 习题80
第4章 一致大数定律85
4.1 动机85
4.1.1 累积分布函数的一致收敛85
4.1.2 更一般函数类的一致定律87
4.2 基于Rademacher复杂度的一致定律90
4.3 Rademacher复杂度的上界94
4.3.1 多项式识别的函数类94
4.3.2 Vapnik-Chervonenkis维数96
4.3.3 VC维数的控制99
4.4 参考文献和背景100
4.5 习题101
第5章 度量熵及其用途104
5.1 覆盖和填装104
5.2 高斯复杂度和Rademacher复杂度113
5.3 度量熵和次高斯过程115
5.3.1 一步离散化的上确界116
5.3.2 离散化界的例子117
5.3.3 链方法和Dudley熵积分119
5.4 一些高斯比较不等式123
5.4.1 一般的比较不等式结果123
5.4.2 Slepian和Sudakov-Fernique不等式125
5.4.3 高斯收缩不等式126
5.5 Sudakov下界127
5.6 链方法和Orlicz过程128
5.7 参考文献和背景131
5.8 习题132
第6章 随机矩阵和协方差估计136
6.1 预备知识136
6.1.1 符号和基本结果136
6.1.2 协方差矩阵估计问题137
6.2 Wishart矩阵及其性质138
6.3 次高斯总体的协方差矩阵141
6.4 一般矩阵的界144
6.4.1 矩阵分析背景知识144
6.4.2 矩阵的尾部条件145
6.4.3 矩阵Chernoff方法和独立分解147
6.4.4 随机矩阵的上尾部概率界149
6.4.5 协方差矩阵的结果153
6.5 带结构的协方差矩阵的界154
6.5.1 未知稀疏与截断155
6.5.2 渐近稀疏157
6.6 附录:定理6.1的证明159
6.7 参考文献和背景161
6.8 习题162
第7章 高维情形下的稀疏线性模型167
7.1 问题及应用167
7.1.1 不同的稀疏模型167
7.1.2 稀疏线性模型的应用168
7.2 无噪情形下的还原171
7.2.1 1松弛172
7.2.2 精确还原和限制零空间172
7.2.3 限制零空间的充分条件174
7.3 有噪情形下的估计178
7.3.1 受限特征值条件178
7.3.2 严格稀疏模型下的2误差界180
7.3.3 随机设计矩阵的受限零空间和特征值183
7.4 预测误差的界186
7.5 变量或子集选择188
7.5.1 Lasso的变量选择相合性188
7.5.2 定理7.21的证明191
7.6 附录:定理7.16的证明193
7.7 参考文献和背景195
7.8 习题197
第8章 高维下的主成分分析204
8.1 主成分和降维204
8.1.1 PCA的解释和应用205
8.1.2 特征值和特征空间的扰动208
8.2 一般特征向量的界209
8.2.1 一个一般的确定性
结果209
8.2.2 一个穗状总体的结果211
8.3 稀疏主成分分析214
8.3.1 一个一般的确定性
结果215
8.3.2 稀疏情况下穗状模型的结果217
8.4 参考文献和背景220
8.5 习题221
第9章 可分解性和受限强凸性224
9.1 一般的正则化M估计224
9.2 可分解正则项及其用途232
9.2.1 定义和一些例子232
9.2.2 可分解性的一个关键结果234
9.3 受限曲率条件237
9.4 一些一般定理241
9.4.1 受限强凸性下的结论241
9.4.2 Φ*曲率下界244
9.5 稀疏向量回归的界246
9.5.1 稀疏的广义线性模型246
9.5.2 受限强凸性下的界247
9.5.3 在∞曲率条件下的界248
9.6 组结构稀疏性的界249
9.7 重叠可分解范数下的界252
9.8 证明受限强凸性的方法256
9.8.1 Lipschitz损失函数和Rademacher复杂度257
9.8.2 通过截断获得的一个单边界261
9.9 附录:星形性质264
9.10 参考文献和背景264
9.11 习题265
第10章 带秩约束的矩阵估计269
10.1 矩阵回归及其应用269
10.2 核范数正则化的分析273
10.2.1 可分解性与子空间273
10.2.2 受限强凸性与误差界275
10.2.3 算子范数曲率下的界276
10.3 矩阵压缩感知277
10.4 相位还原问题的界282
10.5 低秩约束的多元回归284
10.6 矩阵补全285
10.7 加性矩阵分解291
10.8 参考文献和背景295
10.9 习题296
第11章 高维数据的图模型300
11.1 基本概念300
11.1.1 因子分解300
11.1.2 条件独立性302
11.1.3 Hammersley-Clifford等价性303
11.1.4 图模型的估计304
11.2 高斯图模型的估计304
11.2.1 图Lasso:1正则极大似然305
11.2.2 基于邻域的方法310
11.3 指数形式的图模型315
11.3.1 一般形式的邻域回归316
11.3.2 Ising模型的图选择317
11.4 带有腐蚀数据或隐变量的图318
11.4.1 带有腐蚀数据的高斯图估计318
11.4.2 带有隐变量的高斯图选择322
11.5 参考文献和背景325
11.6 习题327
第12章 再生核希尔伯特空间330
12.1 希尔伯特空间的基本知识330
12.2 再生核希尔伯特空间332
12.2.1 半正定核函数332
12.2.2 2(N)中的特征映射333
12.2.3 从一个核构造一个RKHS334
12.2.4 一个更加抽象的视角及更多例子336
12.3 Mercer定理及其结果339
12.4 再生核希尔伯特空间上的算子344
12.4.1 再生核的和344
12.4.2 张量乘积347
12.5 插值和拟合348
12.5.1 函数插值348
12.5.2 基于核岭回归的拟合350
12.6 概率测度之间的距离352
12.7 参考文献和背景353
12.8 习题354
第13章 非参数小二乘358
13.1 问题设定358
13.1.1 不同的度量准则358
13.1.2 约束小二乘估计359
13.1.3 一些例子359
13.2 控制预测误差362
13.2.1 度量熵的界365
13.2.2 高维参数问题的界367
13.2.3 非参数问题的界369
13.2.4 定理13.5的证明370
13.3 优不等式372
13.3.1 优不等式的几个例子373
13.3.2 定理13.13的证明376
13.4 正则化估计377
13.4.1 正则化估计的优不等式377
13.4.2 核岭回归的结果378
13.4.3 推论13.18的证明381
13.4.4 定理13.17的证明382
13.5 参考文献和背景385
13.6 习题386
第14章 局部化和一致定律390
14.1 总体和经验L2范数390
14.1.1 局部化的一致定律391
14.1.2 核函数类的特殊化394
14.1.3 定理14.1的证明395
14.2 一个单边一致定律398
14.2.1 非参数小二乘法的结论401
14.2.2 定理14.12的证明403
14.3 Lipschitz损失函数的一个一致定律404
14.3.1 一般预测问题404
14.3.2 Lipschitz损失函数的一致定律407
14.4 非参数密度估计的一些结果409
14.4.1 密度估计的非参数极大似然方法409
14.4.2 密度估计的投影方法411
14.5 附录:总体和经验Rademacher复杂度413
14.6 参考文献和背景414
14.7 习题415
第15章 minimax下界418
15.1 基本框架418
15.1.1 minimax风险418
15.1.2 从估计到检验419
15.1.3 一些散度度量421
15.2 二元检验和Le Cam方法423
15.2.1 贝叶斯误差和全变差距离423
15.2.2 Le Cam凸包方法429
15.3 Fano方法431
15.3.1 Kullback-Leibler散度和互信息432
15.3.2 minimax风险的Fano下界432
15.3.3 基于局部填装的界433
15.3.4 高斯熵界的局部填装437
15.3.5 Yang-Barron形式的Fano方法442
15.4 附录:信息论的基本背景445
15.5 参考文献和背景446
15.6 习题448
参考文献452
- 机械工业出版社旗舰店 (微信公众号认证)
- 扫描二维码,访问我们的微信店铺
- 随时随地的购物、客服咨询、查询订单和物流...