商品详情
数据科学统计基础(第2版)(数据科学与大数据技术丛书)
作者:吕晓玲,黄丹阳,李伟
书号:326986
定价:¥59 元
字数:535 千字
印次:2-1
开本:16
出版时间:2024-05-15
ISBN:978-7-300-32698-6
包装:平
内容提要:
本书首先介绍统计量的概念及其性质,在此基础上介绍经典统计的两个重要内容,参数估计和假设检验,将其作为统计研究问题中的两个例子, 介绍统计研究方法的重要思想。之后介绍统计决策与贝叶斯方法。最后介绍基于再抽样和数据重利用的统计方法与理论。本书的每个小节后面都有批判性思考题目,目的是引起讨论、启发思考。每章的最后一节介绍了与本章知识点相关的R语言操作, 包括本书介绍的各种方法的计算机实现, 以及使用统计模拟来辅助各种方法的更深入理解等.
作者介绍
吕晓玲,中国人民大学统计学院教授,博士生导师;数据科学与大数据统计系系主任;中国人民大学数据挖掘中心主任。奥地利约翰·开普勒林茨大学应用统计系以及美国加州大学伯克利分校统计系访问学者。一直从事统计机器学习、数据科学领域的研究。主持教育部人文社会科学研究项目以及国家自然科学基金项目。在Journal of the American Statistical Association,Journal of Electronic Commerce Research等SSCI/SCI检索的国际学术期刊发表多篇论文。
黄丹阳,中国人民大学统计学院副教授,中国人民大学杰出青年学者,北京大数据协会理事会副秘书长、常务理事,全国工业统计学教学研究会青年统计学家协会理事。主持国家自然科学基金,北京市社会科学基金等多项科研课题,曾获北京市优秀人才培养资助。长期从事复杂网络建模、大型网络计算、超高维数据分析等方向的理论研究工作。在国内外权威期刊Journal of the American Statistical Association,Journal of Econometrics,Journal of Business and Economic Statistics,以及《统计研究》《管理世界》等发表多篇论文。
李伟,中国人民大学统计学院副教授,中国人民大学吴玉章青年学者,入选国家高层次青年人才计划,中国现场统计研究会因果推断分会副秘书长。主持国家自然科学基金青年科学基金项目、北京市自然科学基金面上项目等多项课题,参与国家重点研发计划青年科学家项目。研究方向是因果推断、缺失数据、高维统计及其在生物医学、社会经济学等领域中的应用。在Journal of the Royal Statistical Society Series B,Biometrika, Journal of Econometrics,Biometrics等国际统计学期刊发表多篇论文。
目 录
第1章 统计量
1.1 数据和变量
1.1.1 数据的例子
1.1.2 变量的类型
批判性思考
习题1.1
1.2 总体、样本和统计量
1.2.1 总体和分布
1.2.2 样本
1.2.3 统计量
批判性思考
习题 1.2
1.3 从样本认识总体的图表方法
13.1 频数频率表与直方图
1.3.2 饼图与条形图
13.3 样本的经验分布函数
13.4 高维数据的图表展示方法
13.5 数据变换
批判性思考
习题 1.3
1.4 抽样分布
1.4.1 样本均值的抽样分布
1.4.2 正态总体各统计量的分布
1.4.3 用随机模拟法寻找统计量的近似分布
批判性思考
习题 1.4
1.5 次序统计量
1.5.1 次序统计量的概念
1.5.2 样本极差
1.5.3 样本中位数与样本 p分位数
1.5.4 箱线图和 Q-Q图
1.5.5 次序统计量的分布
批判性思考
习题 1.5
1.6 充分统计量
1.6.1 充分统计量的概念
1.6.2 因子分解定理
批判性思考
习题1.6
1.7 常用的概率分布族
1.7.1 常用的概率分布族表
1.7.2 伽马分布族
1.7.3 贝塔分布族
1.7.4 指数型分布族
批判性思考
习题 1.7
18 与本章相关的 R语言操作
1.8.1 基本统计量的计算
1.8.2 图表
1.8.3 随机模拟统计量的抽样分布
第2章 参数估计
2.1 点估计与无偏性
批判性思考
习题 2.1
2.2 矩估计与相合性
2.2.1 矩估计
2.2.2 相合性
批判性思考
习题 2.2
2.3 最大似然估计与渐近正态性
2.3.1 最大似然估计
2.3.2 最大似然估计的不变原理
2.3.3 最大似然估计的渐近正态性
2.3.4 EM 算法
批判性思考
习题 2.3
2.4 最小方差无偏估计
2.4.1 无偏估计的有效性
2.4.2 有偏估计的均方误差准则
2.4.3 一致最小方差无偏估计
2.4.4 完备性及其应用
批判性思考
习题 2.4
2.5 C-R 不等式
2.5.1 C-R 不等式简介
2.5.2 有效估计
批判性思考
习题 2.5
2.6 置信区间
2.6.1 置信区间的概念
2.6.2 枢轴量法
2.6.3 大样本置信区间
批判性思考
习题 2.6
2.7 正态总体参数的置信区间
2.7.1 一维参数的置信区间
2.7.2 二维参数(μ,?)的置信域
2.7.3 样本量的确定
批判性思考
习题 2.7
2.8 与本章相关的 R语言操作
2.8.1 随机变量序列分布的演示
2.8.2 最大似然估计
2.8.3 EM算法模拟实例
2.8.4 区间估计的模拟结果
2.8.5 均值、方差的区间估计
第3章 假设检验
3.1 假设检验的概念与步骤
3.1.1 假设检验问题
3.1.2 假设检验的步骤
3.1.3 势函数
批判性思考
习题 3.1
3.2 正态总体参数和比率的检验
3.2.1 正态均值p的检验
3.2.2 其他正态总体参数的检验
3.2.3 成对数据t检验
3.2.4 比率的检验
3.2.5 控制犯两类错误的概率,确定样本量
3.2.6 几点说明
批判性思考
习题 3.2
3.3 广义似然比检验
3.3.1 广义似然比检验简介
3.3.2 区分两个分布的广义似然比检验
批判性思考
习题 3.3
3.4 分布的检验
3.4.1 离散分布的 x?拟合优度检验
3.4.2 连续分布的检验
批判性思考
习题 3.4
3.5 大规模假设检验与 FDR
3.5.1 大规模假设检验
3.5.2 FDR 方法介绍
批判性思考
习题 3.5
3.6 与本章相关的 R语言操作
3.6.1 正态总体的参数检验
3.6.2 比率检验
3.6.3 假设检验的一个人为例子
3.6.4 x?拟合优度检验
3.6.5 夏皮罗-维尔克检验
3.6.6 柯尔莫哥洛夫-斯米尔诺夫检验
3.6.7 FDR的例子
第4章 统计决策与贝叶斯方法
4.1 统计决策的基本概念
4.1.1 统计决策问题的三要素
4.1.2 统计决策函数与风险函数
批判性思考
习题 4.1
4.2 贝叶斯点估计
4.2.1 先验分布与贝叶斯公式
4.2.2 先验分布
4.2.3 贝叶斯风险与贝叶斯点估计
4.2.4 两个注释
批判性思考
习题 4.2
4.3 贝叶斯区间估计
43.1 可信区间
43.2 最大后验密度可信区间
批判性思考
习题 4.3
4.4 贝叶斯假设检验
批判性思考
习题 4.4
4.5 MCMC 算法
4.5.1 M-H 算法
4.5.2 Gibbs 抽样
批判性思考
习题 4.5
4.6 与本章相关的 R语言操作
4.6.1 不同先验的对比
4.6.2 贝叶斯区间估计
4.6.3 M-H算法:例4.5.1、例4.5.2 的代码实现
4.6.4 例4.5.3的代码实现
4.6.5 Gibbs 抽样:例4.5.4的代码实现
第5章 再抽样方法
5.1 自助法参数估计
5.1.1 标准误差的自助法估计
5.1.2 偏差的自助法估计
5.1.3 自助法的区间估计
5.1.4 讨论
批判性思考
习题 5.1
5.2 刀切法
5.2.1 刀切法介绍
5.2.2 刀切法和自助法的联系
批判性思考
习题 5.2
5.3 再抽样假设检验
5.3.1 置换检验
5.3.2 自助法假设检验
批判性思考
习题 53
5.4 交叉验证
5.4.1 交叉验证简介
5.4.2 进一步的讨论
批判性思考
习题 5.4
5.5 数据科学中的 PCS准则
5.5.1 DSLC 中的 PCS 准则
5.5.2 通过扰动分析进行 PCS推断
补充知识
批判性思考
习题 5.5
5.6 与本章相关的 R语言操作
5.6.1 自助法
5.6.2 刀切法
5.6.3 假设检验
5.6.4 交叉验证
5.6.5 数据科学中的 PCS 准则
附录 R语言基础
A.1 R语言简介
A.1.1 R语言概述
A.1.2 R语言的安装
A.2 数据的类型结构
A.2.1 数据的类型
A.2.2 数据的结构
A.2.3 缺失数据的处理
A.3 R语言的基本操作
A.3.1 数据的输入和输出
A.3.2 控制结构
A.3.3 自定义函数
A.3.4 画图
A.4 概率分布
参考文献
精彩样章
大数据和人工智能时代给统计学带来了巨大的机遇,同时也带来了前所未有的挑战。 可以说,统计学这个学科正处于传承和发展的伟大变革时期。本书是传统数理统计教材和课程的新发展。 数理统计是统计学专业非常重要的学科基础课。我们一直认为统计学的基础是数学,所以才称为数理统计。诚然,在计算机技术并不发达的统计发展的早期,严谨的数学推导是统计理论的唯一保证。但数学定理的推导对统计方法的应用有很多局限,比如需要很多假定,如果这些假定不符合实际情况,理论就没有用处;比如更复杂的应用场景很难有经典的数学理论结果来保证方法的有效性。现在是大数据时代,计算机技术的发展使得统计方法有了很大突破,应用领域有了更大的拓展,但并不是说我们不需要数学理论了,只是说需要的数学方法也相应有了更多变化和要求。统计学是一门方法论的学科,我们应该首先弄清楚要研究的问题是什么,然后探讨如何构造方法(解决数据分析的实际问题)以及如何评价方法(保证方法的科学性)。所以说数学理论是为评价统计方法服务的,在这个角度上,不能把统计看作一门数学课,用数学的标准来要求统计学。本课程作为学科基础课,更应该强调统计学是一门方法论的学科这样的统计思想,更应该在数据科学的大背景下围绕这个核心编写教材、组织教学。
- 人民大学出版社微店 (微信公众号认证)
- 人大出版社自营微店,正版人大出版社书籍直发,品质保证!
- 扫描二维码,访问我们的微信店铺
- 随时随地的购物、客服咨询、查询订单和物流...