科学出版社旗舰店店铺主页二维码
科学出版社旗舰店 微信认证
科学出版社秉承多年来形成的“高层次、高水平、高质量”和“严肃、严密、严格”的优良传统与作风,始终坚持为科技创新服务、为传播与普及科学知识服务、为科学家和广大读者服务的宗旨。
微信扫描二维码,访问我们的微信店铺
你可以使用微信联系我们,随时随地的购物、客服咨询、查询订单和物流...

大数据分析基础

39.50
运费: ¥ 0.00-18.00
大数据分析基础 商品图0
大数据分析基础 商品图1
大数据分析基础 商品图2
大数据分析基础 商品图3
大数据分析基础 商品图4
大数据分析基础 商品缩略图0 大数据分析基础 商品缩略图1 大数据分析基础 商品缩略图2 大数据分析基础 商品缩略图3 大数据分析基础 商品缩略图4

商品详情

书名:大数据分析基础
定价:50.0
ISBN:9787030838148
版次:1
出版时间:2025-11

内容提要:
本书是编者根据多年的教学实践经验和教学改革成果,按照新工科的人才培养要求及《“十四五”普通高等教育本科…规划教材建设实施方案》的精神编写而成。
  本书的内容包括数据预处理、邻近度、可视化、线性回归、k近邻、朴素贝叶斯、决策树、支持向量机、Bagging方法、Boosting方法、常见的原型聚类、密度聚类、层次聚类算法以及模型预测能力和模型复杂度的指标。书中每章配有习题,另有习题答案和模型训练的代码,已放置在本书配套的码吉课在线学习平台。本书对概念、模型的描述力求循序渐进、简明易懂,精选的例题和习题具有代表性。本书的内容组织符合大数据处理的流程,体现了以数据为中心的思考方式。




目录:
目录
丛书序
前言
第1章 绪论
1.1 大数据分析的起源 2
1.2 大数据分析的任务 4
1.3 内容与符号 5
习题1 7
参考文献 7
第2章 数据
2.1 数据概述 10
2.1.1 特征的类型 10
2.1.2 数据集的类型 11
2.2 数据预处理 14
2.2.1 数据合并 14
2.2.2 数据抽样 15
2.2.3 数据清洗 17
2.2.4 数据变换 18
2.2.5 维归约 19
2.3 汇总统计 20
2.3.1 中心趋势度量 20
2.3.2 离散趋势度量 23
2.3.3 多元汇总统计 23
2.4 相似性和相异性的度量 24
2.4.1 简单对象的邻近度 25
2.4.2 数据对象的邻近度 26
2.4.3 邻近度的应用 29
2.5 可视化 30
2.6 评价指标 33
习题2 34
参考文献 35
第3章 线性回归
3.1 多元线性回归 38
3.1.1 多元线性回归模型 38
3.1.2 回归系数的估计 39
3.1.3 估计量的相关性质 40
3.1.4 显著性检验 42
3.2 正则化 43
3.3 岭回归和LASSO回归 44
3.3.1 岭回归 44
3.3.2 LASSO回归 45
3.3.3 岭回归和LASSO回归的直观解释 46
3.4 Logistic回归 47
3.4.1 Logistic分布 47
3.4.2 二项Logistic回归 47
3.4.3 多项Logistic回归 48
3.5 回归诊断 48
3.5.1 回归函数线性诊断 49
3.5.2 误差方差齐性检验 49
3.5.3 误差独立性检验 50
3.5.4 误差正态性检验 50
3.6 回归方法的应用 50
3.6.1 描述统计结果 51
3.6.2 最小二乘回归 51
3.6.3 岭回归算例 52
3.6.4 LASSO回归算例 53
3.6.5 Logistic回归算例 54
习题3 55
参考文献 55
第4章 KNN与朴素贝叶斯法
4.1 分类问题概述 58
4.2 k近邻分类 58
4.2.1 k近邻算法的基本步骤 59
4.2.2 k近邻算法的数学模型 59
4.2.3 近邻算法的实现 61
4.3 朴素贝叶斯分类 64
4.3.1 记号、说明和假设 65
4.3.2 朴素贝叶斯分类的思想方法和模型 65
4.3.3 朴素贝叶斯分类算法 68
4.3.4 朴素贝叶斯分类算法修正 74
习题4 75
参考文献 75
第5章 决策树模型与支持向量机
5.1 决策树模型 78
5.1.1 决策树的工作原理 78
5.1.2 决策树的特征选择 80
5.1.3 决策树的生成算法 83
5.1.4 决策树的剪枝 85
5.2 支持向量机 87
5.2.1 线性可分支持向量机 88
5.2.2 软间隔支持向量机 92
5.2.3 非线性支持向量机 95
5.2.4 SMO算法 97
习题5 101
参考文献 101
第6章 聚类方法
6.1 聚类分析概述 104
6.2 k-means聚类 105
6.2.1 k-means的工作原理 105
6.2.2 k值的优化方法 105
6.3 层次聚类 109
6.3.1 层次聚类的基本思想 109
6.3.2 类间距离的度量 109
6.3.3 层次聚类与k-means聚类的区别与联系 112
6.4 密度聚类 113
6.4.1 DBSCAN算法 114
6.4.2 HDBSCAN算法 115
6.5 聚类算法评价 118
习题6 118
参考文献 120
第7章 集成学习
7.1 Bagging集成 122
7.1.1 Bagging集成的基本原理 122
7.1.2 Bagging集成的算法 124
7.2 随机森林 126
7.2.1 随机森林中特征属性的随机选择 126
7.2.2 随机森林选择决策树为弱学习器的原因 127
7.2.3 随机森林算法 128
7.3 Boosting集成 130
7.3.1 Boosting集成的基本原理 130
7.3.2 Boosting集成的框架与算法 132
7.4 AdaBoost集成 135
7.4.1 AdaBoost中弱学习器的权重对于错误率的自适应性 135
7.4.2 AdaBoost中数据对象的权重对于错误率的自适应性 136
7.4.3 AdaBoost对弱学习器的集成 137
7.4.4. AdaBoost算例 138
习题7 141
参考文献 142
第8章 模型的评估与选择
8.1 模型的误差和复杂度 144
8.1.1 模型的误差 144
8.1.2 模型的复杂度 144
8.1.3 降低复杂度 145
8.2 回归模型的评估与选择 148
8.2.1 AIC准则 148
8.2.2 BIC准则 154
8.2.3 HQC准则 155
8.3 分类模型的评估与选择 155
8.3.1 评估分类器性能的度量 155
8.3.2 ROC…线 158
8.3.3 AUC面积 159
习题8 159
参考文献 160

科学出版社旗舰店店铺主页二维码
科学出版社旗舰店 微信公众号认证
科学出版社秉承多年来形成的“高层次、高水平、高质量”和“严肃、严密、严格”的优良传统与作风,始终坚持为科技创新服务、为传播与普及科学知识服务、为科学家和广大读者服务的宗旨。
扫描二维码,访问我们的微信店铺
随时随地的购物、客服咨询、查询订单和物流...

大数据分析基础

手机启动微信
扫一扫购买

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏

微信支付

支付宝

扫一扫购买

打开微信,扫一扫

或搜索微信号:sciencepress-cspm
科学出版社官方微信公众号

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏