商品详情
数据科学实践(数据科学与大数据技术丛书)
作者:吕晓玲 李舰 魏太云
书号:311463
定价:¥42 元
字数:300 千字
印次:1-1
开本:
出版时间:2023-01-11
ISBN:978-7-300-31146-3
包装:
内容简介
数据科学实践课程是在数学、统计基础课以及机器学习、深度学习、分布式计算等专业课程之后开设的一门以实践为主的提升课程,目的是让学生对所学知识融会贯通,解决社会生产实践的具体问题。本书的安排以案例教学为主,在第1章引言与第2章基础模型知识点介绍之后,第3、4、5章为三个大型机器学习案例,包括单机版实现以及 Hadoop 平台分布式实现,第6、7章为两个深度学习案例,需要用 GPU 服务器实现。本书提所有的原始数据和代码可以从中国人民大学出版社网站(www.crup.com.cn)下载。
作者介绍
吕晓玲 中国人民大学统计学院教授、数据科学与大数据统计系主任。研究方向:统计学习与数据科学、消费者行为分析、文本分析。 李舰 统计学本科、软件工程硕士、商学博士,数据科学应用领域的多年从业者,是“统计之都”社区的核心成员之一、一些开源社区的活跃贡献者,致力于数据科学在实体行业的应用。著有《数据科学概论》《统计之美》等书。
目 录精彩样章
第 1 章 引言
1.1 数据科学与人工智能时代
1.2 数据智慧
1.3 本书内容安排
第 2 章 基础模型
2.1 机器学习方法
2.1.1 双向聚类
2.1.2 基于邻居的推荐算法
2.1.3 网络模型
2.2 深度学习
2.2.1 机器翻译模型
2.2.2 图像分析模型
第 3 章 音乐风格识别
3.1 背景介绍
3.2 方法简介
3.2.1 音频数据和音频特征
3.2.2 混合动力模型架构
3.3 描述分析
3.3.1 数据来源及简介
3.3.2 数据加工
3.3.3 音频特征提取
3.4 混合动力模型架构
3.4.1 两个基础模型的预测效果
3.4.2 混合动力模型架构的预测效果
3.4.3 工程优化
第 4 章 航空数据案例分析
4.1 数据简介
4.2 单机实现
4.2.1 基于 Mysql 的数据预处理
4.2.2 洛杉矶到波士顿航线的延误分析
4.2.3 机场聚类分析
4.2.4 最短路径
4.3 分布式实现
4.3.1 基于 Hive 的数据预处理
4.3.2 用 Spark 建立分类模型
第 5 章 公共自行车数据案例分析
5.1 数据简介
5.1.1 交易流水表
5.1.2 纽约市天气数据
5.2 单机实现
5.2.1 描述统计分析与可视化展现
5.2.2 自行车角度的分析
5.2.3 单个站点借车量预测分析
5.3 分布式实现
5.3.1 数据预处理与描述统计
5.3.2 分布式预测模型
第 6 章 机器翻译实例
6.1 数据简介与数据预处理
6.1.1 删除异常值
6.1.2 修改异常值及数据筛选
6.1.3 BPE 分词
6.2 数据描述统计
6.2.1 句子长度统计
6.2.2 词频统计
6.2.3 词性统计
6.3 Seq2Seq+Attention 模型
6.3.1 Seq2Seq 模型介绍
6.3.2 模型训练过程
6.3.3 BLEU 值计算原理
6.3.4 模型训练结果
6.4 Transformer 模型
6.4.1 训练模型参数设置
6.4.2 训练结果
6.5 模型对比
第 7 章 眼底图像分析示例
7.1 数据简介
7.2 图像分割模型建立
7.2.1 数据预处理
7.2.2 模型训练
7.3 基于图像的智能诊断
7.3.1 图像分割结果
7.3.2 描述统计
7.3.3 诊断模型
精彩样章
21 世纪人类社会步入了数据科学时代。随着现代社会的进步和通信技术的发展, 在政治、经济、社会、文化等各个领域形成了规模巨大、增长与传递迅速、形式复杂多样、非结 构化程度高的大数据。大数据的来源包括传感器、移动设备、在线交易、社交网络等, 其形 式可以是各种空间数据, 报表统计数据, 文字、声音、图像、超文本等各种环境和文化数据信息等。当下是一个海量数据广泛出现、运用逐渐普及的新的历史时期, 新的社会环境需要我们认真研究与应对。
作为统计学科的教育工作者, 我们要始终走在时代的前列, 为学生开设最前沿的课程。数据科学实践这门课程是在数学、统计学的基础课以及机器学习、深度学习、分布式计算等专业课程之后开设的一门以实践为主的提升课程, 目的是让学生对所学知识融会贯通, 解决社会生产实践的具体问题。因此, 本书的安排以案例教学为主, 在第 1 章引言与第 2 章基础 模型知识点介绍之后, 第 3、4、5 章为三个大型机器学习案例, 包括单机版实现以及 Hadoop平台分布式实现。第 6、7 章为两个深度学习案例, 需要用 GPU 服务器实现。读者可以从中国人民大学出版社网站 (www.crup.com.cn) 下载本书所有的原始数据和代码。
时代在发展, 社会在进步,我们的教学工作也需要不断提升。本书仍有很多不足之处, 希望读者不吝赐教 ,有机会再版的话, 使其日臻完善。
- 人民大学出版社微店 (微信公众号认证)
- 人大出版社自营微店,正版人大出版社书籍直发,品质保证!
- 扫描二维码,访问我们的微信店铺
- 随时随地的购物、客服咨询、查询订单和物流...