人民大学出版社微店店铺主页二维码
人民大学出版社微店 微信认证
人大出版社自营微店,正版人大出版社书籍直发,品质保证!
微信扫描二维码,访问我们的微信店铺
你可以使用微信联系我们,随时随地的购物、客服咨询、查询订单和物流...

数据科学实践(数据科学与大数据技术丛书)

32.80
运费: ¥ 5.00-20.00
数据科学实践(数据科学与大数据技术丛书) 商品图0
数据科学实践(数据科学与大数据技术丛书) 商品缩略图0

商品详情

数据科学实践(数据科学与大数据技术丛书)

作者:吕晓玲 李舰 魏太云

书号:311463

定价:¥42 元

字数:300 千字

印次:1-1

开本:

出版时间:2023-01-11

ISBN:978-7-300-31146-3

包装:


内容简介

数据科学实践课程是在数学、统计基础课以及机器学习、深度学习、分布式计算等专业课程之后开设的一门以实践为主的提升课程,目的是让学生对所学知识融会贯通,解决社会生产实践的具体问题。本书的安排以案例教学为主,在第1章引言与第2章基础模型知识点介绍之后,第3、4、5章为三个大型机器学习案例,包括单机版实现以及 Hadoop 平台分布式实现,第6、7章为两个深度学习案例,需要用 GPU 服务器实现。本书提所有的原始数据和代码可以从中国人民大学出版社网站(www.crup.com.cn)下载。


作者介绍

吕晓玲 中国人民大学统计学院教授、数据科学与大数据统计系主任。研究方向:统计学习与数据科学、消费者行为分析、文本分析。 李舰 统计学本科、软件工程硕士、商学博士,数据科学应用领域的多年从业者,是“统计之都”社区的核心成员之一、一些开源社区的活跃贡献者,致力于数据科学在实体行业的应用。著有《数据科学概论》《统计之美》等书。


目 录精彩样章

第 1 章 引言

1.1 数据科学与人工智能时代

1.2 数据智慧

1.3 本书内容安排

第 2 章 基础模型

2.1 机器学习方法

2.1.1 双向聚类

2.1.2 基于邻居的推荐算法

2.1.3 网络模型

2.2 深度学习

2.2.1 机器翻译模型

2.2.2 图像分析模型


第 3 章 音乐风格识别

3.1 背景介绍

3.2 方法简介

3.2.1 音频数据和音频特征

3.2.2 混合动力模型架构

3.3 描述分析

3.3.1 数据来源及简介

3.3.2 数据加工

3.3.3 音频特征提取

3.4 混合动力模型架构

3.4.1 两个基础模型的预测效果

3.4.2 混合动力模型架构的预测效果

3.4.3 工程优化


第 4 章 航空数据案例分析

4.1 数据简介

4.2 单机实现

4.2.1 基于 Mysql 的数据预处理

4.2.2 洛杉矶到波士顿航线的延误分析

4.2.3 机场聚类分析

4.2.4 最短路径

4.3 分布式实现

4.3.1 基于 Hive 的数据预处理

4.3.2 用 Spark 建立分类模型


第 5 章 公共自行车数据案例分析

5.1 数据简介

5.1.1 交易流水表

5.1.2 纽约市天气数据

5.2 单机实现

5.2.1 描述统计分析与可视化展现

5.2.2 自行车角度的分析

5.2.3 单个站点借车量预测分析

5.3 分布式实现

5.3.1 数据预处理与描述统计

5.3.2 分布式预测模型


第 6 章 机器翻译实例

6.1 数据简介与数据预处理

6.1.1 删除异常值

6.1.2 修改异常值及数据筛选

6.1.3 BPE 分词

6.2 数据描述统计

6.2.1 句子长度统计

6.2.2 词频统计

6.2.3 词性统计

6.3 Seq2Seq+Attention 模型

6.3.1 Seq2Seq 模型介绍

6.3.2 模型训练过程

6.3.3 BLEU 值计算原理

6.3.4 模型训练结果

6.4 Transformer 模型

6.4.1 训练模型参数设置

6.4.2 训练结果

6.5 模型对比

第 7 章 眼底图像分析示例

7.1 数据简介

7.2 图像分割模型建立

7.2.1 数据预处理

7.2.2 模型训练

7.3 基于图像的智能诊断

7.3.1 图像分割结果

7.3.2 描述统计

7.3.3 诊断模型


精彩样章

21 世纪人类社会步入了数据科学时代。随着现代社会的进步和通信技术的发展, 在政治、经济、社会、文化等各个领域形成了规模巨大、增长与传递迅速、形式复杂多样、非结 构化程度高的大数据。大数据的来源包括传感器、移动设备、在线交易、社交网络等, 其形 式可以是各种空间数据, 报表统计数据, 文字、声音、图像、超文本等各种环境和文化数据信息等。当下是一个海量数据广泛出现、运用逐渐普及的新的历史时期, 新的社会环境需要我们认真研究与应对。

作为统计学科的教育工作者, 我们要始终走在时代的前列, 为学生开设最前沿的课程。数据科学实践这门课程是在数学、统计学的基础课以及机器学习、深度学习、分布式计算等专业课程之后开设的一门以实践为主的提升课程, 目的是让学生对所学知识融会贯通, 解决社会生产实践的具体问题。因此, 本书的安排以案例教学为主, 在第 1 章引言与第 2 章基础 模型知识点介绍之后, 第 3、4、5 章为三个大型机器学习案例, 包括单机版实现以及 Hadoop平台分布式实现。第 6、7 章为两个深度学习案例, 需要用 GPU 服务器实现。读者可以从中国人民大学出版社网站 (www.crup.com.cn) 下载本书所有的原始数据和代码。

时代在发展, 社会在进步,我们的教学工作也需要不断提升。本书仍有很多不足之处, 希望读者不吝赐教 ,有机会再版的话, 使其日臻完善。


人民大学出版社微店店铺主页二维码
人民大学出版社微店 微信公众号认证
人大出版社自营微店,正版人大出版社书籍直发,品质保证!
扫描二维码,访问我们的微信店铺
随时随地的购物、客服咨询、查询订单和物流...

数据科学实践(数据科学与大数据技术丛书)

手机启动微信
扫一扫购买

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏

微信支付

支付宝

扫一扫购买

打开微信,扫一扫

或搜索微信号:crup-teacher
人大社教师服务官方微信公众号

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏