大数据挖掘与统计机器学习(第2版)(大数据分析统计应用丛书)吕晓玲 宋捷 人大出版社
| 运费: | ¥ 5.00-20.00 |
| 库存: | 450 件 |
商品详情

本书介绍数据挖掘与统计机器学习领域最常用的模型和算法,包括最基础的线性回归和线性分类方法,以及模型选择和模型评价的概念和方法,进而介绍非线性的回归和分类方法(包括决策树与组合方法、支持向量机、神经网络以及在此基础上发展的深度学习方法)。最后介绍无监督的学习中的聚类方法和业界广泛使用的推荐系统方法。除了方法的理论讲解之外,我们给出了每种方法的R语言实现以及Python语言实现的上机实践。本书的一个亮点是最后一章给出的三个大数据案例,数据量均在10G左右。我们同时给出了单机版(Python、数据库、R)和分布式(Hadoop、Hive、Spark)两种实现方案。原始数据和程序代码均可在中国人民大学出版社网站上下载。
本书对第一版的改进是在读者反馈意见的基础上,增加了理论部分的Lasso模型求解、组合方法的Xgboost方法、支持向量机的SMO求解方法、深度学习的CNN方法等内容;同时所有方法给出了Python语言实现的上机实践;并且第十章增加了第三个大数据案例。以期跟进本领域最新前沿。
本书面向的主要读者是统计专业本科生以及其他各个领域有数据分析需求的学生和从业人员。

吕晓玲,吉林省吉林市人。现任中国人民大学统计学院教授,北京五校联合大数据分析硕士培养协同创新平台总协调人。本科与硕士毕业于南开大学数学系概率统计专业,博士毕业于香港城市大学管理科学系。曾经是奥地利约翰开普勒大学应用统计系以及美国加州大学伯克利分校统计系访问学者。一直从事数据挖掘和统计机器学习领域的理论研究,及其在消费者行为方面的应用研究。在数据挖掘以及市场营销方面的项目涉及的领域包括银行、电子商务、交通、教育、广播电视、移动互联网等。
宋捷,四川眉山人。现任首都经济贸易大学统计学院副教授。本科与硕士毕业于四川大学数学系概率统计专业,博士毕业于中国人民大学统计学院。一直从事机器学习与数据挖掘相关领域的研究工作。
第1章概述
1.1名词演化
1.2基本内容
1.3数据智慧
第2章线性回归方法
2.1多元线性回归
2.2压缩方法:岭回归与Lasso
2.3*Lasso 模型的求解与理论性质
2.4损失函数加罚的建模框架
2.5上机实践:R
2.6上机实践:Python
第3章线性分类方法
3.1分类问题综述与评价准则
3.2Logistic回归
3.3线性判别
3.4上机实践:R
3.5上机实践:Python
第4章模型评价与选择
4.1基本概念
4.2*理论方法
4.3数据重利用方法
4.4上机实践:R
4.5上机实践:Python
第5章决策树与组合方法
5.1决策树
5.2Bagging
5.3Boosting
5.4随机森林
5.5上机实践:R
5.6上机实践:Python
第6章神经网络与深度学习
6.1神网络
6.2深度信念网
6.3卷积神经网络
6.4上机实践:R
6.5上机实践:Python
第7章支持向量机
7.1线性可分支持向量机
7.2软间隔支持向量机
7.3一些拓展
7.4上机实践:R
7.5上机实践:Python
第8章聚类分析
8.1基于距离的聚类
8.2基于模型和密度的聚类
8.3稀疏聚类
8.4双向聚类
8.5上机实践:R
8.6上机实践:Python
第9章推荐系统
9.1基于邻居的推荐
9.2潜在因子与矩阵分解算法
9.3上机实践:R
9.4上机实践:Python
第10章大数据案例分析
10.1智能手机用户监测数据案例分析
10.2美国航空数据案例分析
10.3美国纽约公共自行车数据案例分析
参考文献
- 人民大学出版社微店 (微信公众号认证)
- 人大出版社自营微店,正版人大出版社书籍直发,品质保证!
- 扫描二维码,访问我们的微信店铺
- 随时随地的购物、客服咨询、查询订单和物流...