商品详情
《Python数据分析全流程实操指南》
定价:79.00元
作者:尚涛 编著
书号:978-7-301-28949-5
装帧:平装
出版日期:2020.9
出版社:北京大学出版社
开本:16开
页码:352
内容简介
本书基于Python3.7版本软件编写,全书主要围绕整个数据分析方法论的标准流程,为读者重点展示了Python在数据获取、数据处理、数据探索、数据分析及数据可视化等领域的应用技术。
本书首先介绍了数据分析的方法论,给读者介绍了具体的数据分析挖掘标准流程,接着介绍了Python常用的工具包,包括科学计算库NumPy、数据分析库Pandas、数据挖掘库Scikit-Learn,以及数据可视化库Matplotlib和Seaborn的基本知识,并从数据分析挖掘过程中的数据获取、数据处理、数据探索等实际业务应用出发,以互联 网、金融及零售等行业真实案例,比如客户分群、产品精准营销、房价预测、特征降维等,深入浅出、循序渐进地介绍Python数据分析的全过程。
本书内容精练、重点突出、案例丰富,实践性和指导性极强,值得一读,特别适合在企业中从事数据分析、数据挖掘、机器学习、运营分析等工作的人员使用,同样适合想从事数据分析挖掘工作的各大中专院校的学生与教师,以及其他对数据分析挖掘技术领域有兴趣爱好的各类人员使用。
作者简介
尚涛,毕业于上海交通大学数学系,拥有数学硕士学位,研究方向为数据挖掘与机器学习应用领域,曾任职于支付宝、平安科技、易方达基金。现任职于南方基金,专注于信用风险评分、精准营销、推荐系统等领域数据挖掘项目的研发工作,拥有超过 10 年的数据挖掘和优化建模经验,以及多年使用 SAS、R、Python 等软件的经验。在从业经历中,为所在公司的业务方成功实施了众多深受好评的数据挖掘项目,取得了较好的业务价值。
目录
第一章 数据分析方法
11.1 什么是数据分析2
1.2 数据分析标准流程2
1.3 数据清洗7
1.4 数据探索8
1.5 模型开发10
1.6 模型应用11
第二章 初识Python12
2.1 Python基本概述13
2.2 Python编程语法基础14
2.3 数据分析常用Python库22
2.4 第三方Python库介绍23
第三章 NumPy数组与矩阵25
3.1 Ndarray对象26
3.2 数据类型27
3.3 数组属性28
3.4 创建数组30
3.5 数据索引与切片34
3.6 数组操作37
3.7 数组排序51
3.8 函数54
3.9 矩阵62
第四章 Pandas数据分析65
4.1 系列(Series)66
4.2 数据帧(DataFrame)68
4.3 基本功能介绍70
4.4 读取和写入数据78
4.5 索引和选择数据84
4.6 数据合并87
4.7 累计与分组91
4.8 时间序列处理96
4.9 缺失数据处理101
4.10 函数107
4.11 描述性统计115
4.12 绘制图形118
第五章 Scikit-Learn数据挖掘126
5.1 机器学习问题127
5.2 机器学习的基本流程127
5.3 数据处理128
5.4 特征选择131
5.5 模型调用135
5.6 模型参数说明138
5.7 交叉验证148
5.8 模型部署151
第六章 数据可视化153
6.1 Matplotlib绘制图形154
6.2 Seaborn绘制图形163
6.3 重要类型图形的绘制184
第七章 数据导入与导出192
7.1 连接数据库193
7.2 读取外部数据194
7.3 导出数据201
第八章 数据预处理203
8.1 数据去重204
8.2 缺失值处理205
8.3 变量操作210
8.4 样本选择217
8.5 数据集操作220
第九章 数据探索226
9.1 集中趋势227
9.2 离散程度230
9.3 分布状态234
9.4 相关分析236
第十章 线性回归分析241
10.1 线性回归模型242
10.2 最小二乘估计243
10.3 显著性检验244
10.4 预测245
10.5 相关性246
10.6 共线性247
10.7 案例分析——波士顿地区房价预测247
第十一章 Logistic回归分析260
11.1 逻辑回归模型介绍261
11.2 案例分析——泰坦尼克生存预测262
第十二章 决策树275
12.1 决策树介绍276
12.2 案例分析——金融产品推荐277
第十三章 主成分分析292
13.1 主成分分析的数学模型293
13.2 PCA函数说明294
13.3 案例分析——数据降维295
第十四章 聚类分析304
14.1 距离305
14.2 聚类方法306
14.3 确定聚类数309
14.4 聚类的分析步骤311
14.5 案例分析——客户群聚类分析312
第十五章 时间序列分析323
15.1 时间序列的组成部分324
15.2 确定性的时间序列模型325
15.3 随机时间序列模型325
15.4 ARMA模型的识别327
15.5 时间序列的分析步骤329
15.6 模型参数的估计329
15.7 案例分析——大气二氧化碳浓度预测331
- 北京大学出版社旗舰店 (微信公众号认证)
- 【发票】在订单留言电子邮箱、发票抬头、税号、(统一开电子发票,缺一项都不能开票,自行下载打印)
- 扫描二维码,访问我们的微信店铺
- 随时随地的购物、客服咨询、查询订单和物流...