目录
●前言
如何获取学习资源
第1章 Python与数据科学
1.1 大数据分析与机器学习概述
1.1.1 大数据分析与机器学习的应用领域
1.1.2 机器学习的基本概念
1.1.3 Python在数据科学中的作用
1.2 Python编程环境部署与基本操作
1.2.1 Python的安装
1.2.2 Pycharm的安装与设置
1.2.3 Jupyter Notebook的使用
1.3 Python基础知识概要
第2章 数据分析利器:NumPy、pandas与Matplotlib库
2.1 NumPy库基础
2.1.1 NumPy库与数组
2.1.2 数组与列表的区别
2.1.3 创建数组的几种方式
2.2 pandas库基础
2.2.1 二维数据表格DataFrame的创建
2.2.2 Excel工作簿等文件的读取和写入
2.2.3 数据的选取与处理
2.2.4 数据表拼接
2.3 Matplotlib库基础
2.3.1 基本图表绘制
2.3.2 数据可视化常用技巧
2.4 案例实战:股票数据读取与K 线图绘制
2.4.1 初步尝试:股票数据读取与可视化
2.4.2 进阶实战:股票K 线图绘制
第3 章 线性回归模型
3.1 一元线性回归
3.1.1 一元线性回归的数学原理
3.1.2 一元线性回归的代码实现
3.1.3 案例实战:不同行业工龄与薪水的线性回归模型
3.2 线性回归模型评估
3.2.1 模型评估的编程实现
3.2.2 模型评估的数学原理
3.3 多元线性回归
3.3.1 多元线性回归的数学原理和代码实现
3.3.2 案例实战:客户价值预测模型
第4 章 逻辑回归模型
4.1 逻辑回归模型的算法原理
4.1.1 逻辑回归模型的数学原理
4.1.2 逻辑回归模型的代码实现
4.1.3 逻辑回归模型的深入理解
4.2 案例实战:客户流失预警模型
4.2.1 案例背景
4.2.2 数据读取与变量划分
4.2.3 模型的搭建与使用
4.3 模型评估方法:ROC 曲线与KS 曲线
4.3.1 ROC 曲线的基本原理
4.3.2 案例实战:用ROC 曲线评估客户流失预警模型
4.3.3 KS 曲线的基本原理
4.3.4 案例实战:用KS 曲线评估客户流失预警模型
第5 章 决策树模型
5.1 决策树模型的基本原理
5.1.1 决策树模型简介
5.1.2 决策树模型的建树依据
5.1.3 决策树模型的代码实现
5.2 案例实战:员工离职预测模型
5.2.1 模型搭建
5.2.2 模型预测及评估
5.2.3 决策树模型可视化呈现及决策树要点理解
5.3 参数调优:K 折交叉验证与GridSearch 网格搜索
5.3.1 K 折交叉验证
5.3.2 GridSearch 网格搜索
第6 章 朴素贝叶斯模型
6.1 朴素贝叶斯模型的算法原理
6.1.1 一维特征变量下的贝叶斯模型
6.1.2 二维特征变量下的贝叶斯模型
6.1.3 n 维特征变量下的贝叶斯模型
6.1.4 朴素贝叶斯模型的简单代码实现
6.2 案例实战:肿瘤预测模型
6.2.1 案例背景
6.2.2 数据读取与划分
6.2.3 模型的搭建与使用
第7 章 K 近邻算法
7.1 K 近邻算法的原理和代码实现
7.1.1 K 近邻算法的基本原理
7.1.2 K 近邻算法的计算步骤
7.1.3 K 近邻算法的代码实现
7.2 案例实战:手写数字识别模型
7.2.1 案例背景
7.2.2 手写数字识别的原理
7.2.3 手写数字识别的代码实现
7.3 图像识别原理详解
第8 章 随机森林模型
8.1 随机森林模型的原理和代码实现
8.1.1 集成模型简介
8.1.2 随机森林模型的基本原理
8.1.3 随机森林模型的代码实现
8.2 案例实战:股票涨跌预测模型
8.2.1 股票基本数据获取
8.2.2 股票衍生变量生成
8.2.3 多因子模型搭建
8.2.4 模型使用与评估
8.2.5 参数调优
8.2.6 收益回测曲线绘制
第9 章 AdaBoost 与GBDT 模型
9.1 AdaBoost 算法原理
9.1.1 AdaBoost 算法的核心思想
9.1.2 AdaBoost 算法的数学原理概述
9.1.3 AdaBoost 算法的数学原理举例
9.1.4 AdaBoost 算法的简单代码实现
9.2 AdaBoost 算法案例实战:信用卡精准营销模型
9.2.1 案例背景
9.2.2 模型搭建
9.2.3 模型预测及评估
9.2.4 模型参数介绍
9.3 GBDT 算法原理
9.3.1 GBDT 算法的核心思想
9.3.2 GBDT 算法的数学原理概述
9.3.3 GBDT 算法的数学原理举例
9.3.4 GBDT 算法的简单代码实现
9.4 GBDT 算法案例实战:产品定价模型
9.4.1 案例背景
9.4.2 模型搭建
9.4.3 模型预测及评估
9.4.4 模型参数介绍
第10 章 机器学习利器:XGBoost 与LightGBM 算法
10.1 XGBoost 算法原理
10.1.1 XGBoost 算法的核心思想
10.1.2 XGBoost 算法的数学原理概述
10.1.3 XGBoost 算法的简单代码实现
10.2 XGBoost 算法案例实战1:金融反欺诈模型
10.2.1 案例背景
10.2.2 模型搭建
……
内容介绍
大数据分析与机器学习技术已成为各行各业实现数字化变革的关键驱动力。本书以功能强大且较易上手的Python语言为编程环境,全面讲解了大数据分析与机器学习技术的商业应用实战。全书共16章,讲解了线性回归模型、逻辑回归模型、决策树模型、朴素贝叶斯模型、K近邻算法模型、随机森林模型、AdaBoost与GBDT模型、XGBoost与LightGBM模型、PCA(主成分分析)模型、聚类与分群模型(KMeans与DBSCAN算法)、协同过滤算法模型、Apriori关联分析模型、神经网络模型等十余种机器学习模型的原理和代码实现,每种模型都配有一到两个典型案例,涵盖金融、营销、医疗、社会科学、企业办公与管理等多个领域。本书适合具备一定数学知识和编程基础、希望快速在工作中应用大数据分析与机器学习技术的读者阅读,也适合Python编程爱好者或对大数据分析与机器学习技术感兴趣的读者参考。