机械工业出版社旗舰店店铺主页二维码
机械工业出版社旗舰店 微信认证
微信扫描二维码,访问我们的微信店铺
你可以使用微信联系我们,随时随地的购物、客服咨询、查询订单和物流...

官网 数据挖掘算法实践与案例详解 丁兆云 沈大勇 徐伟 周鋆 数据科学与工程技术丛书 数据挖掘算法模型技术书籍

40.10
运费: 免运费
官网 数据挖掘算法实践与案例详解 丁兆云 沈大勇 徐伟 周鋆 数据科学与工程技术丛书 数据挖掘算法模型技术书籍 商品图0
官网 数据挖掘算法实践与案例详解 丁兆云 沈大勇 徐伟 周鋆 数据科学与工程技术丛书 数据挖掘算法模型技术书籍 商品缩略图0

商品详情

书名:数据挖掘算法实践与案例详解
定价:59.0
ISBN:9787111760696
作者:丁兆云
版次:1
出版时间:2025-02

内容提要:


数据挖掘算法为大数据与人工智能的核心,掌握数据挖掘各算法的编程实现,有助于提升大数据的实践运用能力。本书详细阐述了数据挖掘常用算法与编程实现,同时,本书以多个经典的数据挖掘赛题为案例,详细论述了数据预处理、特征选择、可视化、算法选择等全流程数据挖掘过程的编程实现,有助于提升读者面对实际数据问题时灵活运用各类算法能力。





目录:


目  录
前言
1章 绪论  1
1.1 数据挖掘技术的由来  1
1.2 数据挖掘的分类  2
1.2.1 关联规则挖掘  2
1.2.2 监督式机器学习  3
1.2.3 非监督式机器学习  4
1.3 Python的安装步骤  5
1.3.1 Python环境的配置  5
1.3.2 PyCharm的安装  7
1.4 常见的数据集  10
1.4.1 鸢尾花数据集  10
1.4.2 员工离职预测数据集  11
1.4.3 泰坦尼克号灾难预测数据集  12
1.4.4 PM2.5空气质量预测数据集  13
1.5 本章小结  13
2章 分类  14
2.1 分类的概念  14
2.2 分类中的训练集与测试集  14
2.3 分类的过程及验证方法  15
2.3.1 准确率  15
2.3.2 k折交叉验证  16
2.4 贝叶斯分类的编程实践  17
2.4.1 鸢尾花数据集的贝叶斯分类  17
2.4.2 基于贝叶斯分类的员工离职
预测  17
2.5 本章小结  19
3章 数据的特征选择  20
3.1 直方图  20
3.1.1 直方图可视化  20
3.1.2 直方图特征选择  23
3.2 直方图与柱状图的差异  24
3.3 特征选择实践  26
3.4 本章小结  29
4章 数据预处理之数据清洗  30
4.1 案例概述  30
4.2 缺失值处理  31
4.2.1 缺失值处理概述  31
4.2.2 缺失值处理实例  32
4.3 噪声数据处理  32
4.3.1 正态分布噪声数据检测  32
4.3.2 用箱线图检测噪声数据  34
4.4 数据预处理案例实践  35
4.4.1 问题  35
4.4.2 解决方法  35
4.4.3 实践结论  37
4.5 本章小结  38
5章 数据预处理之转换  39
5.1 数据的数值化处理  39
5.1.1 顺序编码  39
5.1.2 二进制编码  40
5.2 数据规范化  42
5.2.1 最小–最大规范化  42
5.2.2 z分数规范化  43
5.2.3 小数定标规范化  43
5.3 本章小结  43
6章 数据预处理之数据降维  44
6.1 散点图可视化分析  44
6.2 主成分分析  46
6.3 本章小结  49
7章 不平衡数据分类  50
7.1 不平衡数据分类问题的特征  50
7.1.1 数据稀缺问题  50
7.1.2 噪声问题  51
7.1.3 决策面偏移问题  51
7.1.4 评价标准问题  51
7.2 重采样方法  51
7.2.1 上采样  52
7.2.2 对上采样方法的改进  53
7.2.3 下采样  58
7.2.4 对下采样方法的改进  60
7.2.5 不平衡问题的其他处理方式  65
7.3 不平衡数据分类实践  65
7.4 本章小结  66
8章 回归分析  67
8.1 线性回归  67
8.1.1 一元线性回归  67
8.1.2 多元线性回归  69
8.2 回归分析检测  71
8.2.1 正态分布可能性检测  71
8.2.2 线性分布可能性检测  72
8.2.3 log转换后的分布  73
8.3 回归预测案例实践  74
8.3.1 案例背景  74
8.3.2 代码实现  74
8.4 本章小结  82
9章 聚类分析  83
9.1 k均值聚类  83
9.1.1 算法的步骤  83
9.1.2 代码实现  83
9.2 层次聚类  84
9.2.1 算法的步骤  84
9.2.2 代码实现  85
9.3 密度聚类  85
9.3.1 算法的步骤  85
9.3.2 代码实现  86
9.4 本章小结  88
10章 关联分析  90
10.1 Apriori算法  90
10.2 关联分析案例实践  92
10.2.1 案例背景  92
10.2.2 案例的数据集  93
10.2.3 代码实现  93
10.2.4 运行结果  93
10.3 提升Apriori算法性能的方法  95
10.4 本章小结  95
11章 KNN分类  96
11.1 KNN算法的步骤  96
11.2 KNeighborsClassifier函数  97
11.3 KNN的代码实现  98

机械工业出版社旗舰店店铺主页二维码
机械工业出版社旗舰店 微信公众号认证
扫描二维码,访问我们的微信店铺
随时随地的购物、客服咨询、查询订单和物流...

官网 数据挖掘算法实践与案例详解 丁兆云 沈大勇 徐伟 周鋆 数据科学与工程技术丛书 数据挖掘算法模型技术书籍

手机启动微信
扫一扫购买

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏

微信支付

支付宝

扫一扫购买

打开微信,扫一扫

或搜索微信号:cmp1952
机工书院官方微信公众号

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏