商品详情
书名:大数据分析与挖掘实用案例教程
定价:65.0
ISBN:9787121427800
作者:无
版次:第1版
出版时间:2022-01
内容提要:
大数据分析与挖掘已经广泛应用于各行各业。本书以项目实践为基础,对大数据分析与挖掘的基础知识进行了介绍,总结了机器学习、大数据分析与挖掘过程、数据分析挖掘框架和库,分析了当前的研究热点与前沿技术。为了增强本书的实用性、提高读者的动手能力,本书结合案例讨论了爬虫与数据处理、Echarts和Python可视化、描述性分析、并联分析、回归与分类、聚类、序列挖掘等基本方法的实现与实践。本书结合实际案例,探讨了文本分析、主题模型、推荐系统、知识图谱、情感分析等高级实现与实践。此外,本书还介绍了大数据分析与挖掘在管理领域的应用案例。本书配有电子课件等教学资源,读者可登录华信教育资源网(www.hxedu.com.cn)下载使用。本书适合作为高等学校数据挖掘、商务智能、数据分析等课程的教材,也可供数据分析与数据挖掘从业人员阅读,还可供从事数据挖掘、机器学习应用研究的科研人员参考。
作者简介:
万欣,武汉纺织大学管理学院副教授,毕业于日本电气通信大学,工学博士(社会智能信息学),主要研究方向:商务智能、机器学习、数据挖掘、推荐系统等。曾就职于国内外多家上市公司从事技术研发、软件开发工作。以**作者发表论文十几篇,其中被SCI、EI收录十余篇。大数据分析与挖掘领域教学经验丰富。
目录:
目 录
第1篇 绪 论
第1章 大数据分析与挖掘的概念与理论
1.1 概述
1.2 机器学习
1.2.1 机器学习的定义
1.2.2 机器学习类型
1.2.3 机器学习的应用与工具
1.3 数据挖掘与知识发现过程
1.3.1 CRISP-DM
1.3.2 知识发现
1.4 大数据分析与挖掘中的研究热点与前沿
1.4.1 商务智能研究热点与前沿
1.4.2 大数据分析热点与前沿
1.4.3 机器学习热点与前沿
1.4.4 数据挖掘热点与前沿
1.4.5 本章小结
本章参考文献
本书涉及的环境、语言、框架和库
第2篇 基础实践篇
第2章 爬虫与数据处理——“茶颜悦色”话题情感趋向的影响因素
2.1 相关理论
2.1.1 Python爬虫
2.1.2 其他相关理论
2.2 背景与分析目标
2.3 数据采集与处理
2.3.1 茶颜悦色品牌的选择
2.3.2 数据的选择
2.3.3 数据的采集
2.3.4 数据的处理
2.4 数据的分析与挖掘
2.4.1 情绪分析
2.4.2 词云分析
2.5 拓展思考
2.6 本章小结
本章参考文献
第3章 Echarts可视化——B站视频分区热度及其影响因素分析
3.1 Echarts介绍及使用
3.1.1 Echarts实例
3.1.2 系列
3.1.3 组件
3.1.4 用option描述图表
3.1.5 组件的定位
3.1.6 坐标系
3.1.7 小例子:实现日历图
3.1.8 自定义配置参数
3.2 其他相关理论
3.2.1 主题模型
3.2.2 数据预处理
3.3 背景与分析目标
3.4 数据采集与处理
3.4.1 数据采集
3.4.2 数据处理
3.5 数据分析与挖掘
3.5.1 分区热度
3.5.2 影响因素之视频标题分析
3.5.3 影响因素之视频时长和视频发布时间分析
3.6 拓展思考
3.7 本章小结
本章参考文献
第4章 Python可视化——社科基金项目选题分析
4.1 Python可视化
4.2 背景与分析目标
4.3 数据采集与处理
4.4 数据分析与挖掘
4.4.1 Matplotlib可视化分析
4.4.2 词云图
4.4.3 知识图谱
4.5 拓展思考
4.6 本章小结
本章参考文献
第5章 描述性分析——热映电影背后的成因分析
5.1 描述性分析
5.1.1 描述性分析的含义
5.1.2 基于Python的描述性统计分析
5.2 背景与分析目标
5.2.1 背景
5.2.2 分析目标
5.3 数据采集与处理
5.3.1 数据采集
5.3.2 数据处理
5.4 数据分析与挖掘
5.4.1 电影行业的整体发展情况
5.4.2 电影类型随时间的变化趋势
5.5 拓展思考
5.5.1 数据分析的意义
5.5.2 数据分析的分类
5.6 本章小结
本章参考文献
第6章 关联分析——提高相亲旅游成功率的分析
6.1 相关理论
6.1.1 关联分析概念
6.1.2 频繁项集挖掘方法
6.2 背景与分析目标
6.3 数据采集与处理
6.3.1 数据采集
6.3.2 数据预处理
6.4 数据分析与挖掘
6.4.1 用户属性定位
6.4.2 旅游路线及内容规划
6.4.3 总结
6.5 拓展思考
6.5.1 理论意义
6.5.2 实践意义
6.5.3 优点
6.5.4 不足之处
6.6 本章小结
本章参考文献
第7章 回归与分类——*手房房价影响因素及预测分析
7.1 回归与分类
7.1.1 回归分析
7.1.2 分类与预测
7.2 背景与分析目标
7.3 数据采集与处理
7.4 数据分析与挖掘
7.4.1 数据分析
7.4.2 机器学习与预测房价
7.5 拓展思考
7.6 本章小结
本章参考文献
第8章 分类——民宿价格和评分影响因素分析
8.1 相关理论
8.1.1 分类
8.1.2 线性回归
8.2 背景与分析目标
8.3 数据采集与处理
8.3.1 数据采集
8.3.2 数据预处理
8.4 数据分析与挖掘
8.4.1 民宿价格影响因素分析
8.4.2 民宿评分影响因素分析
8.4.3 结论与对策建议
8.5 拓展思考
8.5.1 理论意义
8.5.2 实践意义
8.5.3 不足之处
8.6 本章小结
本章参考文献
第9章 聚类——新冠肺炎疫情分析及微博评论的数据挖掘
9.1 聚类
9.1.1 聚类方法
9.1.2 K-means
9.1.3 DBSCAN
9.2 背景与分析目标
9.3 数据采集与处理
9.3.1 数据选择
9.3.2 数据采集
9.3.3 数据预处理
9.4 数据分析与挖掘
9.4.1 疫情数据拟合分析
9.4.2 评论数据信息挖掘
9.5 拓展思考
9.5.1 理论意义
9.5.2 实践意义
9.6 本章小结
本章参考文献
第10章 序列挖掘——景区日客流量影响因素分析与预测
10.1 相关理论
10.1.1 序列挖掘
10.1.2 其他相关理论
10.2 背景与分析目标
10.3 数据采集与处理
10.3.1 数据采集
10.3.2 影响因素分析
10.3.3 数据处理
10.4 数据分析与挖掘
10.4.1 平稳时间序列分析
10.4.2 非平稳时间序列分析
10.4.3 其他时间序列分析
10.5 拓展思考
10.5.1 理论意义
10.5.2 实践意义
10.5.3 优点
10.5.4 不足之处
10.6 本章小结
本章参考文献
第3篇 提高实践篇
第11章 文本分析——政府工作报告分析
11.1 文本分析相关理论
11.1.1 概念和方法
11.1.2 工具
11.2 背景与分析目标
11.3 数据采集与处理
11.4 数据分析与挖掘
11.5 本章小结
本章参考文献
第12章 主题模型——生育价值观变化分析
12.1 主题模型
12.1.1 LSI
12.1.2 PLSI
12.1.3 PLSA
12.1.4 LDA
12.2 背景与分析目标
12.3 数据采集与处理
12.3.1 数据选择
12.3.2 数据采集
12.3.3 数据预处理
12.4 数据分析与挖掘
12.4.1 各因素影响研究分析
12.4.2 评论数据的特征分析
12.4.3 语义网络分析
12.4.4 情感分析
12.4.5 LDA主题构建
12.5 拓展思考
12.5.1 理论意义
12.5.2 实践意义
12.5.3 优点
12.5.4 不足之处
12.6 本章小结
本章参考文献
第13章 推荐系统——基于牛客网的职位推荐分析
13.1 推荐系统
13.1.1 基于内容的推荐
13.1.2 协同过滤推荐
13.1.3 混合式推荐
13.2 背景与分析目标
13.3 数据采集与处理
13.4 数据分析与挖掘
13.4.1 可视化分析
13.4.2 推荐系统设计与开发
13.4.3 知识图谱
13.5 拓展思考
13.5.1 理论意义
13.5.2 实践意义
13.5.3 优点
13.5.4 不足之处
13.6 本章小结
本章参考文献
第14章 知识图谱——影评分析
14.1 相关理论
14.1.1 知识图谱
14.1.2 其他相关理论
14.2 背景与分析目标
14.3 数据采集与处理
14.3.1 数据采集
14.3.2 数据描述
14.3.3 数据预处理
14.4 数据分析与挖掘
14.4.1 知识图谱的构建
14.4.2 TF-IDF特征提取
14.4.3 情感分析
14.4.4 LDA主题模型
14.5 拓展思考
14.5.1 理论意义
14.5.2 实践意义
14.5.3 优点
14.5.4 不足之处
14.6 本章小结
本章参考文献
第15章 情感分析——景区印象分析
15.1 相关理论
15.1.1 情感分析
15.1.2 其他相关理论
15.2 背景与分析目标
15.2.1 背景
15.2.2 分析目标
15.2.3 A01景区的竞争形势
15.3 数据采集与处理
15.3.1 数据爬取与清洗
15.3.2 分词与去停用词
15.4 情感分析
15.4.1 关键词提取(TF-IDF)
15.4.2 词云图
15.4.3 情感分类(正、负面情感)
15.4.4 LDA主题模型
15.5 数据分析与挖掘
15.5.1 描述性统计
15.5.2 社会关系网络
15.5.3 SPSS分析
15.5.4 SWOT分析
15.6 拓展思考
15.7 本章小结
本章参考文献
第4篇 管理应用篇
第16章 网红经济背景下审丑现象的受众心理及原因分析——以马某某事件为例
16.1 引言
16.2 文献回顾及相关理论
16.2.1 文献回顾
16.2.2 相关理论
16.3 数据来源与处理
16.3.1 数据来源
16.3.2 数据处理
16.3.3 研究方法
16.4 数据挖掘与分析
16.4.1 博文关键词词频分析
16.4.2 原因类博文分析
16.4.3 评论数据分析
16.5 本章小结
16.5.1 丑味网红流行的原因
16.5.2 用户追捧审丑文化的原因
本章参考文献
第17章 丁真走红背后的那些事——基于微博数据分析
17.1 引言
17.2 文献回顾
17.3 研究方法及理论基础
17.3.1 研究方法
17.3.2 理论基础
17.4 数据挖掘与分析
17.4.1 数据爬取
17.4.2 数据处理
17.4.3 分析过程与结果
17.5 本章小结
本章参考文献
第18章 “准社会交往”原则下网红受欢迎的原因分析——基于丁真微博数据
18.1 引言
18.2 文献回顾
18.3 理论与方法
18.4 数据挖掘与分析
18.4.1 数据爬取
18.4.2 数据处理
18.4.3 分析过程与结果
18.5 本章小结
18.5.1 结论
18.5.2 启示
18.5.3 不足之处
本章参考文献
第19章 基于粉丝经济理论对消费者购买行为影响因素的分析
19.1 引言
19.2 相关理论
19.2.1 粉丝经济
19.2.2 购买意愿
19.3 数据爬取
19.4 数据处理
19.4.1 分词处理
19.4.2 数据数值化
19.5 数据分析
19.5.1 多元线性回归分析
19.5.2 一元分析与多元分析混合
19.6 情感分析
19.6.1 数据筛选
19.6.2 一般消费者情感分析
19.6.3 粉丝消费者情感分析
19.6.4 对比结论
19.7 粉丝经济乱象
19.8 建议
本章参考文献
定价:65.0
ISBN:9787121427800
作者:无
版次:第1版
出版时间:2022-01
内容提要:
大数据分析与挖掘已经广泛应用于各行各业。本书以项目实践为基础,对大数据分析与挖掘的基础知识进行了介绍,总结了机器学习、大数据分析与挖掘过程、数据分析挖掘框架和库,分析了当前的研究热点与前沿技术。为了增强本书的实用性、提高读者的动手能力,本书结合案例讨论了爬虫与数据处理、Echarts和Python可视化、描述性分析、并联分析、回归与分类、聚类、序列挖掘等基本方法的实现与实践。本书结合实际案例,探讨了文本分析、主题模型、推荐系统、知识图谱、情感分析等高级实现与实践。此外,本书还介绍了大数据分析与挖掘在管理领域的应用案例。本书配有电子课件等教学资源,读者可登录华信教育资源网(www.hxedu.com.cn)下载使用。本书适合作为高等学校数据挖掘、商务智能、数据分析等课程的教材,也可供数据分析与数据挖掘从业人员阅读,还可供从事数据挖掘、机器学习应用研究的科研人员参考。
作者简介:
万欣,武汉纺织大学管理学院副教授,毕业于日本电气通信大学,工学博士(社会智能信息学),主要研究方向:商务智能、机器学习、数据挖掘、推荐系统等。曾就职于国内外多家上市公司从事技术研发、软件开发工作。以**作者发表论文十几篇,其中被SCI、EI收录十余篇。大数据分析与挖掘领域教学经验丰富。
目录:
目 录
第1篇 绪 论
第1章 大数据分析与挖掘的概念与理论
1.1 概述
1.2 机器学习
1.2.1 机器学习的定义
1.2.2 机器学习类型
1.2.3 机器学习的应用与工具
1.3 数据挖掘与知识发现过程
1.3.1 CRISP-DM
1.3.2 知识发现
1.4 大数据分析与挖掘中的研究热点与前沿
1.4.1 商务智能研究热点与前沿
1.4.2 大数据分析热点与前沿
1.4.3 机器学习热点与前沿
1.4.4 数据挖掘热点与前沿
1.4.5 本章小结
本章参考文献
本书涉及的环境、语言、框架和库
第2篇 基础实践篇
第2章 爬虫与数据处理——“茶颜悦色”话题情感趋向的影响因素
2.1 相关理论
2.1.1 Python爬虫
2.1.2 其他相关理论
2.2 背景与分析目标
2.3 数据采集与处理
2.3.1 茶颜悦色品牌的选择
2.3.2 数据的选择
2.3.3 数据的采集
2.3.4 数据的处理
2.4 数据的分析与挖掘
2.4.1 情绪分析
2.4.2 词云分析
2.5 拓展思考
2.6 本章小结
本章参考文献
第3章 Echarts可视化——B站视频分区热度及其影响因素分析
3.1 Echarts介绍及使用
3.1.1 Echarts实例
3.1.2 系列
3.1.3 组件
3.1.4 用option描述图表
3.1.5 组件的定位
3.1.6 坐标系
3.1.7 小例子:实现日历图
3.1.8 自定义配置参数
3.2 其他相关理论
3.2.1 主题模型
3.2.2 数据预处理
3.3 背景与分析目标
3.4 数据采集与处理
3.4.1 数据采集
3.4.2 数据处理
3.5 数据分析与挖掘
3.5.1 分区热度
3.5.2 影响因素之视频标题分析
3.5.3 影响因素之视频时长和视频发布时间分析
3.6 拓展思考
3.7 本章小结
本章参考文献
第4章 Python可视化——社科基金项目选题分析
4.1 Python可视化
4.2 背景与分析目标
4.3 数据采集与处理
4.4 数据分析与挖掘
4.4.1 Matplotlib可视化分析
4.4.2 词云图
4.4.3 知识图谱
4.5 拓展思考
4.6 本章小结
本章参考文献
第5章 描述性分析——热映电影背后的成因分析
5.1 描述性分析
5.1.1 描述性分析的含义
5.1.2 基于Python的描述性统计分析
5.2 背景与分析目标
5.2.1 背景
5.2.2 分析目标
5.3 数据采集与处理
5.3.1 数据采集
5.3.2 数据处理
5.4 数据分析与挖掘
5.4.1 电影行业的整体发展情况
5.4.2 电影类型随时间的变化趋势
5.5 拓展思考
5.5.1 数据分析的意义
5.5.2 数据分析的分类
5.6 本章小结
本章参考文献
第6章 关联分析——提高相亲旅游成功率的分析
6.1 相关理论
6.1.1 关联分析概念
6.1.2 频繁项集挖掘方法
6.2 背景与分析目标
6.3 数据采集与处理
6.3.1 数据采集
6.3.2 数据预处理
6.4 数据分析与挖掘
6.4.1 用户属性定位
6.4.2 旅游路线及内容规划
6.4.3 总结
6.5 拓展思考
6.5.1 理论意义
6.5.2 实践意义
6.5.3 优点
6.5.4 不足之处
6.6 本章小结
本章参考文献
第7章 回归与分类——*手房房价影响因素及预测分析
7.1 回归与分类
7.1.1 回归分析
7.1.2 分类与预测
7.2 背景与分析目标
7.3 数据采集与处理
7.4 数据分析与挖掘
7.4.1 数据分析
7.4.2 机器学习与预测房价
7.5 拓展思考
7.6 本章小结
本章参考文献
第8章 分类——民宿价格和评分影响因素分析
8.1 相关理论
8.1.1 分类
8.1.2 线性回归
8.2 背景与分析目标
8.3 数据采集与处理
8.3.1 数据采集
8.3.2 数据预处理
8.4 数据分析与挖掘
8.4.1 民宿价格影响因素分析
8.4.2 民宿评分影响因素分析
8.4.3 结论与对策建议
8.5 拓展思考
8.5.1 理论意义
8.5.2 实践意义
8.5.3 不足之处
8.6 本章小结
本章参考文献
第9章 聚类——新冠肺炎疫情分析及微博评论的数据挖掘
9.1 聚类
9.1.1 聚类方法
9.1.2 K-means
9.1.3 DBSCAN
9.2 背景与分析目标
9.3 数据采集与处理
9.3.1 数据选择
9.3.2 数据采集
9.3.3 数据预处理
9.4 数据分析与挖掘
9.4.1 疫情数据拟合分析
9.4.2 评论数据信息挖掘
9.5 拓展思考
9.5.1 理论意义
9.5.2 实践意义
9.6 本章小结
本章参考文献
第10章 序列挖掘——景区日客流量影响因素分析与预测
10.1 相关理论
10.1.1 序列挖掘
10.1.2 其他相关理论
10.2 背景与分析目标
10.3 数据采集与处理
10.3.1 数据采集
10.3.2 影响因素分析
10.3.3 数据处理
10.4 数据分析与挖掘
10.4.1 平稳时间序列分析
10.4.2 非平稳时间序列分析
10.4.3 其他时间序列分析
10.5 拓展思考
10.5.1 理论意义
10.5.2 实践意义
10.5.3 优点
10.5.4 不足之处
10.6 本章小结
本章参考文献
第3篇 提高实践篇
第11章 文本分析——政府工作报告分析
11.1 文本分析相关理论
11.1.1 概念和方法
11.1.2 工具
11.2 背景与分析目标
11.3 数据采集与处理
11.4 数据分析与挖掘
11.5 本章小结
本章参考文献
第12章 主题模型——生育价值观变化分析
12.1 主题模型
12.1.1 LSI
12.1.2 PLSI
12.1.3 PLSA
12.1.4 LDA
12.2 背景与分析目标
12.3 数据采集与处理
12.3.1 数据选择
12.3.2 数据采集
12.3.3 数据预处理
12.4 数据分析与挖掘
12.4.1 各因素影响研究分析
12.4.2 评论数据的特征分析
12.4.3 语义网络分析
12.4.4 情感分析
12.4.5 LDA主题构建
12.5 拓展思考
12.5.1 理论意义
12.5.2 实践意义
12.5.3 优点
12.5.4 不足之处
12.6 本章小结
本章参考文献
第13章 推荐系统——基于牛客网的职位推荐分析
13.1 推荐系统
13.1.1 基于内容的推荐
13.1.2 协同过滤推荐
13.1.3 混合式推荐
13.2 背景与分析目标
13.3 数据采集与处理
13.4 数据分析与挖掘
13.4.1 可视化分析
13.4.2 推荐系统设计与开发
13.4.3 知识图谱
13.5 拓展思考
13.5.1 理论意义
13.5.2 实践意义
13.5.3 优点
13.5.4 不足之处
13.6 本章小结
本章参考文献
第14章 知识图谱——影评分析
14.1 相关理论
14.1.1 知识图谱
14.1.2 其他相关理论
14.2 背景与分析目标
14.3 数据采集与处理
14.3.1 数据采集
14.3.2 数据描述
14.3.3 数据预处理
14.4 数据分析与挖掘
14.4.1 知识图谱的构建
14.4.2 TF-IDF特征提取
14.4.3 情感分析
14.4.4 LDA主题模型
14.5 拓展思考
14.5.1 理论意义
14.5.2 实践意义
14.5.3 优点
14.5.4 不足之处
14.6 本章小结
本章参考文献
第15章 情感分析——景区印象分析
15.1 相关理论
15.1.1 情感分析
15.1.2 其他相关理论
15.2 背景与分析目标
15.2.1 背景
15.2.2 分析目标
15.2.3 A01景区的竞争形势
15.3 数据采集与处理
15.3.1 数据爬取与清洗
15.3.2 分词与去停用词
15.4 情感分析
15.4.1 关键词提取(TF-IDF)
15.4.2 词云图
15.4.3 情感分类(正、负面情感)
15.4.4 LDA主题模型
15.5 数据分析与挖掘
15.5.1 描述性统计
15.5.2 社会关系网络
15.5.3 SPSS分析
15.5.4 SWOT分析
15.6 拓展思考
15.7 本章小结
本章参考文献
第4篇 管理应用篇
第16章 网红经济背景下审丑现象的受众心理及原因分析——以马某某事件为例
16.1 引言
16.2 文献回顾及相关理论
16.2.1 文献回顾
16.2.2 相关理论
16.3 数据来源与处理
16.3.1 数据来源
16.3.2 数据处理
16.3.3 研究方法
16.4 数据挖掘与分析
16.4.1 博文关键词词频分析
16.4.2 原因类博文分析
16.4.3 评论数据分析
16.5 本章小结
16.5.1 丑味网红流行的原因
16.5.2 用户追捧审丑文化的原因
本章参考文献
第17章 丁真走红背后的那些事——基于微博数据分析
17.1 引言
17.2 文献回顾
17.3 研究方法及理论基础
17.3.1 研究方法
17.3.2 理论基础
17.4 数据挖掘与分析
17.4.1 数据爬取
17.4.2 数据处理
17.4.3 分析过程与结果
17.5 本章小结
本章参考文献
第18章 “准社会交往”原则下网红受欢迎的原因分析——基于丁真微博数据
18.1 引言
18.2 文献回顾
18.3 理论与方法
18.4 数据挖掘与分析
18.4.1 数据爬取
18.4.2 数据处理
18.4.3 分析过程与结果
18.5 本章小结
18.5.1 结论
18.5.2 启示
18.5.3 不足之处
本章参考文献
第19章 基于粉丝经济理论对消费者购买行为影响因素的分析
19.1 引言
19.2 相关理论
19.2.1 粉丝经济
19.2.2 购买意愿
19.3 数据爬取
19.4 数据处理
19.4.1 分词处理
19.4.2 数据数值化
19.5 数据分析
19.5.1 多元线性回归分析
19.5.2 一元分析与多元分析混合
19.6 情感分析
19.6.1 数据筛选
19.6.2 一般消费者情感分析
19.6.3 粉丝消费者情感分析
19.6.4 对比结论
19.7 粉丝经济乱象
19.8 建议
本章参考文献
- 电子工业出版社有限公司
- 电子工业出版社有限公司有赞官方供货商,为客户提供一流的知识产品及服务。
- 扫描二维码,访问我们的微信店铺