商品详情
书名:数据分析与数据思维——Python编程要点、分析方法与实践技能
定价:59.8
ISBN:9787121415920
作者:无
版次:第1版
出版时间:2021-07
内容提要:
本书面向零基础的Python学习者和数据分析师,较为详尽的文字叙述与足够的图片解释相结合,篇幅内容合适,没有包含对初学者学习难度过高的知识,提供了丰富的教学资源(包括系统、学习指南、疑难解答等),同时专业解读数据分析师应掌握的编程要点、分析方法和实践技能,实用性强,学习效果好。本书主要内容包括6个模块:Python语言与数据分析、Python语言基础语法、Python语言高级语法、数据准备与加工、数据分析算法与模型、自然语言处理与图像处理。本书可以作为高等院校数据科学与大数据、计算机科学与技术、软件工程等工科类各专业学生的相关课程的教材,也可以作为新文科特色的大数据管理、统计学、金融学、信息管理、电子商务、商务智能、金融科技等相关专业相关课程的教材。
作者简介:
朝乐门,男,1979年生,中国人民大学信息资源管理学院、数据工程与知识工程***重点实验室副教授,博士生导师。中国计算机学会信息系统专委员会委员、ACM高级会员、国际知识管理协会正式委员、全国高校大数据教育联盟大数据教材专家指导委员会委员、清华大学博士后校友会IT分会副秘书长;主持完成国家自然科学基金、国家社会科学基金等重要科学研究项目10余项;参与完成核高基、973、863、国家自然科学基金重点项目、国家社会科学基金重大项目等国家重大科研项目10余项;发表SCI/SSCI/EI/CSCI论文30余篇,软件著作权5个、发明专利3项、出版学术专著3部;获得北京市中青年骨干教师称号、国际知识管理与智力资本杰出成就奖、IBM全球卓越教师奖、Emerald/EFMD国际杰出博士论文奖、国家自然科学基金项目优秀项目、中国大数据学术创新奖、中国大数据创新百人榜单、全国大数据教育行业杰出贡献奖等多种奖励30余项。
目录:
第1章 Python语言与数据分析
学习指南 ........1
1.1 Python语言及其特征 .................................................................................................. 2
1.1.1 Python语言的特点 .......................................................................................... 2
1.1.2 Python语言的版本 .......................................................................................... 3
1.2 数据分析与Python语言 ............................................................................................. 4
1.2.1 Python语言在数据分析领域的重要地位 ....................................................... 6
1.2.2 Python语言程序代码的编写质量 ................................................................... 7
1.3 面向数据分析的Python编程 ...................................................................................... 7
1.3.1 Python语言的基础语法 .................................................................................. 7
1.3.2 Python的第三方工具包 .................................................................................. 8
1.3.3 Python学习或编程中常见误区 ....................................................................... 8
1.4 Python数据分析的集成开发环境 ............................................................................... 9
1.5 Python代码的编写与运行实例 ................................................................................... 10
小结 ....... 12
习题1.................................................................................................................. 13
第2章 Python语言基础语法
学习指南............................................................................................................... 15
2.1 变量及其定义方法 .............................................................................................. 16
2.1.1 变量的定义方法 .............................................................................................. 17
2.1.2 Python是动态类型语言 .................................................................................. 17
2.1.3 Python是强类型语言 ...................................................................................... 18
2.1.4 Python中的变量是引用类变量 ....................................................................... 19
2.1.5 Python中区分大小写 ...................................................................................... 19
2.1.6 变量命名规范 .................................................................................................. 19
2.1.7 iPython的特殊变量 ......................................................................................... 21
2.1.8 查看Python关键字的方法 ............................................................................. 21
2.1.9 查看已定义的所有变量 ................................................................................... 22
2.1.10 删除变量 ........................................................................................................ 23
2.2 运算符、表达式、语句 ............................................................................................... 23
2.2.1 运算符 .................................................................................................. 23
2.2.2 语句书写规范 .................................................................................................. 30
2.2.3 赋值语句 .......................................................................................................... 33
2.2.4 注释语句 .......................................................................................................... 35
2.2.5 if语句 ..................................................................................................... 36
2.2.6 for语句 .................................................................................................... 39
2.2.7 while语句 ........................................................................................................ 42
2.2.8 pass语句 .......................................................................................................... 44
2.3 数据类型与数据结构 ........................................................................................ 45
2.3.1 数据类型 .......................................................................................................... 45
2.3.2 列表.......................................................................................................... 51
2.3.3 元组.................................................................................................... 61
2.3.4 字符串................................................................................................... 67
2.3.5 序列.................................................................................................... 72
2.3.6 集合.................................................................................................... 76
2.3.7 字典.................................................................................................... 80
2.4 包与模块 ......................................................................................................... 82
2.4.1 包 .......................................................................................................... 82
2.4.2 模块 ..................................................................................................... 86
2.5 内置函数、模块函数和自定义函数 ........................................................................... 88
2.5.1 函数 ................................................................................................. 88
2.5.2 内置函数 .......................................................................................................... 90
2.5.3 模块函数 .......................................................................................................... 93
2.5.4 自定义函数 ..................................................................................... 95
小结 .................................................................................................................. 104
习题2 .............................................................................................................. 104
第3章 Python语言高级语法
学习指南 ........................................................................................................ 109
3.1 迭代器与可迭代对象 ................................................................................................... 109
3.1.1 可迭代对象 ................................................................................. 111
3.1.2 迭代器 .................................................................................................. 111
3.2 生成器与装饰器 .......................................................................................................... 112
3.2.1 生成器 .............................................................................................................. 112
3.2.2 装饰器 .............................................................................................................. 113
3.3 查阅帮助 ...................................................................................................................... 115
3.3.1 help函数 .......................................................................................................... 116
3.3.2 docString .......................................................................................................... 116
3.3.3 查看源代码 ........................................................................................... 117
3.3.4 doc属性 ........................................................................................................... 118
3.3.5 dir()函数 .......................................................................................................... 118
3.3.6 其他方法 .......................................................................................................... 119
3.4 异常处理、断言与程序调试 ....................................................................................... 119
3.4.1 try/except/finally .............................................................................................. 121
3.4.2 异常/错误信息的显示模式 ............................................................................. 122
3.4.3 断言与检查点的设置 ....................................................................................... 123
3.4.4 调试程序的基本方法 ....................................................................................... 124
3.5 数据文件的读写 .......................................................................................................... 127
3.5.1 搜索路径 .......................................................................................................... 128
3.5.2 当前工作目录 .................................................................................................. 130
3.5.3 文件读写方法 .................................................................................................. 131
3.6 面向对象编程 .............................................................................................................. 131
3.6.1 类的定义方法 .................................................................................................. 132
3.6.2 类中的特殊方法 .............................................................................................. 133
3.6.3 类之间的继承关系........................................................................................... 135
3.6.4 私有属性及@property装饰器 ........................................................................ 136
3.6.5 self和cls ......................................................................................................... 136
3.6.6 new与init的区别和联系 ................................................................................ 137
小结 ....................................................................................................................................... 138
习题3 ................................................................................................................... 139
第4章 数据准备与加工
学习指南 ............................................................................................................................... 141
4.1 随机数 .......................................................................................................................... 141
4.1.1 一次生成一个随机数 ....................................................................................... 142
4.1.2 一次生成一个随机数组 ................................................................................... 143
4.2 多维数组 ...................................................................................................................... 144
4.2.1 创建方法 .......................................................................................................... 147
4.2.2 主要特征 .......................................................................................................... 148
4.2.3 切片读取 .......................................................................................................... 149
4.2.4 浅拷贝和深拷贝 .............................................................................................. 153
4.2.5 形状与重构 ...................................................................................................... 153
4.2.6 属性计算 .......................................................................................................... 156
4.2.7 ndarray的计算 ................................................................................................. 157
4.2.8 ndarray的元素类型 ......................................................................................... 158
4.2.9 插入与删除 ...................................................................................................... 159
4.2.10 缺失值处理 .................................................................................................... 160
4.2.11 ndarray的广播规则 ....................................................................................... 160
4.2.12 ndarray的排序 ............................................................................................... 162
4.3 数据框 .......................................................................................................................... 162
4.3.1 创建方法 .......................................................................................................... 164
4.3.2 查看行或列 ...................................................................................................... 165
4.3.3 切片方法 .......................................................................................................... 166
4.3.4 索引操作 .......................................................................................................... 168
4.3.5 删除或过滤行/列 ........................................................................................... 169
4.3.6 算术运算 .......................................................................................................... 172
4.3.7 描述性统计 ...................................................................................................... 174
4.3.8 数据排序 .......................................................................................................... 176
4.3.9 导入/导出 ....................................................................................................... 177
4.3.10 缺失数据处理 ................................................................................................ 178
4.3.11 分组统计 ........................................................................................................ 182
4.4 Key-Value型数据 ........................................................................................................ 183
4.4.1 Series的主要特点 ............................................................................................ 184
4.4.2 Series的定义方法 ............................................................................................ 185
4.4.3 Series的操作方法 ............................................................................................ 187
4.5 时间与日期类型数据 ................................................................................................... 189
4.5.1 定义方法 .......................................................................................................... 190
4.5.2 转换方法 .......................................................................................................... 192
4.5.3 显示系统当前时间........................................................................................... 193
4.5.4 计算时差 .......................................................................................................... 194
4.5.5 时间索引 .......................................................................................................... 194
4.5.6 period_range()函数 ......................................................................................... 196
4.6 数据可视化 ........................................................................... 196
4.6.1 Matplotlib 可视化 ............................................................................................ 197
4.6.2 改变图的属性 .................................................................................................. 199
4.6.3 改变图的类型 .................................................................................................. 201
4.6.4 改变图的坐标轴的取值范围 ........................................................................... 202
4.6.5 去掉边界的空白 .............................................................................................. 203
4.6.6 在同一个坐标上画两个图 ............................................................................... 204
4.6.7 多图显示 .......................................................................................................... 205
4.6.8 图的保存 .......................................................................................................... 205
4.6.9 散点图的画法 .................................................................................................. 206
4.6.10 Pandas可视化 ................................................................................................ 206
4.6.11 Seaborn可视化 .............................................................................................. 208
4.6.12 教师工资收入的可视化分析 ......................................................................... 211
小结 ....................................................................................................................................... 212
习题4 ......................................................................................................... 212
第5章 数据分析算法与模型
学习指南 ............................................................................................................................... 215
5.1 基于Python的统计学编程.......................................................................................... 215
5.1.1 女性身高数据的回归分析 ............................................................................... 217
5.1.2 广告投放及销售额分析.................................................................................. 226
5.2 基于Python的机器学习编程 ...................................................................................... 230
5.2.1 威斯康星乳腺癌数据分析及自动诊断 ........................................................... 231
5.2.2 不同国家蛋白质消费结构分析 ....................................................................... 238
小结 ....................................................................................................................................... 244
习题5 .................................................................................................................................... 245
第6章 自然语言处理与图像处理
学习指南 ............................................................................................................................... 247
6.1 自然语言处理 .............................................................................................................. 248
6.1.1 自然语言处理的常用包.................................................................................. 248
6.1.2 自然语言处理的包导入与设置 ....................................................................... 248
6.1.3 数据读入 .......................................................................................................... 249
6.1.4 分词处理 .......................................................................................................... 249
6.1.5 自定义词汇 ...................................................................................................... 250
6.1.6 停用词处理 ...................................................................................................... 253
6.1.7 词性分布分析 .................................................................................................. 254
6.1.8 高频词分析 ...................................................................................................... 255
6.1.9 词频统计 .......................................................................................................... 256
6.1.10 关键词分析 .................................................................................................... 258
6.1.11 生成词云 ........................................................................................................ 258
6.2 人脸识别与图像处理 ................................................................................................... 260
6.2.1 安装并导入opencv-python包 ......................................................................... 260
6.2.2 读取图像文件 .................................................................................................. 261
6.2.3 将RGB图像转换为灰度图 ............................................................................. 261
6.2.4 人脸检测与绘制长方形 ................................................................................... 262
6.2.5 图像显示 .......................................................................................................... 263
6.2.6 图像保存 .......................................................................................................... 263
小结 ....................................................................................................................................... 263
习题6 .................................................................................................................................... 263
定价:59.8
ISBN:9787121415920
作者:无
版次:第1版
出版时间:2021-07
内容提要:
本书面向零基础的Python学习者和数据分析师,较为详尽的文字叙述与足够的图片解释相结合,篇幅内容合适,没有包含对初学者学习难度过高的知识,提供了丰富的教学资源(包括系统、学习指南、疑难解答等),同时专业解读数据分析师应掌握的编程要点、分析方法和实践技能,实用性强,学习效果好。本书主要内容包括6个模块:Python语言与数据分析、Python语言基础语法、Python语言高级语法、数据准备与加工、数据分析算法与模型、自然语言处理与图像处理。本书可以作为高等院校数据科学与大数据、计算机科学与技术、软件工程等工科类各专业学生的相关课程的教材,也可以作为新文科特色的大数据管理、统计学、金融学、信息管理、电子商务、商务智能、金融科技等相关专业相关课程的教材。
作者简介:
朝乐门,男,1979年生,中国人民大学信息资源管理学院、数据工程与知识工程***重点实验室副教授,博士生导师。中国计算机学会信息系统专委员会委员、ACM高级会员、国际知识管理协会正式委员、全国高校大数据教育联盟大数据教材专家指导委员会委员、清华大学博士后校友会IT分会副秘书长;主持完成国家自然科学基金、国家社会科学基金等重要科学研究项目10余项;参与完成核高基、973、863、国家自然科学基金重点项目、国家社会科学基金重大项目等国家重大科研项目10余项;发表SCI/SSCI/EI/CSCI论文30余篇,软件著作权5个、发明专利3项、出版学术专著3部;获得北京市中青年骨干教师称号、国际知识管理与智力资本杰出成就奖、IBM全球卓越教师奖、Emerald/EFMD国际杰出博士论文奖、国家自然科学基金项目优秀项目、中国大数据学术创新奖、中国大数据创新百人榜单、全国大数据教育行业杰出贡献奖等多种奖励30余项。
目录:
第1章 Python语言与数据分析
学习指南 ........1
1.1 Python语言及其特征 .................................................................................................. 2
1.1.1 Python语言的特点 .......................................................................................... 2
1.1.2 Python语言的版本 .......................................................................................... 3
1.2 数据分析与Python语言 ............................................................................................. 4
1.2.1 Python语言在数据分析领域的重要地位 ....................................................... 6
1.2.2 Python语言程序代码的编写质量 ................................................................... 7
1.3 面向数据分析的Python编程 ...................................................................................... 7
1.3.1 Python语言的基础语法 .................................................................................. 7
1.3.2 Python的第三方工具包 .................................................................................. 8
1.3.3 Python学习或编程中常见误区 ....................................................................... 8
1.4 Python数据分析的集成开发环境 ............................................................................... 9
1.5 Python代码的编写与运行实例 ................................................................................... 10
小结 ....... 12
习题1.................................................................................................................. 13
第2章 Python语言基础语法
学习指南............................................................................................................... 15
2.1 变量及其定义方法 .............................................................................................. 16
2.1.1 变量的定义方法 .............................................................................................. 17
2.1.2 Python是动态类型语言 .................................................................................. 17
2.1.3 Python是强类型语言 ...................................................................................... 18
2.1.4 Python中的变量是引用类变量 ....................................................................... 19
2.1.5 Python中区分大小写 ...................................................................................... 19
2.1.6 变量命名规范 .................................................................................................. 19
2.1.7 iPython的特殊变量 ......................................................................................... 21
2.1.8 查看Python关键字的方法 ............................................................................. 21
2.1.9 查看已定义的所有变量 ................................................................................... 22
2.1.10 删除变量 ........................................................................................................ 23
2.2 运算符、表达式、语句 ............................................................................................... 23
2.2.1 运算符 .................................................................................................. 23
2.2.2 语句书写规范 .................................................................................................. 30
2.2.3 赋值语句 .......................................................................................................... 33
2.2.4 注释语句 .......................................................................................................... 35
2.2.5 if语句 ..................................................................................................... 36
2.2.6 for语句 .................................................................................................... 39
2.2.7 while语句 ........................................................................................................ 42
2.2.8 pass语句 .......................................................................................................... 44
2.3 数据类型与数据结构 ........................................................................................ 45
2.3.1 数据类型 .......................................................................................................... 45
2.3.2 列表.......................................................................................................... 51
2.3.3 元组.................................................................................................... 61
2.3.4 字符串................................................................................................... 67
2.3.5 序列.................................................................................................... 72
2.3.6 集合.................................................................................................... 76
2.3.7 字典.................................................................................................... 80
2.4 包与模块 ......................................................................................................... 82
2.4.1 包 .......................................................................................................... 82
2.4.2 模块 ..................................................................................................... 86
2.5 内置函数、模块函数和自定义函数 ........................................................................... 88
2.5.1 函数 ................................................................................................. 88
2.5.2 内置函数 .......................................................................................................... 90
2.5.3 模块函数 .......................................................................................................... 93
2.5.4 自定义函数 ..................................................................................... 95
小结 .................................................................................................................. 104
习题2 .............................................................................................................. 104
第3章 Python语言高级语法
学习指南 ........................................................................................................ 109
3.1 迭代器与可迭代对象 ................................................................................................... 109
3.1.1 可迭代对象 ................................................................................. 111
3.1.2 迭代器 .................................................................................................. 111
3.2 生成器与装饰器 .......................................................................................................... 112
3.2.1 生成器 .............................................................................................................. 112
3.2.2 装饰器 .............................................................................................................. 113
3.3 查阅帮助 ...................................................................................................................... 115
3.3.1 help函数 .......................................................................................................... 116
3.3.2 docString .......................................................................................................... 116
3.3.3 查看源代码 ........................................................................................... 117
3.3.4 doc属性 ........................................................................................................... 118
3.3.5 dir()函数 .......................................................................................................... 118
3.3.6 其他方法 .......................................................................................................... 119
3.4 异常处理、断言与程序调试 ....................................................................................... 119
3.4.1 try/except/finally .............................................................................................. 121
3.4.2 异常/错误信息的显示模式 ............................................................................. 122
3.4.3 断言与检查点的设置 ....................................................................................... 123
3.4.4 调试程序的基本方法 ....................................................................................... 124
3.5 数据文件的读写 .......................................................................................................... 127
3.5.1 搜索路径 .......................................................................................................... 128
3.5.2 当前工作目录 .................................................................................................. 130
3.5.3 文件读写方法 .................................................................................................. 131
3.6 面向对象编程 .............................................................................................................. 131
3.6.1 类的定义方法 .................................................................................................. 132
3.6.2 类中的特殊方法 .............................................................................................. 133
3.6.3 类之间的继承关系........................................................................................... 135
3.6.4 私有属性及@property装饰器 ........................................................................ 136
3.6.5 self和cls ......................................................................................................... 136
3.6.6 new与init的区别和联系 ................................................................................ 137
小结 ....................................................................................................................................... 138
习题3 ................................................................................................................... 139
第4章 数据准备与加工
学习指南 ............................................................................................................................... 141
4.1 随机数 .......................................................................................................................... 141
4.1.1 一次生成一个随机数 ....................................................................................... 142
4.1.2 一次生成一个随机数组 ................................................................................... 143
4.2 多维数组 ...................................................................................................................... 144
4.2.1 创建方法 .......................................................................................................... 147
4.2.2 主要特征 .......................................................................................................... 148
4.2.3 切片读取 .......................................................................................................... 149
4.2.4 浅拷贝和深拷贝 .............................................................................................. 153
4.2.5 形状与重构 ...................................................................................................... 153
4.2.6 属性计算 .......................................................................................................... 156
4.2.7 ndarray的计算 ................................................................................................. 157
4.2.8 ndarray的元素类型 ......................................................................................... 158
4.2.9 插入与删除 ...................................................................................................... 159
4.2.10 缺失值处理 .................................................................................................... 160
4.2.11 ndarray的广播规则 ....................................................................................... 160
4.2.12 ndarray的排序 ............................................................................................... 162
4.3 数据框 .......................................................................................................................... 162
4.3.1 创建方法 .......................................................................................................... 164
4.3.2 查看行或列 ...................................................................................................... 165
4.3.3 切片方法 .......................................................................................................... 166
4.3.4 索引操作 .......................................................................................................... 168
4.3.5 删除或过滤行/列 ........................................................................................... 169
4.3.6 算术运算 .......................................................................................................... 172
4.3.7 描述性统计 ...................................................................................................... 174
4.3.8 数据排序 .......................................................................................................... 176
4.3.9 导入/导出 ....................................................................................................... 177
4.3.10 缺失数据处理 ................................................................................................ 178
4.3.11 分组统计 ........................................................................................................ 182
4.4 Key-Value型数据 ........................................................................................................ 183
4.4.1 Series的主要特点 ............................................................................................ 184
4.4.2 Series的定义方法 ............................................................................................ 185
4.4.3 Series的操作方法 ............................................................................................ 187
4.5 时间与日期类型数据 ................................................................................................... 189
4.5.1 定义方法 .......................................................................................................... 190
4.5.2 转换方法 .......................................................................................................... 192
4.5.3 显示系统当前时间........................................................................................... 193
4.5.4 计算时差 .......................................................................................................... 194
4.5.5 时间索引 .......................................................................................................... 194
4.5.6 period_range()函数 ......................................................................................... 196
4.6 数据可视化 ........................................................................... 196
4.6.1 Matplotlib 可视化 ............................................................................................ 197
4.6.2 改变图的属性 .................................................................................................. 199
4.6.3 改变图的类型 .................................................................................................. 201
4.6.4 改变图的坐标轴的取值范围 ........................................................................... 202
4.6.5 去掉边界的空白 .............................................................................................. 203
4.6.6 在同一个坐标上画两个图 ............................................................................... 204
4.6.7 多图显示 .......................................................................................................... 205
4.6.8 图的保存 .......................................................................................................... 205
4.6.9 散点图的画法 .................................................................................................. 206
4.6.10 Pandas可视化 ................................................................................................ 206
4.6.11 Seaborn可视化 .............................................................................................. 208
4.6.12 教师工资收入的可视化分析 ......................................................................... 211
小结 ....................................................................................................................................... 212
习题4 ......................................................................................................... 212
第5章 数据分析算法与模型
学习指南 ............................................................................................................................... 215
5.1 基于Python的统计学编程.......................................................................................... 215
5.1.1 女性身高数据的回归分析 ............................................................................... 217
5.1.2 广告投放及销售额分析.................................................................................. 226
5.2 基于Python的机器学习编程 ...................................................................................... 230
5.2.1 威斯康星乳腺癌数据分析及自动诊断 ........................................................... 231
5.2.2 不同国家蛋白质消费结构分析 ....................................................................... 238
小结 ....................................................................................................................................... 244
习题5 .................................................................................................................................... 245
第6章 自然语言处理与图像处理
学习指南 ............................................................................................................................... 247
6.1 自然语言处理 .............................................................................................................. 248
6.1.1 自然语言处理的常用包.................................................................................. 248
6.1.2 自然语言处理的包导入与设置 ....................................................................... 248
6.1.3 数据读入 .......................................................................................................... 249
6.1.4 分词处理 .......................................................................................................... 249
6.1.5 自定义词汇 ...................................................................................................... 250
6.1.6 停用词处理 ...................................................................................................... 253
6.1.7 词性分布分析 .................................................................................................. 254
6.1.8 高频词分析 ...................................................................................................... 255
6.1.9 词频统计 .......................................................................................................... 256
6.1.10 关键词分析 .................................................................................................... 258
6.1.11 生成词云 ........................................................................................................ 258
6.2 人脸识别与图像处理 ................................................................................................... 260
6.2.1 安装并导入opencv-python包 ......................................................................... 260
6.2.2 读取图像文件 .................................................................................................. 261
6.2.3 将RGB图像转换为灰度图 ............................................................................. 261
6.2.4 人脸检测与绘制长方形 ................................................................................... 262
6.2.5 图像显示 .......................................................................................................... 263
6.2.6 图像保存 .......................................................................................................... 263
小结 ....................................................................................................................................... 263
习题6 .................................................................................................................................... 263
- 电子工业出版社有限公司
- 电子工业出版社有限公司有赞官方供货商,为客户提供一流的知识产品及服务。
- 扫描二维码,访问我们的微信店铺