对比Excel 轻松学习SQL数据分析+ 对比Excel 轻松学习Python数据分析 系统学习数据与分析流程操作技术excel数据处理分析书籍
运费: | 免运费 |
商品详情
定价:118.0
ISBN:9787121357930
作者:张俊红
版次:1
出版时间:2020-05
内容提要:
书名:对比Ecel,轻松学习SQL数据分
本书是《对比Ecel,轻松学生Python数据分析》姊妹篇,同样采用对比的方法,降低学习门槛,提高学习效率。 全书分为三篇: 一篇主要介绍数据分析基础知识,包括数据分析的基本概念、为什么要进行数据分析以及常规的数据分析流程,使读者对数据分析有一个整体的认识;2篇围绕数据分析的整个流程来介绍SQL语法相关的知识,包括如何选取一列数据,如何对数据进行分组运算,还包括窗口函数等进阶知识;3篇主要介绍SQL数据分析实战,都是一些比较常规的业务场景实战。
书名:对比Ecel,轻松学习Python数据分析
集Python、Ecel、数据分析为一体是本书的一大特色。
围绕整个数据分析的常规流程:熟悉工具—明确目的—获取数据—熟悉数据—处理数据—分析数据—得出结论—验证结论—展示结论进行Ecel和Python的对比实现,告诉你每一个过程中都会用到什么,过程与过程之间有什么联系。本书既可以作为系统学习数据分析作流程的说明书,也可以作为一本数据分析师案头的实工具书。
通过对比Ecel功能作去学习Python的代码实现,而不是直接学习Python代码,大大降低了学习门槛,消除了读者对代码的恐惧心理。适合刚入行的数据分析师,也适合对Ecel比较熟练的数据分析师,以及从事其他岗位想提高工作效率的职场人。
作者简介:
《对比Excel,轻松学习SQL数据分析》作者:张俊红,某互联网公司高级数据分析师,畅销书《对比Excel,轻松学习Python数据分析》作者。喜欢分享,致力于做一个数据科学路上的终身学习者、实践者、分享者。公众号“俊红的数据分析之路”运营人。
《对比Excel,轻松学习Python数据分析》作者:张俊红,某互联网公司数据分析师,擅长Python、Sql、Excel,对数据分析、机器学习领 域比较熟悉。喜欢分享,致力于做一个数据科学路上的终身学习者,实践者,分享者。 个人微信公众号“张俊红”定期推送数据分析、机器学习、网络爬虫、Python 编程系列文 章。
目录:
《对比Ecel,轻松学习SQL数据分析》
入门篇
1章 数据分析基础介绍 2
1.1 数据分析是什么 2
1.2 为什么要进行数据分析 2
1.2.1 现状分析 3
1.2.2 原因分析 3
1.2.3 预测分析 4
1.3 数据分析究竟在分析什么 5
1.3.1 总体概览指标 5
1.3.2 对比性指标 5
1.3.3 集中趋势指标 6
1.3.4 离散程度指标 6
1.3.5 相关性指标 7
1.3.6 相关与因果 7
1.4 数据分析的常规分析流程7
1.4.1 熟悉工具8
1.4.2 明确目的 8
1.4.3 获取数据 8
1.4.4 熟悉数据 8
1.4.5 处理数据 8
1.4.6 分析数据 9
1.4.7 得出结论 9
1.4.8 验证结论 9
1.4.9 展现结论 9
1.5 数据分析工具 9
1.5.1 Ecel 与SQL 9
1.5.2 SQL 与Python 10
知识篇
2章 数据库基础知识 12
2.1 数据库的发展及组成 12
2.1.1 数据库的发展 12
2.1.2 数据库的组成 13
2.2 SQL 是什么 13
2.3 SQL 的基本功能 14
2.3.1 数据定义 15
2.3.2 数据纵 15
2.3.3 数据控制 15
2.4 SQL 查询的处理步骤 15
2.4.1 查询分析 15
2.4.2 查询检查 15
2.4.3 查询优化 16
2.4.4 查询执行 16
2.5 不同数据库的比较 16
3章 数据库工具准备 17
3.1 认识MySQL 官方网站 17
3.2 MySQL 的下载与安装 19
3.2.1 基于Windows 的下载与安装 19
3.2.2 基于macOS 的下载与安装 27
3.3 DBeaver 的下载与安装 33
3.3.1 基于Windows 的下载与安装 33
3.3.2 基于macOS 的下载与安装 38
3.4 DBeaver 使用说明 42
3.4.1 新建表结构 42
3.4.2 导入外部数据 44
3.4.3 代码执行 46
3.4.4 导出结果数据 47
3.5 写下一行SQL 语句 49
4章 数据源的获取 50
4.1 外部数据 50
4.2 公司现有数据 50
4.3 新建数据 50
4.4 熟悉数据 50
4.4.1 了解数据库信息 52
4.4.2 了解数据表信息 52
4.4.3 了解列信息 52
5章 数据的获取 54
5.1 获取列 54
5.1.1 获取全部列 55
5.1.2 获取特定的列 55
5.2 获取想要的行 56
5.2.1 获取全部行 56
5.2.2 获取前几行 56
5.2.3 获取满足单一条件的行 57
5.2.4 获取满足多个条件的行 58
5.3 行列同时获取 59
5.4 插入一列固定值 60
5.5 JSON 列解析 61
5.6 对结果进行排序 62
6章 数据预处理 65
6.1 缺失值处理 65
6.2 重复值处理 68
6.3 数据类型转换 70
6.4 重命名 72
7章 数据运算 74
7.1 算术运算 74
7.2 比较运算 76
7.3 逻辑运算 78
7.4 数学运算 80
7.4.1 求对值 80
7.4.2 求小整数值 81
7.4.3 求大整数值 81
7.4.4 随机数生成 81
7.4.5 小数点位数调整 83
7.4.6 正负判断 83
7.5 字符串运算 84
7.5.1 字符串替换 84
7.5.2 字符串合并 85
7.5.3 字符串截取 86
7.5.4 字符串匹配 86
7.5.5 字符串计数 87
7.5.6 去除字符串空格 88
7.5.7 字符串重复 89
7.6 聚合运算 89
7.6.1 count()计数 89
7.6.2 sum()求和 90
7.6.3 avg()求平均值 90
7.6.4 ma()求大值 90
7.6.5 min()求小值 91
7.6.6 求方差 91
7.6.7 求标准差 92
7.6.8 聚合函数之间的运算 92
8章 控制函数 94
8.1 if()函数 94
8.2 case when 函数 96
9章 日期和时间函数 99
9.1 获取当前时刻的数据 99
9.1.1 获取当前时刻的日期和时间 99
9.1.2 获取当前时刻的日期 99
9.1.3 获取当前时刻的时间 100
9.1.4 获取当前时刻所属的周数 101
9.1.5 获取当前时刻所属的季度 102
9.2 日期和时间格式转换 102
9.3 日期和时间运算 104
9.3.1 向后偏移日期和时间 104
9.3.2 向前偏移日期和时间 105
9.3.3 两个日期之间做差 106
9.3.4 两个日期之间的比较 107
10章 数据分组与数据透视表 108
10.1 group by 的底层原理 108
10.2 对分组后的数据进行聚合运算 109
10.3 对聚合后的数据进行条件筛选 111
10.4 group_concat()函数 112
10.5 rollup. 113
10.6 数据透视表实现 115
《对比Ecel,轻松学习Python数据分析》
目录
入门篇
1 章 数据分析基础 2
11 数据分析是什么 2
12 为什么要做数据分析 2
121 现状分析 3
122 原因分析 3
123 预测分析 3
13 数据分析究竟在分析什么 4
131 总体概览指标 4
132 对比性指标 4
133 集中趋势指标 4
134 离散程度指标 5
135 相关性指标 5
136 相关关系与因果关系 6
14 数据分析的常规流程 6
141 熟悉工具 6
142 明确目的 7
143 获取数据 7
144 熟悉数据 7
145 处理数据 7
146 分析数据 8
147 得出结论 8
148 验证结论 8
149 展示结论 8
15 数据分析工具:Ecel 与Python 8
实践篇
2 章 熟悉锅――Python 基础知识 12
21 Python 是什么 12
22 Python 的下载与安装 13
221 安装教程 13
222 IDE 与IDLE 17
23 介绍Jupyter tebook 17
231 新建Jupyter tebook 文件 17
232 运行你的一段代码 19
233 重命名Jupyter tebook 文件 19
234 保存Jupyter tebook 文件 19
235 导入本地Jupyter tebook 文件 20
236 Jupyter tebook 与Markdown 21
237 为Jupyter tebook 添加目录 21
24 基本概念 26
241 数 26
242 变量 26
243 标识符 27
244 数据类型 28
245 输出与输出格式设置 28
246 缩进与注释 29
25 字符串 30
251 字符串的概念 30
252 字符串的连接 30
253 字符串的复制 30
254 获取字符串的长度 30
255 字符串查找 31
256 字符串索引 31
257 字符串分隔 32
258 移除字符 32
26 数据结构――列表 33
261 列表的概念 33
262 新建一个列表 33
263 列表的复制 34
264 列表的合并 34
265 向列表中插入新元素 34
266 获取列表中值出现的次数 35
267 获取列表中值出现的位置 35
268 获取列表中指定位置的值 36
269 删除列表中的值 36
2610 对列表中的值进行排序 37
27 数据结构――字典 37
271 字典的概念 37
273 字典的keys()、values()和items()方法 37
28 数据结构――元组 38
281 元组的概念 38
282 新建一个元组 38
283 获取元组的长度 38
284 获取元组内的元素 39
285 元组与列表相互转换 39
286 zip()函数 39
29 运算符 40
291 算术运算符 40
292 比较运算符 40
293 逻辑运算符 41
210 循环语句 41
2101 for 循环 41
2102 while 循环 42
211 条件语句 43
2111 if 语句 43
2112 else 语句 44
2113 elif 语句 45
212 函数 46
2121 普通函数 47
2122 匿名函数 48
213特性 49
2131 列表生成式 49
2132 map 函数 50
214 模块 50
3 章 Pandas 数据结构 51
31 Series 数据结构 51
311 Series 是什么 51
312 创建一个Series 52
313 利用inde 方法获取Series 的索引 53
314 利用values 方法获取Series 的值 53
32 DataFrame 表格型数据结构 53
321 DataFrame 是什么 53
322 创建一个DataFrame 54
323 获取DataFrame 的行、列索引 56
324 获取DataFrame 的值 56
4 章 准备食材――获取数据源 57
41 导入外部数据 57
411 导入ls 文件 57
412 导入csv 文件 60
413 导入tt 文件 63
414 导入sql 文件 65
42 新建数据 67
43 熟悉数据 67
431 利用head 预览前几行 67
432 利用shape 获取数据表的大小 68
433 利用info 获取数据类型 69
434 利用describe 获取数值分布情况 71
5 章 淘米洗菜――数据预处理 73
51 缺失值处理 73
511 缺失值查看 73
512 缺失值删除 75
513 缺失值填充 77
52 重复值处理 78
53 异常值的检测与处理 81
531 异常值检测 81
532 异常值处理 82
54 数据类型转换 83
541 数据类型 83
542 类型转换 84
55 索引设置 86
551 为无索引表添加索引 86
552 重新设置索引 87
553 重命名索引 88
554 重置索引 89
6 章 菜品挑选――数据选择 91
61 列选择 91
611 选择某一列/某几列 91
612 选择连续的某几列 92
62 行选择 93
621 选择某一行/某几行 93
622 选择连续的某几行 94
623 选择满足条件的行 95
63 行列同时选择 96
631 普通索引+普通索引选择指定的行和列 97
632 位置索引+位置索引选择指定的行和列 97
633 布尔索引+普通索引选择指定的行和列 98
634 切片索引+切片索引选择指定的行和列 98
635 切片索引+普通索引选择指定的行和列 99
7 章 切配菜品――数值作 100
71 数值替换 100
711 一对一替换 100
712 多对一替换 102
713 多对多替换 103
72 数值排序 104
721 按照一列数值进行排序 104
722 按照有缺失值的列进行排序 106
723 按照多列数值进行排序 106
73 数值排名 108
74 数值删除 110
741 删除列 110
742 删除行 111
743 删除特定行 112
75 数值计数 113
76 值获取 114
77 数值查找 115
78 区间切分 116
79 插入新的行或列 119
710 行列互换 120
711 索引重塑 121
712 长宽表转换 122
7121 宽表转换为长表 123
7122 长表转换为宽表 125
713 apply()与applymap()函数 126
8 章 开始烹调――数据运算 127
81 算术运算 127
82 比较运算 128
83 汇总运算 129
831 count 非空值计数 129
832 sum 求和 130
833 mean 求均值 130
834 ma 求大值 131
835 min 求小值 132
836 median 求中位数 132
837 mode 求众数 133
838 var 求方差 134
839 std 求标准差 134
8310 quantile 求分位数 135
84 相关性运算 136
9 章 炒菜计时器――时间序列 138
91 获取当前时刻的时间 138
911 返回当前时刻的日期和时间 138
912 分别返回当前时刻的年、月、日 138
913 返回当前时刻的周数 139
92 指定日期和时间的格式 140
93 字符串和时间格式相互转换 141
931 将时间格式转换为字符串格式 141
932 将字符串格式转换为时间格式 141
94 时间索引 142
95 时间运算 145
951 两个时间之差 145
952 时间偏移 145
10 章 菜品分类――数据分组/数据透视表 148
101 数据分组 148
1011 分组键是列名 150
1012 分组键是Series 151
1013 神奇的aggregate 方法 152
1014 对分组后的结果重置索引 153
102 数据透视表 154
11 章 水果拼盘――多表拼接 158
111 表的横向拼接 158
1111 连接表的类型 158
1112 连接键的类型 160
1113 连接方式 163
1114 重复列名处理 165
112 表的纵向拼接 165
1121 普通合并 166
1122 索引设置 167
1123 重叠数据合并 167
- 电子工业出版社有限公司
- 电子工业出版社有限公司有赞官方供货商,为客户提供一流的知识产品及服务。
- 扫描二维码,访问我们的微信店铺