商品详情
定价:45.0
ISBN:9787111702764
作者:刘学
版次:1
内容提要:
本书详细介绍了数据仓库的基本概念和Hive数据仓库的架构原理,并采用“项目驱动+理论介绍+微实例+实际代码+运行效果”的模式介绍项目案例。全书包括岗前培训和8个项目,主要内容包括数据仓库环境部署、基于DDL的学员信息系统操作、基于DML的学员信息系统操作、企业信息管理数据查询与操作、网上商城购物数据统计和优化、基于函数实现微博和门户日志数据统计、基于Hive的Java API操作影视数据以及电商数据分析综合案例。
本书可以作为各类职业院校大数据技术专业及相关专业的教材,也可以作为大数据培训班的教材,还可以作为从事大数据技术相关工作的专业人员和广大大数据爱好者的自学参考书。
本书配有电子课件、源代码等教学资源,教师可登录机械工业出版社教育服务网(www.cmpedu.com)注册后免费下载或联系编辑(010-88379194)咨询。本书还配有微课视频,读者可扫描二维码进行学习。
目录:
前 言
二维码索引
岗前培训1
一、认识数据仓库3
二、Hive的应用6
岗前培训小结14
课后练习15
项目1 数据仓库环境部署17
任务1 Hive本地模式部署19
任务2 Hive远程模式部署28
项目小结34
课后练习34
项目2 基于DDL的学员信息系统操作37
任务1 学员信息数据仓库操作39
任务2 学员数据模型创建与操作44
项目小结52
课后练习52
项目3 基于DML的学员信息系统操作55
任务1 学员数据装载57
任务2 学员手机信息数据的插入63
任务3 学员信息数据的更新和删除67
项目小结70
课后练习70
项目4 企业信息管理数据查询与操作 71
任务1 查询员工基本信息73
任务2 多表连接查询员工信息78
任务3 基于聚合函数的员工信息查询80
任务4 基于分组的员工信息查询82
项目小结84
课后练习84
项目5 网上商城购物数据统计和优化85
任务1 视图实现统计30万条网购数据87
任务2 网购数据索引前后的效率对比93
项目小结99
课后练习99
项目6 基于函数实现微博和门户日志数据统计101
任务1 基于微博数据进行业务统计103
任务2 门户日志数据预处理120
项目小结135
课后练习135
项目7 基于Hive的Java API操作影视数据137
任务 应用Java API操作和维护影视数据139
项目小结156
课后练习156
项目8 电商数据分析综合案例159
任务 电商数据多维度分析及可视化161
项目小结198
课后练习198
参考文献200
- 机械工业出版社旗舰店 (微信公众号认证)
- 扫描二维码,访问我们的微信店铺
- 随时随地的购物、客服咨询、查询订单和物流...