商品详情

目录:
●1 大数据的前世今生与应用场景
大数据的前世今生:大数据简史与大数据生态体系概述
从搜索引擎到人工智能:大数据应用发展史
大数据应用的搜索引擎时代
大数据应用的数据仓库时代
大数据应用的数据挖掘时代
大数据应用的机器学习时代
数据驱动一切:大数据全领域应用场景分析
大数据在医疗健康领域的应用
大数据在社交媒体领域的应用
大数据在金融领域的应用
大数据在新零售领域的应用
大数据在交通领域的应用
2 Hadoop大数据原理与架构
移动计算比移动数据更划算
从RAID看垂直伸缩到水平伸缩的演化
新技术层出不穷,HDFS依然是存储的王者
为什么说MapReduce既是编程模型又是计算框架
MapReduce如何让数据完成一次旅行
MapReduce作业启动和运行机制
MapReduce数据合并与连接机制
为什么把Yarn称为资源调度框架
程序员应该如何学好大数据技术
3 大数据生态体系主要产品原理与架构
Hive是如何让MapReduce实现SQL操作的
用MapReduce实现SQL数据分析的原理
Hive的架构
Hive如何实现join操作
人们并没有觉得MapReduce速度慢,直到Spark出现
同样的本质,为何Spark可以更高效
Spark的计算阶段
Spark的作业管理
Spark的执行过程
BigTable的开源实现:HBase
HBase可伸缩架构
HBase可扩展数据模型
HBase的高性能存储
流式计算的代表:Storm、Spark Streaming、Flink
Storm
Spark Streaming
Flink
ZooKeeper是如何保证数据一致性的
分布式一致性原理
Paxos算法与ZooKeeper架构
大数据技术应用场景分析
4 大数据开发实践
如何自己开发一个大数据SQL引擎
Panthera架构
Panthera的SQL语法转换
比如这条SQL
Panthera程序设计
Spark的性能优化案例分析
Apache开源社区的组织和参与方式
软件性能优化
大数据开发的性能优化
Spark性能优化
案例1:Spark任务文件初始化调优
案例2:Spark任务调度优化
案例3:Spark应用配置优化
案例4:操作系统配置优化
案例5:硬件优化
大数据基准测试可以带来什么好处
大数据基准测试的应用
大数据基准测试工具HiBench
从大数据性能测试工具Dew看如何快速开发大数据系统
Dew设计与开发
Akka的原理与应用
大数据开发实践的启示
5 大数据平台与系统集成
大数据平台 = 互联网产品 + 大数据产品
数据采集
数据处理
数据输出与展示
大数据任务调度
大数据平台Lamda架构
数据在大数据平台中的流转
大数据从哪里来
从数据库导入
从日志文件导入
前端埋点采集
爬虫系统
数据的熵
知名大厂如何搭建大数据平台
- 电子工业出版社精品店
- 扫描二维码,访问我们的微信店铺