商品详情
书名: | Hadoop应用实战 清华 |
出版社: | 清华大学出版社 |
出版日期: | 2017 |
ISBN号: | 9787302459279 |
本书全面地讲述了Hadoop相关领域的重要知识和最新的技术及应用。书中首先介绍了数据挖掘的基础知识、Hadoop的基本框架和相关信息,然后系统地描述了如何在各类行业中用好Hadoop来做数据挖掘。 本书面向的主要读者人群是想了解Hadoop与大数据的技术人员,无论他们是在互联网企业,还是在传统企业;无论他们从事的是技术或者运维工作,专业做数据分析,还是企业的策略官、市场官和运营官,都能从本书中找到各自所需要的内容。 本书可以帮助读者开阔眼界和找到方法,让他们知道如何分析实际商业场景和业务问题,构建基于Hadoop的大数据系统,通过使用数据运营,对公司业务运营带来直接的效益。当然对于学生、教师和有志于从业大数据运营的人员来说,也是一本实用的教材。 |
谭磊,复旦大学计算机学士,美国杜克大学计算机硕士,《New Internet:大数据挖掘》和《区块链2.0》等8本专业书籍的作者和译者,NABA北美区块链协会联合创始人,中国工业设计协会CIO,复旦大学软件学院硕士导师,杭州数字化产业综合服务中心主任。 在美国微软服务时间超过13年,曾经担任多家公司多个层级技术管理岗位,在搜索、互联网广告、数据挖掘、电子商务等方面有丰富的经验,是互联网技术领域ZI深专家。 范磊,前英特尔亚太区大数据总监,知名大数据专家,星环科技联合创始人兼CEO。 |
全面论述从实际应用中提取出的数据挖掘和Hadoop相关概念和技术 使用实际案例为用户全面介绍Hadoop,而不只是停留在理论层面上 详细解读Hadoop相关领域全新的技术和商业大数据应用的动态变化 |
第1 章 大数据概念的老调重弹 ........ 1 1.1 互联网和物联网上的数据 2 1.1.1 互联网上越来越多的数据被存储 . 2 1.1.2 物联网带来更多的数据 ................. 4 1.2 数据能为我们做的事 ........ 5 1.2.1 用户画像和任何企业都需要关注的数据 ........................ 6 1.2.2 大数据的3V、4V 和N 个V ........ 7 1.2.3 从数据分析到数据挖掘 ................. 8 1.2.4 大数据处理的三个维度 ................. 9 1.3 数据挖掘中的一些基本概念 ................... 11 1.3.1 分类算法 .... 11 1.3.2 聚类算法 .... 12 1.3.3 关联算法 .... 13 1.3.4 序列算法 .... 14 1.3.5 估测和预测 14 1.3.6 A/B Test ..... 15 1.4 数据仓库 ................ 16 1.4.1 数据仓库是解决大数据存储的基础设施 ...................... 17 1.4.2 4 种不同类型的数据仓库 ............ 18 1.4.3 国内外数据仓库的不同使用方式 ......... 19 1.5 不包含在本书中的内容 .. 21 1.6 这本书都讲些啥 .... 22 第2 章 Hadoop 的前世今生 ........... 25 2.1 Google 的计算框架 ......... 26 2.1.1 Google 公司的三篇论文 .............. 26 2.1.2 GFS 文件系统 ..... 27 2.1.3 MapReduce 的模型和框架 .......... 28 2.1.4 BigTable 数据库 .. 29 2.2 Hadoop 的诞生 ...... 30 2.2.1 从GFS 到HDFS . 30 2.2.2 Hadoop 的基础计算框架MapReduce ... 31 2.2.3 从BigTable 到HBase .................. 33 2.3 Hadoop 的今天 ...... 33 ............................ |
- 清华大学出版社旗舰店 (微信公众号认证)
- 扫描二维码,访问我们的微信店铺
- 随时随地的购物、客服咨询、查询订单和物流...