Hadoop大数据解决方案

￥49.80

运费：	¥ 0.00-15.00
库存：	1000 件

立即购买

支付：: 微信支付银行卡支付宝

商品详情

书名：	Hadoop大数据解决方案（大数据应用与技术丛书）
出版社：	清华大学出版社
出版日期：	2017
ISBN号：	9787302466451

Hadoop是一个在Apache?2.0许可证下可用的开源项目。它能在分布式服务器群集中管理和存储超大规模的数据集。Hadoop最具优势的特性之一是其容错性，这使得大数据应用在遇到失败事件时能够继续正常运行。使用Hadoop的另一个优势是可扩展性。这种编程逻辑拥有从单机向大量服务器扩展的潜质，而每台服务器均具备本地计算和存储能力。本书读者对象本书面向使用Hadoop来执行数据相关作业的任何人，也适合希望更好地从任意数据存储中获取有意义信息的读者。这包括大数据解决方案架构师、Linux系统和大数据工程师、大数据平台工程师、Java程序员和数据库管理员。如果你有兴趣学习关于Hadoop的更多知识并且想了解如何抽取特定组件做进一步分析或研究，那么这本书正好适合你。阅读本书的前提? 你应该拥有开发经验并且了解Hadoop的基础知识，而且要对在实际环境中应用它感兴趣。示例的源代码可以从www.wrox.com/go/professionalhadoop或者https://github.com/backstopmedia/hadoopbook下载。本书的结构? 本书共分为8章，内容如下：? 第1章：Hadoop概述? 第2章：存储? 第3章：计算? 第4章：用户体验? 第5章：与其他系统集成? 第6章：Hadoop安全? 第7章：自由的生态圈：Hadoop与Apache?BigTop 第8章：Hadoop软件栈的In-Memory计算? 约定? 为帮助你尽可能地理解文章含义并抓住重点，我们在本书中使用了大量约定。文中所使用的样式如下：? ●?当介绍新术语和重要词语时，我们会突出展现它们。 ●?我们像这样展示正文中的代码：persistence.properties。 ●?我们以此种样式来展示本书中的所有代码片段：? ???FileSystem?fs?=?FileSystem.get(URI.create(uri),?conf); ???InputStream?in?=?null; ???try?{ ●?我们以这样的字体展示URL：? http://<Slave?Hostname>:50075 p2p.wrox.com 要与作者和同行讨论，请加入http://p2p.wrox.com上的P2P论坛。这个论坛是一个基于Web的系统，便于你张贴与Wrox图书相关的消息和相关技术，与其他读者和技术用户交流心得。该论坛提供了订阅功能，当论坛上有新的消息时，它可以给你传送感兴趣的论题。Wrox作者、编辑和其他业界专家和读者都会到这个论坛上探讨问题。在http://p2p.wrox.com上，有许多不同的论坛，它们不仅有助于阅读本书，还有助于开发自己的应用程序。要加入论坛，可以遵循下面的步骤： (1)?进入http://p2p.wrox.com，单击Register链接。 (2)?阅读使用协议，并单击Agree按钮。 (3)?填写加入该论坛所需要的信息和自己希望提供的其他信息，单击Submit按钮。 (4)?你会收到一封电子邮件，其中的信息描述了如何验证账户，完成加入过程。加入论坛后，就可以张贴新消息，响应其他用户张贴的消息。可以随时在Web上阅读消息。如果要让该网站给自己发送特定论坛中的消息，可以单击论坛列表中该论坛名旁边的Subscribe?to?this?Forum图标。关于使用Wrox?P2P的更多信息，可阅读P2P?FAQ，了解论坛软件的工作情况以及P2P和Wrox图书的许多常见问题。要阅读FAQ，可以在任意P2P页面上单击FAQ链接。源代码读者在学习本书中的示例时，可以手动输入所有的代码，也可以使用本书附带的源代码文件。本书使用的所有源代码都可以从站点http://www.wrox.com下载。具体而言，本书的代码可以通过网站http://www.wrox.com/go/professionalhadoop上的Download?Code选项卡下载。还可以在站点http://www.wrox.com上通过输入ISBN(本书的ISBN为9781119267171)来获取本书的代码。也可以扫描封底的二维码获取本书的源代码。当前所有Wrox图书的代码下载的完整列表都可以通过www.wrox.com/dynamic/books/download.aspx站点来获取。下载代码后，只需要用自己喜欢的解压缩软件对它进行解压缩即可。另外，也可以进入http://www.wrox.com/dynamic/books/?download.aspx上的Wrox代码下载主页，查看本书和其他Wrox图书的所有代码。勘误表尽管我们已经尽了各种努力来保证文章或代码中不出现错误，但是错误总是难免的，如果你在本书中找到了错误，例如拼写错误或代码错误，请告诉我们，我们将非常感激。通过勘误表，可以让其他读者避免受挫，当然，这还有助于提供更高质量的信息。请给wkservice@vip.163.com发电子邮件，我们就会检查你的信息，如果是正确的，我们将在本书的后续版本中采用。要在网站上找到本书的勘误表，可以登录www.wrox.com/go/?professionalhadoop，并单击Errata链接。在该页面上可以查看到Wrox编辑已提交和粘贴的所有勘误项。如果在Book?Errata页面上没有看到你找出的错误，请进入www.worx.com/contact/techsupport.shtml，并填写表单，发电子邮件，我们就会检查你的信息，如果是正确的，就在本书的勘误表中粘贴一个消息，我们将在本书的后续版本中采用。

Benoy Antony是Apache Hadoop Committer，在eBay公司担任Hadoop架构师。

Konstantin Boudnik是Memcore.io的共同创始人兼CEO，他是Hadoop的早期开发者之一，与他人共同创建了Apache Bigtop。

Cheryl Adams是医疗数据领域的一位资深云数据和基础设施架构师。

Branky Shao是eBay的软件工程师，同时也是Cascading项目的贡献者。

Cazen Lee是三星SDS公司的一位软件架构师。

Kai Sasaki是Treasure Data公司的一位软件工程师。

本书面向使用Hadoop来执行数据相关作业的任何人，也适合希望更好地从任意数据存储中获取有意义信息的读者。这包括大数据解决方案架构师、Linux系统和大数据工程师、大数据平台工程师、Java程序员和数据库管理员。

第1章 Hadoop概述 1

1.1 商业分析与大数据 2

1.1.1 Hadoop的组件 3

1.1.2 Hadoop分布式文件系统(HDFS) 3

1.1.3 MapReduce是什么 4

1.1.4 YARN是什么 5

1.2 ZooKeeper是什么 6

1.3 Hive是什么 7

1.4 与其他系统集成 8

1.4.1 Hadoop生态系统 9

1.4.2 数据集成与Hadoop 11

1.5 小结 16

第2章存储 19

2.1 Hadoop HDFS的基础知识 20

2.1.1 概念 21

2.1.2 架构 25

2.1.3 接口 29

2.2 在分布式模式下设置HDFS群集 35

2.3 HDFS的高级特性 40

2.3.1 快照 41

2.3.2 离线查看器 44

2.3.3 分层存储 52

2.3.4 纠删码 55

2.4 文件格式 59

2.5 云存储 63

2.6 小结 64

第3章计算 65

3.1 Hadoop MapReduce的基础 66

3.1.1 概念 66

3.1.2 架构 69

3.2 如何启动MapReduce作业 76

3.2.1 编写Map任务 77

3.2.2 编写reduce任务 79

3.2.3 编写MapReduce作业 80

3.2.4 配置 83

3.3 MapReduce的高级特性 85

3.3.1 分布式缓存 85

3.3.2 计数器 87

3.3.3 作业历史服务器 89

3.4 与Spark作业的区别 91

3.5 小结 92

第4章用户体验 93

4.1 Apache Hive 94

4.1.1 安装Hive 96

4.1.2 HiveQL 97

4.1.3 UDF/SerDe 103

4.1.4 Hive调优 105

4.2 Apache Pig 106

4.2.1 安装Pig 107

4.2.2 Pig Latin 108

4.3 UDF 110

4.4 Hue 111

4.5 Apache Oozie 114

4.5.1 安装Oozie 115

4.5.2 Oozie的工作原理 118

4.5.3 工作流/协调器 119

4.5.4 Oozie CLI 124

4.6 小结 124

第5章与其他系统集成 125

5.1 Apache Sqoop 126

5.2 Apache Flume 130

5.3 Apache Kafka 136

5.3.1 工作原理 138

5.3.2 Kafka Connect 141

5.3.3 流处理 143

5.4 Apache Storm 144

5.4.1 工作原理 145

5.4.2 Trident 148

5.4.3 Kafka集成 149

5.5 小结 152

第6章 Hadoop安全 153

6.1 提升Hadoop群集安全性 154

6.1.1 边界安全 154

6.1.2 Kerberos认证 156

6.1.3 Hadoop中的服务级授权 162

6.1.4 用户模拟 167

6.1.5 提升HTTP信道的安全性 170

6.2 提升数据安全性 174

......

清华大学出版社旗舰店（微信公众号认证）

扫描二维码，访问我们的微信店铺: 随时随地的购物、客服咨询、查询订单和物流...

Hadoop大数据解决方案

商品详情

热门商品

Hadoop大数据解决方案

手机启动微信
扫一扫购买

手机扫码购买

打开微信，扫一扫

或搜索微信号：qhdxcbs

Hadoop大数据解决方案

商品详情

热门商品

Hadoop大数据解决方案

手机启动微信扫一扫购买

收藏到微信 or 发给朋友

手机扫码购买

打开微信，扫一扫

或搜索微信号：qhdxcbs

收藏到微信 or 发给朋友

手机启动微信
扫一扫购买