商品详情
书名:全国电力行业“十四五”规划 大数据分析及应用
书号:978-7-5198-9437-5
定价:59.8元
作者:王辉 梁春燕
出版时间:2024-12-19
出版社:中国电力出版社
页码: 204 字数(千字):306
开本:特16开 版次:1 印次:1
品牌介绍
中国电力出版社成立于 1951 年,作为中国成立最早的中央科技出版社之一,曾隶属于水利电力部、能源部、电力工业部、国家电力公司,现为国家电网公司所属的科技出版社,在电气技术专业出版领域享有极高的声誉。该社作为以图书出版为主体,音像、电子出版物、期刊、网络出版共同发展的大型出版企业,以强大的出版资源和高素质的专业队伍,致力于向读者提供包括电力工程、电气工程、建筑工程、电子技术、信息技术、外语、大中专教材、家教等学科门类齐全的权威出版物,也竭力为广大师生提供精品教材,是教育部和北京市教委规划教材的出版基地之一。
编辑推荐
本书以培养大数据管理、分析和应用能力为主线 , 将理论与案例、理论与实践、理论与应用充分结合 , 以电力系统为应用背景精心设计了案例 , 为广大读者 , 特别是具有电力背景的读者提供解决大数据相关问题的思路。本书配套丰富的资源供读者线上学习。
产品特色
1.案例丰富; 2.资源丰富
作者介绍
王辉,华北电力大学
内容介绍
本书为全国电力行业“十四五”规划教材。全书共分 3 部分 12 章 , 主要内容包括大数据基础(大数据简介、大数据来源、大数据特征、大数据研究策略、大数据技术、大数据应用)、大数据管理及分析(大数据准备、大数据管理、大数据分析)、大数据应用及实践(大数据挑战、大数据开发平台、大数据实践)。本书以培养大数据管理、分析和应用能力为主线 , 将理论与案例、理论与实践、理论与应用充分结合 , 以电力系统为应用背景精心设计了案例 , 为广大读者 , 特别是具有电力背景的读者提供解决大数据相关问题的思路。本书配套丰富的资源供读者线上学习。
本书适用于本书可作为普通高等院校大数据管理与应用、数据科学与大数据技术、计算机科学与技术、信息管理与信息系统、管理科学与工程、工商管理等相关专业的本科及硕士研究生教材 , 也可作为相关专业师生、大数据科学家、数据分析员及工程师的参考书。
前言
随着信息技术与经济社会的发展和交汇融合,全球数据量正在剧烈地扩展和增加,大 数据时代已经到来,这不仅改变了人们对数据和信息处理的认知和方法,而且在社会、经济 和文化等多个方面产生了深远的影响。大数据的高速增长、复杂多样等诸多特征,使得在对 大数据进行分析并应用于各个领域学科时,在数据获取、管理、处理、分析和应用等方面遇 到了很多挑战和问题亟待解决。我国在 2015 年首次提出“国家大数据战略”,并相继发布了 《促进大数据发展行动纲要》《中华人民共和国数据安全法》等一系列政策文件和法律法规, 其目的是持续推动数字产业化和产业数字化的创新发展,发展以数据为关键要素的数字经济 新形态,利用大数据更好地服务我国经济社会发展和人民生活改善。因此,系统地学习大数 据管理、分析及应用的基础知识,是适应科学技术与社会发展的必然要求。 本书系统全面地描述大数据分析及应用所涉及的基本概念、遇到的机遇与挑战,以及 已有的解决方案、相关理论和技术,同时结合大量实践案例,使用化繁为简、深入浅出、 由浅入深的叙述方式来阐述知识点。书中将其中蕴含的科学创新、脚踏实地、分享合作的 精神,以及在技术创新发展进程中科技人员所体现和保持的对数据科学的热情和好奇心等 思政点,通过润物细无声的方式传递给读者 , 在提升大数据管理、分析和应用实践等方面 能力的同时,激发读者思考进取、勇于创新、团结共享的科学意识。 全书内容共分三个部分十二章。第 1 部分“大数据基础”介绍大数据相关的基本内容, 包括大数据的发展历程、来源、特征、研究策略、技术架构以及大数据的应用领域;第 2 部分“大数据管理及分析”描述了对大数据进行标注、集成、管理、预处理、分析以及可 视化的基本理论、技术、方法和工具;第 3 部分“大数据应用及实践”从应用的角度来阐 述大数据在法律和社会等方面遇到的挑战及解决方案,探讨大数据的发展趋势及其产生的 影响,并介绍大数据平台 Hadoop 生态系统的常用组件和基本原理,最后基于一个词频统 计的实例来进行 Hadoop 大数据实践。 全书由王辉、梁春燕、张依依、关志涛编写,彭可欣、朱琳、殷朵、曾贾斌、李若彤、 杨宇等同学进行了大量的文献整理、资料翻译、案例收集和编程实践等工作。全书由黄敏 芳教授审阅 , 提出很多宝贵意见,在此表示衷心感谢 ! 本书在编写过程中参考了相关教材、文献和网络资源 , 在此向所有的作者表示诚挚的 感谢。
目录
前言
第 1 部分 大 数 据 基 础
学习目标 1
第 1 章 大数据简介 2
11 大数据发展历程 2
12 大数据时代 5
13 大数据定义 6
第 2 章 大数据来源 7
21 大数据的类别 7
22 机器生成的大数据 8
23 人类生成的大数据 11
24 组织生成的大数据 14
25 数据集成 18
第 3 章 大数据特征 20
31 大数据特征综述 20
32 大数据的特征—大量性(Volume) 21
33 大数据的特征—多样性(Variety) 22
34 大数据的特征—高速性(Velocity) 23
35 大数据的特征—准确性(Veracity) 25
36 大数据的特征—关联性(Valence) 27
37 大数据的特征—价值性(Value) 28
第 4 章 大数据研究策略 30
41 数据科学 30
42 建立大数据研究策略 32
43 大数据研究策略框架和工作流程 34
第 5 章 大数据技术 39
51 大数据技术架构 39
52 大数据的两大关键技术 40
53 大数据平台 Hadoop 43
第 6 章 大数据应用 45
61 大数据的价值何在 45
62 大数据应用领域 47
测试题及答案 53
第 2 部分 大数据管理及分析
学习目标 57
第 7 章 大数据准备 58
71 大数据的结构 58
72 大数据的标识 62
73 大数据的关联 69
74 大数据的注释 75
第 8 章 大数据管理 83
81 数据集成和软件互操作性 83
82 不变性和永恒性 87
第 9 章 大数据分析 92
91 数据验证 92
92 大数据初步分析 95
93 大数据分析方法 11394 大数据分析中的特殊注意事项 127
95 大数据分析步骤 132
96 大数据分析的失败 138
测试题及答案 145
第 3 部分 大数据应用及实践
学习目标 147
第 10 章 大数据挑战 148
101 法律问题 148
102 社会问题 158
103 大数据的未来 164
第 11 章 大数据开发平台 169
111 可扩展计算的基本概念 169
112 Hadoop 生态系统 172
第 12 章 大数据实践 185
121 下载和安装 Cloudera 虚拟机映像 185
122 HDFS 实践:将数据复制到 Hadoop 分布式文件系统中 187
123 MapReduce 实践:运行 WordCount 程序 189
测试题及答案 192
参考文献 194
- 有电书房
- 扫描二维码,访问我们的微信店铺