商品详情
深入介绍图数据挖掘的算法原理和分布式实现详述企业级图分析算法的极致性能优化结合案例解析鲲鹏BoostKit大数据图分析算法库实战应用 张志威,北京理工大学计算机学院教授,博士生导师,入选国家高层次人才计划。主持国家自然科学基金重点项目、科技部重点研发计划项目课题等多项国家与省部级科研项目。主要研究方向为大规模图数据管理与分析、分布式计算、数据湖、区块链等。在ACM SIGMOD、KDD、ICDE、VLDB..Journal等发表中国计算机学会(CCF)A类论文40余篇。多次担任ACM SIGMOD、VLDB、AAAI等国际学术会议程序委员会委员。袁野,北京理工大学基础科学研究院院长,教授、博士生导师,国家杰青、优青基金获得者,CCF杰出会员,IEEE、ACM高级会员。主持国家自然科学基金重点项目,科技部重点研发项目等多项国家级科研项目。曾获国家科技进步二等奖,中国电子学会自然科学奖一等奖等多项省部级奖项。同时担任中国计算机学会(CCF)数据库专业委员会副主任、大数据专家委员会委员。曾作为香港科技大学、香港中文大学、英国爱丁堡大学访问学者。主要研究方向为大数据管理与分析。在ACM..SIGMOD、VLDB、ICDE、VLDB Journal、IEEE Trans. TKDE、IEEE Trans. TPDS等发表CCF A类论文100余篇。曹莉,华为公司图分析算法专家,拥有近15年的图算法创新应用与研究经验,作为华为公司首个Spark分布式图分析算法专家,深入了解金融、互联网、交通、运营商、HPC等行业客户需求,带领团队构建了基于鲲鹏的大数据BoostKit图分析算法加速库,支持社团挖掘、中心性分析、路径分析、拓扑度量、相似性分析等典型40十算法,并在鲲鹏社区(hikunpeng)上线发布。 本书全面、系统地介绍了单机和分布式图分析算法的理论基础、框架、实战应用等,侧重理论与实践相结合。在内容组织上,首先,本书整体介绍图分析技术的发展历程和现状,并分析图分析技术面临的挑战。其次,本书系统介绍了以下内容:单机图分析算法的基本原理、常用场景和基础解法;分布式图分析技术的关键步骤解析及调优策略指导;业界经典的大数据平台和主流的分布式开发框架,以及分布式图计算框架的运行机制和任务调度策略;结合工业界软硬件(鲲鹏芯片和鲲鹏BoostKit加速库)对分布式图分析算法进行调优的方法。最后,本书将分布式图分析技术应用于实际场景,帮助读者基于业务场景进行分布式图计算框架选型。 本书既可以帮助对大数据图分析算法感兴趣的读者了解典型图分析算法的原理与优化技术,也可以作为华为鲲鹏图分析算法框架下的实践参考书。 丛书序前言本书阅读导引第1章 图分析技术概述0011.1 图分析技术的重要性0021.1.1 发展脉络0021.1.3 应用发展0131.2 图分析技术体系0151.2.1 图数据库技术0151.2.2 图计算技术0181.2.3 图学习技术0211.2.4 图生成技术0241.2.5 图可视化技术0281.3 大数据背景下图分析技术面临的挑战030第2章 经典图算法0332.1 路径分析0342.1.1 最短路径算法0342.1.2 环路检测算法0412.2 社区挖掘0462.2.1 连通分量算法0462.2.2 Louvain算法0492.3 中心性分析0522.3.1 Betweenness算法0522.3.2 K_Core分解算法0602.4 度量统计0632.4.1 三角形计数算法0642.4.2 集聚系数算法0662.5 相似性分析0672.5.1 SimRank算法0682.5.2 子图匹配算法069第3章 分布式图计算框架0733.1 分布式大数据平台概述0743.1.1 Hadoop0743.1.2 Spark0793.1.3 Flink0823.1.4 小结0853.2 分布式图计算框架核心技术0863.2.1 编程模型0863.2.2 通信模型0883.2.3 执行模型0903.2.4 计算模型0913.2.5 图划分0933.3 经典分布式图计算框架0943.3.1 Pregel0953.3.2 GraphLab0963.3.3 GraphX0983.3.4 Gemini0993.4 分布式图计算的技术挑战100第4章 鲲鹏BoostKit图分析算法加速库1034.1 鲲鹏芯片1044.1.1 鲲鹏芯片的发展历程1044.1.2 鲲鹏芯片的架构1054.1.3 鲲鹏920的特性1074.2 鲲鹏BoostKit概述1084.2.1 鲲鹏应用使能套件BoostKit1084.2.2 大数据使能套件1114.3 鲲鹏BoostKit图分析算法加速库简介1154.3.1 算法库概述1154.3.2 算法加速库安装部署1194.3.3 算法库集成开发1254.3.4 算法库调测样例1294.4 鲲鹏BoostKit图分析算法加速库调优指南1314.4.1 平台侧调优1314.4.2 资源侧调优1334.4.3 算法侧调优136第5章 基于鲲鹏的分布式图分析算法优化实战1395.1 环路检测算法1405.1.1 分布式实现1415.1.2 难点分析1435.1.3 关键步骤与优化点解析1455.1.4 鲲鹏BoostKit算法API介绍1525.2 Louvain算法1535.2.1 分布式实现1545.2.2 难点分析1575.2.3 关键步骤与优化点解析1595.2.4 鲲鹏BoostKit算法API介绍1655.3 Betweenness算法1665.3.1 分布式实现1675.3.2 难点分析1715.3.3 关键步骤与优化点解析1735.3.4 鲲鹏BoostKit算法API介绍1775.4 PageRank算法1795.4.1 分布式实现1805.4.2 难点分析1825.4.3 关键步骤与优化点解析1835.4.4 鲲鹏BoostKit算法API介绍1885.5 K_Core分解算法1895.5.1 分布式实现1915.5.2 难点分析1935.5.3 关键步骤与优化点解析1945.5.4 鲲鹏BoostKit算法API介绍1995.6 子图匹配算法2005.6.1 分布式实现2005.6.2 难点分析2045.6.3 关键步骤与优化点解析2045.6.4 鲲鹏BoostKit算法API介绍207第6章 图分析算法应用实战2116.1 网页搜索排名案例2126.1.1 场景介绍2126.1.2 整体方案2136.1.3 关键步骤2156.1.4 小结2216.2 视频推荐案例2226.2.1 场景介绍2226.2.2 整体方案2226.2.3 关键步骤2246.2.4 小结2296.3 金融风险识别案例2306.3.1 场景介绍2306.3.2 整体方案2306.3.3 关键步骤2326.3.4 小结240参考文献241
- 新华一城书集 (微信公众号认证)
- 上海新华书店官方微信书店
- 扫描二维码,访问我们的微信店铺
- 随时随地的购物、客服咨询、查询订单和物流...