商品详情
书名:生物医药大数据与智能分析
定价:99.8
ISBN:9787115558435
作者:彭绍亮
版次:第1版
出版时间:2021-05
内容提要:
生物医药大数据蕴含了非常丰富的信息和知识,是关乎人类生存与健康的重要战略资源,但只有对生物医药大数据进行高效处理和智能分析,才能真正推动生物医药研究和产业化从原来的假设驱动向数据驱动转变,因而近些年来生物医药大数据与智能分析逐渐成为潜力巨大且发展迅猛的交叉领域。本书简要介绍了并行计算、机器学习和深度学习应用于生物医药大数据的相关基础知识,并总结了作者团队在生物医药大数据处理和分析领域的若干成果,主要涵盖基因表达谱分析、微生物基因组、药物虚拟筛选、肿瘤基因表达谱分类、RNA编辑位点识别、增强子识别等,以作者团队的研究成果为实际案例,详细介绍了研究的路线和方法。 本书属于高性能计算、大数据、机器学习和生物医药等专业的交叉领域,可以为这些领域的研究人员提供参考,也可作为相关专业高年级本科生和研究生的补充教材。
作者简介:
彭绍亮 国家超级计算长沙中心副主任,湖南大学信息科学与工程学院教授、博导,湖南大学教育舆情研究中心副主任(兼),2020年被聘为长江学者特聘教授,2019年获湖南省杰出青年基金支持,长期从事高性能计算、大数据、生物信息、人工智能、区块链等方面研究。担任国防科技大学“天河”系列超级计算机生命科学方向负责人,国防科技大学/华大基因兼职教授,鹏城实验室智慧医疗平台课题负责人,中央军委科技委生物交叉立项专家组成员,科技部、工信部、教育部会评专家;中国计算机学会(CCF)理事,生物信息学、计算机应用专委副主任,大数据、高性能计算专委常委,区块链专委委员,CCF杰出会员和杰出讲者;湖南省生物信息学会发起人、理事长,3个SCI期刊和多个EI期刊的主编、副主编。出版专著7部,发表学术论文上百篇,Google引用五千余次。负责“天河”系列超级计算机应用软件研发工作,主持和参与科技部、国家自然科学基金委重点项目,973/863项目等项目13项。获2019年国家科学技术进步奖二等奖,2019年湖南省技术发明奖一等奖(排名*1),2013年军队科学技术进步奖一等奖,2018年CCF科学技术奖自然科学二等奖(排名*1),2016年荣立三等功 。 王晓伟 国防科技大学计算机科学与技术专业博士、软件工程博士后科研流动站博士后。长期从事网络空间安全、生物医药、军事信息系统等领域的大数据与人工智能技术研发工作。作为骨干参与“天河”系列超级计算机应用软件研发工作,获2017年军队科学技术进步奖一等奖。参与国家863计划、国家重点研发计划、国家自然科学基金重点项目等项目6项,参与制定国家及行业标准3项,作为*一译者出版译著2部(《命令行中的数据科学》《实时分析:流数据的分析与可视化技术》),参与编写教材2部(《生物信息计算》《大数据导论》)。
目录:
目录
第 一篇 绪论
第 1 章 生物医药大数据与智能分析概述 2
1.1 生物医药大数据 2
1.2 生物医药大数据的高效处理 3
1.2.1 大规模并行处理技术 3
1.2.2 云计算技术 5
1.3 生物医药大数据的智能分析 5
1.4 总结 6
1.5 本书的内容安排 6
*二篇 生物医药大数据的高效处理
第 2 章 生物医药大数据高效处理的基础 9
2.1 大数据计算模型 9
2.1.1 外存模型 9
2.1.2 数据流模型 9
2.1.3 PRAM 模型 10
2.1.4 MapReduce 模型 10
2.2 并行计算 10
2.2.1 计算密集型和数据密集型 11
2.2.2 并行计算的粒度 11
2.2.3 并行编程的一般设计过程 11
2.2.4 并行编程模型 12
2.3 总结 12
第 3 章 海量基因表达谱分析 13
3.1 基因表达谱分析与生物效应评估概述 14
3.2 海量基因表达谱快速查询 15
3.2.1 GSEA 工具 15
3.2.2 海量基因表达谱查询算法 17
3.2.3 性能评估 25
3.3 海量基因表达谱并行比对与聚类 27
3.3.1 基因表达数据库 CMap 28
3.3.2 基因表达谱并行比对 29
3.3.3 基因表达谱并行聚类 30
3.3.4 性能评估 34
3.4 总结 40
第 4 章 功能性前噬菌体预测 42
4.1 前噬菌体预测概述 43
4.1.1 噬菌体与功能性前噬菌体 43
4.1.2 前噬菌体与功能性前噬菌体预测的挑战 45
4.2 功能性前噬菌体预测算法 47
4.2.1 LysoPhD 流程设计 47
4.2.2 数据质量控制流水线 49
4.2.3 前噬菌体范围的粗略预测 50
4.2.4 前噬菌体范围的*确预测 53
4.2.5 前噬菌体功能性分析 54
4.2.6 基于末端延伸算法的溶原性噬菌体完整序列提取 55
4.2.7 性能评估 57
4.3 预测算法并行化 62
4.3.1 多线程并行加速 63
4.3.2 溶原性噬菌体数据库构建 64
4.4 总结 65
第 5 章 高通量药物虚拟筛选 67
5.1 药物虚拟筛选概述 68
5.1.1 药物虚拟筛选 68
5.1.2 虚拟筛选软件 D3DOCKxb 70
5.2 基于 CPU 多核的药物虚拟筛选并行优化 71
5.2.1 D3DOCKxb 程序分析 72
5.2.2 基于 CPU 多核的 D3DOCKxb 设计与实现 73
5.2.3 性能评估 76
5.3 基于 CPU-MIC 协同的药物虚拟筛选并行优化 79
5.3.1 基于 MIC 协处理器的 D3DOCKxb 移植 80
5.3.2 CPU-MIC 异构协同的 mD3DOCKxb 84
5.3.3 性能评估 86
5.4 基于“天河二号”超级计算机的大规模高通量药物虚拟筛选平台 90
5.4.1 高通量虚拟筛选的主要挑战 90
5.4.2 高通量虚拟筛选的算法设计 91
5.4.3 性能评估 93
5.4.4 应用研究 97
5.5 总结 99
第三篇 生物医药大数据的智能分析
第 6 章 生物医药大数据的智能分析基础 102
6.1 传统的机器学习技术 102
6.2 深度学习在生物医药大数据中的应用 103
6.2.1 在组学研究中的应用 104
6.2.2 在生物医学影像中的应用 105
6.2.3 在生物医学信号处理中的应用 105
6.2.4 在药物研发中的应用 106
6.3 常见的深度学习模型和框架 107
6.3.1 常见的深度学习模型 107
6.3.2 常见的深度学习框架 111
6.4 深度学习解决生物大数据问题的一般方法 112
6.4.1 数据获取及编码 112
6.4.2 数据预处理 113
6.4.3 模型训练 115
6.4.4 性能评估 116
6.5 总结 117
第 7 章 基于字典学习的肿瘤基因表达谱分类 118
7.1 肿瘤基因表达谱分类概述 119
7.1.1 肿瘤与基因表达谱 119
7.1.2 分类算法 123
7.2 基于判别投影的字典学习基因表达谱分类 126
7.2.1 字典学习分类算法 126
7.2.2 基于判别投影的字典学习算法 128
7.2.3 性能评估 132
7.3 结合集成学习的字典学习基因表达谱分类 134
7.3.1 集成学习 134
7.3.2 结合集成学习的字典学习算法 136
7.3.3 性能评估 140
7.4 基于随机序列和样本距离的基因表达谱特征选择 143
7.4.1 数据预处理方法 144
7.4.2 肿瘤基因表达谱数据的特征选择 145
7.4.3 性能评估 148
7.5 总结 149
第 8 章 基于深度学习的 RNA 编辑位点识别 150
8.1 RNA 编辑识别概述 150
8.1.1 RNA 编辑 150
8.1.2 RNA 编辑识别面临的挑战 151
8.2 RNA 编辑位点金标集的构建 152
8.2.1 ENCODE 计划 152
8.2.2 基于 ENCODE 计划的 RNA 编辑位点金标集设计 154
8.2.3 训练集和测试集的构建 155
8.3 基于双向 LSTM 的 RNA 编辑位点识别 157
8.3.1 双向长短时记忆网络 157
8.3.2 rnnRed 算法网络模型的构建、训练及性能评估 158
8.4 基于 ResNet 的 RNA 编辑位点识别 165
8.4.1 残差网络 165
8.4.2 cnnRed 算法网络模型的构建、训练及性能评估 166
8.5 总结 171
第 9 章 基于深度学习的增强子识别 172
9.1 增强子识别概述 172
9.2 增强子识别神经网络 174
9.2.1 模型的设计 174
9.2.2 模型的优化 177
9.3 增强子序列数据集的预处理 178
9.3.1 增强子数据集 178
9.3.2 增强子序列的数值映射 179
9.4 模型的训练 180
9.4.1 训练集及实验平台 180
9.4.2 参数的选择 181
9.5 模型的预测评估 182
9.5.1 测试集及实验平台 182
9.5.2 性能度量指标 182
9.5.3 模型性能评估 184
9.6 总结 186
参考文献 187
- 人民邮电出版社有限公司 (微信公众号认证)
- 人民邮电出版社微店,为您提供最全面,最专业的一站式购书服务
- 扫描二维码,访问我们的微信店铺
- 随时随地的购物、客服咨询、查询订单和物流...