智能水下声呐图像处理技术及应用人工智能AI算法大模型声呐图像海洋技术

￥99.00

运费：	¥ 0.00-20.00

立即购买

支付：: 微信支付银行卡支付宝

商品详情

书名：智能水下声呐图像处理技术及应用
定价：139.8
ISBN：9787115674845
作者：张建磊谢广明熊明磊
版次：第1版
出版时间：2026-05

内容提要：
随着海洋开发活动的增多和相关研究的不断深入，水下声呐图像处理技术的应用日益广泛。水下声呐图像处理是人工智能与海洋探测领域中的热门研究课题，同时也是相关专业的一门核心课程。本书包括十三章。第一章为绪论，介绍水下图像识别与处理的背景知识及水下声呐图像处理技术的基本概念和发展现状。第2章讲解声呐数据预处理与数据集制作，涵盖设备介绍、数据获取及预处理步骤等。第3章介绍声呐图像目标检测和去噪算法。第4和5章分别探究基于深度学习的前视声呐图像目标检测算法和去噪算法。第6章聚焦前视声呐图像语义分割方法。第7章介绍前视声呐图像语义分割数据集的构建。第8章介绍基于残差多级特征提取与融合的语义分割方法。第9章介绍基于Transformer和CNN的语义分割方法。第十～十三章集中攻克长尾小样本声呐数据识别难题。此外，本书还通过附录提供一系列补充知识，通过推荐阅读分享一些值得参考的资料。本书面向海洋探测领域的科研人员、工程师及高校师生，旨在帮助他们掌握人工智能技术在该领域的应用和实践。

作者简介：
张建磊南开大学人工智能学院教授，博士生导师，自动化系副主任。主持多项国家自然科学基金项目，多次获得省部级科技奖励。主要研究方向为群体智能与模式识别，发表高水平学术论文八十余篇，现任中国自动化学会、中国人工智能学会、中国系统仿真学会、中国海洋学会相关专业委员会委员谢广明北京大学工学院教授，兼任北京大学人工智能研究院、北京大学海洋研究院教授。主持多项国家自然科学基金重点项目、国家重点基础研究发展计划(973计划)项目、国家高技术研究发展计划(863计划)项目。曾获国家自然科学奖二等奖、教育部自然科学奖一等奖、吴文俊人工智能科学技术奖等奖项。担任国家自然科学基金委员会、科学技术部国家重点研发计划评审专家，中国仿真学会理事及机器人系统仿真专业委员会主任，中国生产力促进中心协会服务机器人专业委员会委员等。熊明磊工学博士，毕业于北京大学工学院，主要研究方向为水下机器人的设计、控制与系统集成。在水下机器人领域发表学术论文十余篇，获得国家发明专利授权三十余项，主持多项国家级科研项目。

目录：
第1章　绪论 1
1.1　水下图像识别与处理 1
1.2　水下声呐图像处理技术 3
1.3　本书安排 5

第2章　声呐数据预处理与数据集制作 7
2.1　引言 7
2.2　前视声呐介绍 7
2.2.1　前视声呐成像原理 7
2.2.2　Oculus前视声呐 9
2.2.3　Oculus数据 12
2.3　前视声呐数据预处理 15
2.3.1　坐标变换 15
2.3.2　图像插值 17
2.4　前视声呐数据采集与图像标注 20
2.4.1　前视声呐数据采集 20
2.4.2　前视声呐图像标注 21
2.5　本章小结 23

第3章　声呐图像目标检测和图像去噪算法的技术现状 24
3.1　引言 24
3.2　声呐目标检测算法的技术现状 25
3.2.1　基于人工特征的声呐图像目标检测算法 25
3.2.2　基于传统机器学习的声呐图像目标检测算法 26
3.2.3　基于深度学习的声呐图像目标检测算法 27
3.3　声呐图像去噪算法的技术现状 29
3.3.1　基于滤波器的声呐图像去噪算法 30
3.3.2　基于深度学习的声呐图像去噪算法 31
3.4　本章小结 33

第4章　基于深度学习的前视声呐图像目标检测算法 35
4.1　引言 35
4.2　基于STAFNet模型的目标检测算法 36
4.2.1　STAFNet模型组成概述 36
4.2.2　主干网络Swin Transformer 38
4.2.3　颈部网络FPN 43
4.2.4　轻量级检测器Lite Head 43
4.2.5　三元损失函数 45
4.3　实验与结果分析 47
4.3.1　实验细节 47
4.3.2　评价指标 48
4.3.3　消融实验 49
4.3.4　对比实验 49
4.3.5　结果分析 51
4.4　本章小结 52

第5章　基于深度学习的前视声呐图像去噪算法 53
5.1　引言 53
5.2　前视声呐图像噪声模型 54
5.3　RAT算法 55
5.4　基于Pix2Pix的改进版RAT算法 58
5.4.1　Pix2Pix模型结构 58
5.4.2　PBR算法 61
5.5　实验与结果分析 66
5.5.1　评价指标 66
5.5.2　对比实验 69
5.5.3　结果分析 69
5.6　本章小结 71

第6章　前视声呐图像语义分割方法 72
6.1　引言 72
6.2　前视声呐图像语义分割方法研究现状 73
6.3　基于深度学习的图像语义分割方法研究现状 74
6.4　前视声呐图像语义分割难点 76
6.5　本章小结 78

第7章　前视声呐图像语义分割数据集构建 79
7.1　引言 79
7.2　前视声呐成像原理 80
7.3　数据采集与数据集划分 83
7.3.1　数据采集 83
7.3.2　数据集划分 85
7.4　数据扩增 85
7.4.1　仿射变换 86
7.4.2　颜色调整 87
7.5　语义分割数据集标签制作 88
7.6　本章小结 89

第8章　基于残差多级特征提取与融合的语义分割方法 91
8.1　引言 91
8.2　卷积神经网络基础 92
8.2.1　卷积层 92
8.2.2　池化层 95
8.2.3　*层 95
8.2.4　标准化层 98
8.2.5　丢弃层 99
8.3　多级注意力与空洞金字塔嵌套U形网络 100
8.3.1　残差U形特征提取结构 100
8.3.2　注意力与空洞金字塔特征融合结构 102
8.3.3　损失函数 105
8.4　实验与结果分析 106
8.4.1　实验评价指标 106
8.4.2　实验设置与训练过程分析 108
8.4.3　消融实验与结果分析 110
8.4.4　对比实验与结果分析 112
8.5　本章小结 116

第9章　基于Transformer和CNN的语义分割方法 118
9.1　引言 118
9.2　Transformer基础 118
9.2.1　自注意力机制 119
9.2.2　多头自注意力机制 120
9.2.3　位置编码 121
9.3　融合Transformer和CNN的U形网络 121
9.3.1　混合Transformer嵌入编码结构 122
9.3.2　混合Transformer扩张解码结构 124
9.4　实验与结果分析 126
9.4.1　实验评价指标 126
9.4.2　参数设置与训练过程分析 127
9.4.3　消融实验与结果分析 129
9.4.4　对比实验与结果分析 130
9.4.5　泛化实验与结果分析 132
9.5　本章小结 133

第10章　声呐图像长尾小样本数据研究概述 135
10.1　引言 135
10.2　长尾小样本研究的难点 136
10.3　本书关注的挑战 138
10.4　本书作者团队的主要贡献 140
10.5　本章小结 143

第11章　声呐图像开放集长尾识别研究概述 144
11.1　引言 144
11.2　声呐图像识别研究现状 144
11.3　长尾识别研究现状 145
11.4　开放集识别研究现状 146
11.5　开放集长尾识别研究现状 147
11.6　分布外检测研究现状 148
11.7　本章小结 148

第12章　声呐图像长尾小样本识别方法 149
12.1　引言 149
12.2　类别重平衡策略对迁移学习的影响 149
12.3　平衡集成迁移学习方法 151
12.3.1　问题定义与方法动机 151
12.3.2　整体框架 153
12.3.3　主要模块介绍 154
12.3.4　BETL的训练算法 157
12.4　实验与结果分析 158
12.4.1　评价指标 158
12.4.2　数据集描述 160
12.4.3　实验环境和参数设置 161
12.4.4　与先进方法的对比 162
12.4.5　结果分析 163
12.5　本章小结 181

第13章　声呐图像开放集长尾识别方法 183
13.1　引言 183
13.2　构建声呐图像开放集长尾识别基准 184
13.2.1　Sonar-OLTR任务的形式化定义 184
13.2.2　一种简化形式的开放度定义的合理性讨论 185
13.2.3　数据集的选择和构建 187
13.2.4　声呐图像中的开放集识别所面临的挑战 189
13.2.5　设定评价指标 192
13.2.6　Sonar-OLTR实验设计 196
13.3　PLUD方法 196
13.3.1　提出方法的动机 196
13.3.2　整体框架 201
13.3.3　主要模块 202
13.3.4　和现有方法的联系 205
13.4　实验与结果分析 205
13.4.1　实现细节 205
13.4.2　和先进方法的对比 206
13.4.3　主要结果和分析 208
13.4.4　分布外检测 214
13.4.5　消融实验 217
13.4.6　*参数分析 218
13.4.7　进一步分析本书提出的评价指标 220
13.5　本章小结 223

附录A　Oculus格式数据结构表 224
附录B　本书部分变量表 227
附录C　本书涉及的主要算法术语及其对应描述 229
推荐阅读 231