深入大模型系统 提示工程符号推理与智能体实践 AI大模型LLM智能体搭建提示工程Transformer
¥49.50
| 运费: | ¥ 0.00-20.00 |
商品详情
书名:深入大模型系统:提示工程、符号推理与智能体实践
定价:79.8
ISBN:9787115687074
作者:白钰
版次:第1版
出版时间:2025-12
内容提要:
本书从发展概述、核心技术原理与产业实践的角度深入解析大模型系统。 全书共 9 章。第1章*对大模型技术进行概述,系统梳理其概念、发展里程碑及未来趋势。第2章转入产业视角,深入剖析竞争格局、商业策略与产业落地面临的挑战。第3~5章介绍大模型系统的技术实现,从监督学习、迁移学习等方法入手,逐步深入文本标记化、编码器-解码器架构与从 RNN/LSTM 到 Transformer 的革新,再介绍缩放定律、数据 / 算力/参数等预训练要素,以及指令微调、基于人类反馈的强化学习对齐机制。第6~9章从产业实践的角度解析应用层技术,包括上下文学习、检索增强生成等提示工程方法,深入剖析以思维链为代表的符号推理,以及从工作记忆、长期记忆到认知架构的语言智能体体系的构建。 本书适合人工智能领域从业者、高校计算机相关专业师生,以及所有对大模型技术感兴趣的人士阅读。
作者简介:
白钰,AI与云计算技术*,在多模态大模型算法及AI系统方面有丰富的知识储备和实践经验。曾在Comcast、*、阿里云等企业担任AI算法负责人,带领团队开发多项服务亿级用户的AI系统,在多模态大模型研发和大规模机器学习系统落地方面积累了大量经验;曾在NeurIPS、NSDI、S&P等*会议、期刊上发表多篇论文,拥有20余项专利,参与多项AI标准制定,现任中国中文信息学会大模型与生成专业委员会委员、中国计算机学会技术前沿委员会委员。
目录:
1 章 大模型技术概述 1
11 大模型相关概念辨析 1
111 基础模型 1
112 GenAI 模型 2
113 LLM 3
114 大模型 3
12 大模型技术发展历程 4
121 技术发展的阶段 4
122 技术发展的驱动力 7
123 当前挑战与未来发展方向 8
13 大模型系统发展路径 9
131 基础语言理解与生成 9
132 工具赋能的增强智能 10
133 自主思考的深入探索 11
134 连接物理世界的具身智能 13
第 2 章 大模型产业发展概述 15
21 大模型产业发展回顾 15
211 Transformer 架构诞生 15
212 商业模式探索 16
213 ChatGPT 与生态竞赛 16
214 “百家争鸣”时代 17
22 商业化核心战略 18
221 构建可持续的商业闭环 18
222 平民化 20
223 专业化 21
224 具身化 22
23 产业落地模式 23
231 场景创新 23
232 工具创新 24
233 方法创新 24
234 评估大模型带来的创新价值 24
24 产业竞争格局与挑战 25
241 领跑者的技术透明化挑战 25
242 后发者的市场局限 25
243 创业公司的生存压力 26
第 3 章 模型预训练技术基础 27
31 监督学习 27
311 监督学习的定义 27
312 监督学习的统计建模 28
313 监督学习的统计前提 29
314 监督学习中模型结构的选择 31
315 监督学习中模型的泛化机制 32
316 案例分析:从实验观测数据发现牛顿*定律 34
32 深度学习 36
321 层次结构与函数表达能力 36
322 网络训练机制 38
323 DNN 的过拟合风险与压缩张力 41
324 DNN 压缩机制 42
325 DNN 的结构化能力 45
33 表示学习 46
331 表示学习的基本思想 47
332 CNN 与层次化空间表示 49
333 残差网络 53
34 迁移学习 55
341 概念引入:从已见分布到未知分布 55
342 迁移学习的基本策略:冻结还是微调 56
343 ResNet 与 ImageNet 58
344 迁移学习的流程 59
345 实践案例:ResNet-152羊驼五分类微调 61
346 迁移学习的范式转变 63
第 4 章 预训练语言模型基础 64
41 标记化 64
411 记号 64
412 词汇表 65
413 未登录词 65
414 标记化策略 66
415 编码与解码 67
42 编码器-解码器架构 68
421 编码器-解码器架构概念 68
422 隐层语义空间 69
423 通用性和模块化 70
43 自监督学习 71
431 自监督学习的借口任务 71
432 CLM 73
44 RNN 74
441 RNN 基础与工作原理 74
442 RNN 编码器 76
443 RNN 解码器 77
444 强制教学与计划采样 79
445 LSTM 与门控结构记忆 82
446 注意力机制 84
45 Transformer 与并行检索 88
451 从循环依赖到并行计算 88
452 自注意力机制 90
453 位置编码机制 91
454 多头注意力机制 92
455 标准的 Transformer 层结构 93
456 自监督的预训练范式 95
第 5 章 LLM 基础 98
51 预训练阶段 98
511 缩放定律 98
512 数据 99
513 算力 102
514 参数规模 104
52 后训练阶段 108
521 分类头微调 109
522 指令微调 110
523 环境价值体系对齐 112
524 RLHF 的滚雪球式自举对齐 117
第 6 章 提示工程方法 122
61 上下文学习原理机制 122
611 测试时模型的生成行为控制问题 122
612 少样本提示与新任务学习机制 123
613 *样本提示的能力 125
62 RAG 的知识迁移机制 128
621 建立检索模块的“语义可比性”基础 128
622 检索模块中的效率与精度权衡 130
623 面向生成质量的新排序器训练范式 132
624 将外部知识注入模型上下文 134
63 AI 搜索 136
631 从信息检索到任务执行的范式跃迁 136
632 结构化知识索引机制 137
633 工具环境中的检索机制 139
634 用户偏好环境中的召回机制 142
635 多通道融合机制 144
636 搜索型系统的演化趋势:从检索接口到语义代理 146
第 7 章 符号推理方法 150
71 状态空间 150
711 状态空间的构造 150
712 推理的本质 152
713 默认搜索机制的局限 154
72 路径深度与推理能力 155
721 输出长度作为“行动预算” 156
722 CoT 提示 157
73 自一致性机制 159
731 以路径多样性提升推理鲁棒性 159
732 搜索策略的演进 161
74 ToT:构建显式的结构化搜索范式 162
741 DFS 的结构性瓶颈 163
742 早期结构化尝试 164
743 ToT 的核心 166
744 ToT 应用 167
75 语言作为控制器 169
751 显式提示驱动 169
752 交互式引导 171
753 策略的内化 173
754 策略的涌现:*越模仿,迈向自组织的复杂搜索
行为 175
第 8 章 语言智能体的构建 178
81 工作记忆 178
811 将 LLM 的生成过程重新诠释为策略函数 178
812 构建智能体的动态认知 180
813 ReAct 框架 183
82 长期记忆 186
821 ReAct 框架的局限与突破 186
822 长期记忆的运作机制 188
823 长期记忆的架构与流程 190
83 语言智能体的本质 192
831 先验知识体系 192
832 环境交互机制 194
833 先验与反馈的协同进化 196
第 9 章 智能体的认知架构 198
91 认知架构总览 198
911 认知架构的核心设计原则 198
912 SOAR 认知架构 199
913 CoALA 202
92 情节记忆 204
921 在线层-近线层-离线层 3 层架构 205
922 在线写入 206
923 近线处理 208
924 离线反思 209
925 在线检索 211
93 程序记忆 212
931 认知过程的规则与调度 214
932 规则的固化与执行 215
933 程序记忆的整合与治理 217
94 行动规划 218
941 行动策略的演进 218
942 规划的生成 220
943 流水线架构 222
944 应用案例分析:博弈场景的“博弈树”优化 223
95 交互协议 MCP 224
951 MCP 224
952 工具的使用模式 228
953 工具的动态生成 229
954 工具生态的治理 231
955 可信赖自主交互的顶层设计 233
定价:79.8
ISBN:9787115687074
作者:白钰
版次:第1版
出版时间:2025-12
内容提要:
本书从发展概述、核心技术原理与产业实践的角度深入解析大模型系统。 全书共 9 章。第1章*对大模型技术进行概述,系统梳理其概念、发展里程碑及未来趋势。第2章转入产业视角,深入剖析竞争格局、商业策略与产业落地面临的挑战。第3~5章介绍大模型系统的技术实现,从监督学习、迁移学习等方法入手,逐步深入文本标记化、编码器-解码器架构与从 RNN/LSTM 到 Transformer 的革新,再介绍缩放定律、数据 / 算力/参数等预训练要素,以及指令微调、基于人类反馈的强化学习对齐机制。第6~9章从产业实践的角度解析应用层技术,包括上下文学习、检索增强生成等提示工程方法,深入剖析以思维链为代表的符号推理,以及从工作记忆、长期记忆到认知架构的语言智能体体系的构建。 本书适合人工智能领域从业者、高校计算机相关专业师生,以及所有对大模型技术感兴趣的人士阅读。
作者简介:
白钰,AI与云计算技术*,在多模态大模型算法及AI系统方面有丰富的知识储备和实践经验。曾在Comcast、*、阿里云等企业担任AI算法负责人,带领团队开发多项服务亿级用户的AI系统,在多模态大模型研发和大规模机器学习系统落地方面积累了大量经验;曾在NeurIPS、NSDI、S&P等*会议、期刊上发表多篇论文,拥有20余项专利,参与多项AI标准制定,现任中国中文信息学会大模型与生成专业委员会委员、中国计算机学会技术前沿委员会委员。
目录:
1 章 大模型技术概述 1
11 大模型相关概念辨析 1
111 基础模型 1
112 GenAI 模型 2
113 LLM 3
114 大模型 3
12 大模型技术发展历程 4
121 技术发展的阶段 4
122 技术发展的驱动力 7
123 当前挑战与未来发展方向 8
13 大模型系统发展路径 9
131 基础语言理解与生成 9
132 工具赋能的增强智能 10
133 自主思考的深入探索 11
134 连接物理世界的具身智能 13
第 2 章 大模型产业发展概述 15
21 大模型产业发展回顾 15
211 Transformer 架构诞生 15
212 商业模式探索 16
213 ChatGPT 与生态竞赛 16
214 “百家争鸣”时代 17
22 商业化核心战略 18
221 构建可持续的商业闭环 18
222 平民化 20
223 专业化 21
224 具身化 22
23 产业落地模式 23
231 场景创新 23
232 工具创新 24
233 方法创新 24
234 评估大模型带来的创新价值 24
24 产业竞争格局与挑战 25
241 领跑者的技术透明化挑战 25
242 后发者的市场局限 25
243 创业公司的生存压力 26
第 3 章 模型预训练技术基础 27
31 监督学习 27
311 监督学习的定义 27
312 监督学习的统计建模 28
313 监督学习的统计前提 29
314 监督学习中模型结构的选择 31
315 监督学习中模型的泛化机制 32
316 案例分析:从实验观测数据发现牛顿*定律 34
32 深度学习 36
321 层次结构与函数表达能力 36
322 网络训练机制 38
323 DNN 的过拟合风险与压缩张力 41
324 DNN 压缩机制 42
325 DNN 的结构化能力 45
33 表示学习 46
331 表示学习的基本思想 47
332 CNN 与层次化空间表示 49
333 残差网络 53
34 迁移学习 55
341 概念引入:从已见分布到未知分布 55
342 迁移学习的基本策略:冻结还是微调 56
343 ResNet 与 ImageNet 58
344 迁移学习的流程 59
345 实践案例:ResNet-152羊驼五分类微调 61
346 迁移学习的范式转变 63
第 4 章 预训练语言模型基础 64
41 标记化 64
411 记号 64
412 词汇表 65
413 未登录词 65
414 标记化策略 66
415 编码与解码 67
42 编码器-解码器架构 68
421 编码器-解码器架构概念 68
422 隐层语义空间 69
423 通用性和模块化 70
43 自监督学习 71
431 自监督学习的借口任务 71
432 CLM 73
44 RNN 74
441 RNN 基础与工作原理 74
442 RNN 编码器 76
443 RNN 解码器 77
444 强制教学与计划采样 79
445 LSTM 与门控结构记忆 82
446 注意力机制 84
45 Transformer 与并行检索 88
451 从循环依赖到并行计算 88
452 自注意力机制 90
453 位置编码机制 91
454 多头注意力机制 92
455 标准的 Transformer 层结构 93
456 自监督的预训练范式 95
第 5 章 LLM 基础 98
51 预训练阶段 98
511 缩放定律 98
512 数据 99
513 算力 102
514 参数规模 104
52 后训练阶段 108
521 分类头微调 109
522 指令微调 110
523 环境价值体系对齐 112
524 RLHF 的滚雪球式自举对齐 117
第 6 章 提示工程方法 122
61 上下文学习原理机制 122
611 测试时模型的生成行为控制问题 122
612 少样本提示与新任务学习机制 123
613 *样本提示的能力 125
62 RAG 的知识迁移机制 128
621 建立检索模块的“语义可比性”基础 128
622 检索模块中的效率与精度权衡 130
623 面向生成质量的新排序器训练范式 132
624 将外部知识注入模型上下文 134
63 AI 搜索 136
631 从信息检索到任务执行的范式跃迁 136
632 结构化知识索引机制 137
633 工具环境中的检索机制 139
634 用户偏好环境中的召回机制 142
635 多通道融合机制 144
636 搜索型系统的演化趋势:从检索接口到语义代理 146
第 7 章 符号推理方法 150
71 状态空间 150
711 状态空间的构造 150
712 推理的本质 152
713 默认搜索机制的局限 154
72 路径深度与推理能力 155
721 输出长度作为“行动预算” 156
722 CoT 提示 157
73 自一致性机制 159
731 以路径多样性提升推理鲁棒性 159
732 搜索策略的演进 161
74 ToT:构建显式的结构化搜索范式 162
741 DFS 的结构性瓶颈 163
742 早期结构化尝试 164
743 ToT 的核心 166
744 ToT 应用 167
75 语言作为控制器 169
751 显式提示驱动 169
752 交互式引导 171
753 策略的内化 173
754 策略的涌现:*越模仿,迈向自组织的复杂搜索
行为 175
第 8 章 语言智能体的构建 178
81 工作记忆 178
811 将 LLM 的生成过程重新诠释为策略函数 178
812 构建智能体的动态认知 180
813 ReAct 框架 183
82 长期记忆 186
821 ReAct 框架的局限与突破 186
822 长期记忆的运作机制 188
823 长期记忆的架构与流程 190
83 语言智能体的本质 192
831 先验知识体系 192
832 环境交互机制 194
833 先验与反馈的协同进化 196
第 9 章 智能体的认知架构 198
91 认知架构总览 198
911 认知架构的核心设计原则 198
912 SOAR 认知架构 199
913 CoALA 202
92 情节记忆 204
921 在线层-近线层-离线层 3 层架构 205
922 在线写入 206
923 近线处理 208
924 离线反思 209
925 在线检索 211
93 程序记忆 212
931 认知过程的规则与调度 214
932 规则的固化与执行 215
933 程序记忆的整合与治理 217
94 行动规划 218
941 行动策略的演进 218
942 规划的生成 220
943 流水线架构 222
944 应用案例分析:博弈场景的“博弈树”优化 223
95 交互协议 MCP 224
951 MCP 224
952 工具的使用模式 228
953 工具的动态生成 229
954 工具生态的治理 231
955 可信赖自主交互的顶层设计 233
- 人民邮电出版社有限公司 (微信公众号认证)
- 人民邮电出版社微店,为您提供最全面,最专业的一站式购书服务
- 扫描二维码,访问我们的微信店铺
- 随时随地的购物、客服咨询、查询订单和物流...