AI工程大模型应用开发实战大模型应用实战开发从*构建大模型LLM大语言模型

￥109.80

运费：	¥ 0.00-20.00

立即购买

支付：: 微信支付银行卡支付宝

AI工程大模型应用开发实战大模型应用实战开发从*构建大模型LLM大语言模型商品图0

商品详情

书名：AI工程：大模型应用开发实战
定价：159.8
ISBN：9787115686398
作者：[越]奇普·萱（Chip Huyen）
版次：第1版
出版时间：2026-01

内容提要：
本书是学习与实践AI工程的*指南，由业内知名AI*、*书作者Chip Huyen撰写。全书系统阐述了“AI工程”的核心方法——如何基于现成的基础模型（LLM、LMM）构建*、实用的AI应用。书中提供了完整的AI工程框架，涵盖模型选择与评估、提示工程、RAG与智能体、微调策略、数据集工程、推理优化及AI工程架构等关键环节，帮助*在复杂的AI生态中做出科学的技术决策。作者结合丰富的业界经验，通过大量真实案例与可操作的方法，展示了如何让AI应用更快、更可靠、更具扩展性。本书适合AI应用*、机器学习工程师、技术经理，以及希望系统掌握AI应用开发方法的从业者阅读，也是企业构建AI能力的重要参考指南。

作者简介：
【作者简介】奇普·萱（Chip Huyen）计算机科学家、作家，深耕于AI、数据与叙事艺术的跨界地带。毕业于斯坦福大学，并曾在该校教授“Machine Learning Systems Design”（CS 329S）课程。创立了一家AI基础设施初创公司（后被成功收购）。此前曾*职于Snorkel AI和NVIDIA。著有《机器学习系统设计》（Designing Machine Learning Systems，O’Reilly），已被翻译成十余种语言，长居Amazon人工智能图书*榜榜*，在全球*中拥有广泛的影响力。新作《AI工程》已经成为当前AI领域*有影响的图书之一，AI工程师*。【译者简介】宝玉提示工程师、极客时间专栏“软件工程之美”作者，专注于将前沿AI能力转化为可落地的生产力工具与方法论。知名AI博主：微博粉丝*百万，连续三年蝉联“微博年度科技行业影响力大V”；Twitter Leaderboard全球榜单TOP 10博主。关注@宝玉xp（微博）/@dotey（X），获取关于提示工程与AI工程的前沿洞见。审校者简介何文斯 Dify全球GTM增长负责人、*“何文斯”作者。主要研究方向为大模型中间件技术、RAG与智能体等AI应用工程化体系。业余时间分享大模型与AI技术科普实践心得，希望用通俗的方式帮助更多人理解并用好新技术。李瀚 AI工程领域*，拥有10余年AI架构设计与开发经验，曾在第四范式、百度等公司担任架构师及技术总监等职位。主导过多款AI平台及产品的设计与开发，服务过多家500强企业的AI转型咨询交付。著有《探秘大模型应用开发》。

目录：
目录
译者序
前言
第 1章使用基础模型构建AI应用入门
1.1 AI工程的兴起
1.1.1 从语言模型到大型语言模型
1.1.2 从大型语言模型到基础模型
1.1.3 从基础模型到AI工程
1.2 基础模型的应用场景
1.2.1 编程
1.2.2 图像和视频制作
1.2.3 写作
1.2.4 教育
1.2.5 对话机器人
1.2.6 信息聚合
1.2.7 数据组织
1.2.8 工作流自动化
1.3 规划AI应用
1.3.1 用例评估
1.3.2 设定目标
1.3.3 里程碑规划
1.3.4 维护
1.4 AI工程技术栈
1.4.1 AI技术栈的三个层次
1.4.2 AI工程与ML工程
1.4.3 AI工程与全栈工程
1.5 小结
第 2章理解基础模型
2.1 训练数据
2.1.1 多语言模型
2.1.2 特定领域模型
2.2 建模
2.2.1 模型架构
2.2.2 模型规模
2.3 后训练
2.3.1 监督微调
2.3.2 偏好微调
2.4 采样
2.4.1 采样基础知识
2.4.2 采样策略
2.4.3 测试时计算
2.4.4 结构化输出
2.4.5 AI的概率特性
2.5 小结
第3章评估方法论
3.1 评估基础模型的挑战
3.2 理解语言建模指标
3.2.1 熵
3.2.2 交叉熵
3.2.3 BPC与BPB
3.2.4 困惑度
3.2.5 困惑度的解释与应用场景
3.3 *评估
3.3.1 功能正确性
3.3.2 与参考数据的相似度测量
3.3.3 嵌入简介
3.4 AI当裁判
3.4.1 为什么用AI当裁判
3.4.2 如何用AI当裁判
3.4.3 以AI为裁判的局限性
3.4.4 哪些模型可以作为裁判
3.5 使用比较评估对模型进行排名
3.5.1 比较评估面临的挑战
3.5.3 比较评估的未来
3.6 小结
第4章评估AI系统
4.1 评估标准
4.1.1 领域特定能力
4.1.2 生成能力
4.1.3 指令遵循能力
4.1.4 成本和延迟
4.2 模型选择
4.2.1 模型选择工作流
4.2.2 模型的自建与购买
4.2.3 利用公开基准测试
4.3 设计你的评估流程
4.3.1 第一步：评估系统中的所有组件
4.3.2 步骤2：创建评估指南
4.3.3 步骤3：定义评估方法和数据
4.4 小结
第5章提示工程
5.1 提示词简介
5.1.1 上下文学习：*样本和少样本
5.1.2 系统提示词和用户提示词
5.1.3 上下文长度与上下文效率
5.2 提示工程*实践
5.2.1 撰写清晰明确的指令
5.2.2 提供充足的上下文
5.2.3 将复杂任务拆分为更简单的子任务
5.2.4 给模型更多思考时间
5.2.5 对提示词进行迭代优化
5.2.6 评估提示工程工具
5.2.7 提示词的组织与版本管理
5.3 防御性提示工程
5.3.1 专有提示词与反向提示工程
5.3.2 越狱与提示词注入
5.3.3 信息提取
5.3.4 针对提示词攻击的防御措施
5.4 小结
第6章 RAG与智能体
6.1 RAG
6.1.1 RAG架构
6.1.2 检索算法
6.1.3 检索优化
6.1.4 *越文本的RAG
6.2 智能体
6.2.1 智能体概述
6.2.2 工具
6.2.3 规划
6.2.4 智能体的故障模式与评估
6.3 记忆
6.4 小结
第7章微调
7.1 微调概述
7.2 何时进行微调
7.2.1 进行微调的原因
7.2.2 不进行微调的原因
7.2.3 微调与RAG
7.3 内存瓶颈
7.3.1 反向传播与可训练参数
7.3.2 内存计算
7.3.3 数值表示
7.3.4 量化
7.4 微调技术
7.4.1 PEFT
7.4.2 模型合并与多任务微调
7.4.3 微调策略
7.5 小结
第8章数据集工程
8.1 数据策展
8.1.1 数据质量
8.1.2 数据覆盖度
8.1.3 数据量
8.1.4 数据获取与数据标注
8.2 数据增强与数据合成
8.2.1 为什么要进行数据合成
8.2.2 传统的数据合成方法
8.2.3 AI驱动的数据合成方法
8.2.4 模型蒸馏
8.3 数据处理
8.3.1 数据检查
8.3.2 数据去重
8.3.3 数据清理与过滤
8.3.4 数据格式化
8.4 小结
第9章推理优化
9.1 理解推理优化
9.1.1 推理概述
9.1.2 推理性能指标
9.1.3 AI加速器
9.2 推理优化的实现
9.2.1 模型优化
9.2.2 推理服务优化
9.3 小结
第 10章 AI工程架构与用户反馈
10.1 AI工程架构
10.1.1 增强上下文
10.1.2 设置防护措施
10.1.3 添加路由器和网关
10.1.4 通过缓存技术降低延迟
10.1.5 添加智能体模式
10.1.6 监控与可观测性
10.1.7 AI流水线编排
10.2 用户反馈
10.2.1 提取对话反馈
10.2.2 反馈设计
10.2.3 反馈的局限性
10.3 小结