理解大语言模型:学习其基本思想和技术
作 者:(斯里)蒂姆拉·阿马拉通加 著 何明,邹明光,董经纬 译
定 价:75
出 版 社:西安交通大学出版社
出版日期:2024年08月01日
页 数:180
装 帧:平装
ISBN:9787569338812
目录
●第1章绪论
1.1人工智能简史
1.2大语言模型所处的地位
1.3小结
第2章自然语言处理的前世今生
2.1自然语言处理的历史
形式语法
转换语法与生成语法
句法解析
语境与语义
语言理解
知识工程
概率模型
隐马尔可夫模型
统计语言模型
优选熵模型
条件随机场
大型注释语料库
……
内容介绍
随着人工智能技术飞速发展,近两年出现了以chatGPT为代表的智能化程度极高的处理工具,支撑它们的关键技术就是大语言模型(LLM)。大语言模型(LLM)是人工智能在自然语言处理领域的应用,也是人工智能的近期新前沿,源于自然语言处理(NLP)和深度学习的研究发展。本书首先介绍了大语言模型的基本情况,讲述了自然语言处理的发展历史、基本概念和主要任务。以一种重要的大语言模型Transformer模型为例介绍了大建模语言的基础模型、应用方法、过拟合问题等。最后介绍了生成式预训练Transformer模型、Meta人工智能大语言模型等几种常用的大语言模型。
(斯里)蒂姆拉·阿马拉通加 著 何明,邹明光,董经纬 译
他是培生集团斯里兰卡公司的高级软件架构师,拥有超过15年的行业经验。他也是人工智能、机器学习、教育深度学习和计算机视觉领域的发明家、作家和研究员。蒂姆拉拥有斯里兰卡科伦坡大学计算机科学理学硕士学位和信息技术学士学位。他也是TOGAF认证的企业架构师。他为在线学习平台申请了三项专利(动态神经网络和语义学领域)。他出版了三本关于深度学习和计算机视觉的书。