Python机器学习实践 安德烈 朱萨尼 人工智能开发与实战丛书 Python开发机器学习应用程序基本原理技术书籍
运费: | 免运费 |
商品详情
定价:89.0
ISBN:9787111729860
作者:[意] 安德烈·朱萨尼(Andrea Giussani)
版次:1
内容提要:
本书提供了使用Python开发机器学习应用程序的基本原理。主要内容包括:机器学习概念及其应用;数据预处理、降维;各种线性模型、集成学习方法、随机森林、提升方法;自然语言处理、深度学习等。本书跟进了机器学习的最新研究成果,比如近几年提出的著名算法XGBoost和CatBoost,以及SHAP值。这些方法是机器学习领域中新颖且先进的模型。
本书目的是向读者介绍从业人员采用的解决机器学习问题的主要现代算法,跟踪机器学习领域研究前沿,并为初学者提供使用机器学习的方法。本书覆盖面广,对所有希望在数据科学和分析任务中使用机器学习的人来说,本书既是一本很好的学习资料,同时也是一本实战教程,其中介绍了多种统计模型,并提供了大量的相应代码,以将这些概念一致地应用于实际问题。
目录:
目录
译者的话
原书前言
第1章机器学习初步
1.1一个简单的监督模型:最近邻法
1.2数据预处理
1.2.1数据放缩
1.2.2数据高斯化:幂变换简介
1.2.3类别变量的处理
1.2.4缺失值的处理
1.3不平衡数据的处理方法
1.3.1少数类的随机过采样
1.3.2多数类的随机欠采样
1.3.3合成少数类过采样
1.4降维:主成分分析(PCA)
1.4.1使用PCA进行降维
1.4.2特征提取
1.4.3非线性流形算法:t-SNE
第2章机器学习线性模型
2.1线性回归
2.2收缩方法
2.2.1Ridge回归(L2正则化)
2.2.2Lasso回归(L1正则化)
2.2.3弹性网络回归
2.3稳健回归
2.3.1Huber回归
2.3.2RANSAC
2.4Logistic回归
2.4.1Logistic回归为什么是线性的
2.4.2Logistic回归预测(原始模型输出)与概率(Sigmoid输出)
2.4.3Python Logistic回归
2.4.4模型性能评估
2.4.5正则化
2.5线性支持向量机
2.6逾越线性:核模型
2.6.1核技巧
2.6.2实际分类例子:人脸识别
第3章逾越线性:机器学习集成方法
3.1引言
3.2集成方法
3.2.1自举聚合
3.2.2包外估计(Out-Of-Bag Estimation)
3.3随机森林
3.3.1随机森林分类
3.3.2随机森林回归
3.4提升(Boosting)方法
3.4.1AdaBoost算法
3.4.2梯度提升(Gradient Boosting)算法
3.4.3极端梯度提升(XGBoost)算法
3.4.4CatBoost算法
第4章现代机器学习技术
4.1自然语言处理初步
4.1.1文本数据预处理
4.1.2文本的数值表示:词袋模型
4.1.3实际例子:使用IMDB电影评论数据集进行情感分析
4.1.4单词频率—逆文本频率
4.1.5n-Grams模型
4.1.6词嵌入
4.2深度学习初步
4.2.1用神经网络处理复杂数据
4.2.2多分类
附录
附录APython速成教程
A.1Python构建块
A.1.1变量
A.1.2方法与函数
A.2Python数据结构
A.2.1列表与元组
A.2.2集合
A.2.3字典
A.3Python循环
A.3.1for循环
A.3.2while循环
A.4Python高级数据结构
A.4.1列表推导式
A.4.2Lambda函数
A.5函数概念进阶
A.5.1通配符在函数参数中的使用
A.5.2函数中的局部作用域与全局作用域
A.6面向对象编程简介
A.6.1对象、类和属性
A.6.2子类和继承
附录B词袋模型的数学原理
参考文献
- 机械工业出版社旗舰店 (微信公众号认证)
- 扫描二维码,访问我们的微信店铺
- 随时随地的购物、客服咨询、查询订单和物流...