商品详情
定价:45.0
ISBN:9787121382635
作者:齐伟
版次:2020
出版时间:2020-02
内容提要:
内容简介:
本书详细地介绍了大数据、人工智能等项目中不可或缺的环节和内容:数据准备和特征工程。书中的每节首先以简明方式介绍了基本知识;然后通过实际案例演示了基本知识的实际应用,并提供了针对性练习项目,将“知识、案例、练习”融为一体;*后以“扩展探究”方式引导读者进入更深广的领域。
本书既适合作为大学相关专业的教材,也适合作为大数据、人工智能等领域的开发人员的参考读物。
编辑推荐:
数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。
强调工程实践。书中通过大量案例,向读者演示了各种方法的具体实现方式。
基础与前沿结合。虽然本书在“基础知识”中介绍了相关的基本实现方法,但因为现实项目的复杂性,在具体项目中还会用到各种工具及*新的研发成果,为此专设了“扩展探究”供读者了解更精彩的内容。
以案例为载体,传授思想方法。数据科学项目需要严谨、科学的思想方法,这些方法并非通过简单说教就能让读者掌握,本书以“项目案例”为载体,不仅讲述操作技法,而且还让读者体验其中的思想方法,并且在“动手练习”中提供了练习项目,供读者检验和巩固所学内容。
批注版式,让阅读更容易。
配套在线实验平台。在实验平台中,读者可以运行本书的所有源码,应用书中所要求的数据集。
配套视频课程。
实时交互。
本书旨在:
?梳理常用的数据准备和特征工程操作技术
?将常见的特征工程问题进行归类,给出相应的解决方案
?为读者提供大量的动手练习项目
本书特色:
?强调工程实践,这也是本书作者所有书籍的共同特点。书中通过大量案例,向读者演示了各种方法的具体实现方式。
?基础与前沿结合。虽然本书在“基础知识”中介绍了相关的基本实现方法,但因为现实项目的复杂性,在具体项目中还会用到各种工具及*新的研发成果,为此专设了“扩展探究”供读者了解更精彩的内容。
?以案例为载体,传授思想方法。数据科学项目需要严谨、科学的思想方法,这些方法并非通过简单说教就能让读者掌握,本书以“项目案例”为载体,不仅讲述操作技法,而且还让读者体验其中的思想方法,并且在“动手练习”中提供了练习项目,供读者检验和巩固所学内容。
本书配套资源:1、在线实验和源码
2、在线视频课程
3、其他与本书相关技术
4、读者交流群
更多信息可关注公众号:老齐教室
作者简介:
齐伟,自称老齐,现居苏州,所著在线教程《零基础学Python》及《零基础学Python(第2版)》在业内引起非常大的反响。愿意和来自各方的朋友讨论技术问题,并能提供相关技术服务。
目录:
目?录
第1章?感知数据........................................................... 001
1.0?了解数据科学项目................................................. 001
1.1?文件中的数据..................................................... 003
1.1.1?CSV文件................................................... 003
1.1.2?Excel文件................................................. 009
1.1.3?图像文件.................................................. 015
1.2?数据库中的数据................................................... 019
1.3?网页上的数据..................................................... 029
1.4?来自API的数据.................................................... 039
第2章?数据清理........................................................... 044
2.0?基本概念......................................................... 045
2.1?转化数据类型..................................................... 046
2.2?处理重复数据..................................................... 054
2.3?处理缺失数据..................................................... 057
2.3.1?检查缺失数据.............................................. 058
2.3.2?用指定值填补.............................................. 063
2.3.3?根据规律填补.............................................. 069
2.4?处理离群数据..................................................... 076
第3章?特征变换........................................................... 083
3.0?特征的类型....................................................... 084
3.1?特征数值化....................................................... 085
3.2?特征二值化....................................................... 088
3.3?OneHot编码....................................................... 093
3.4?数据变换......................................................... 098
3.5?特征离散化....................................................... 104
3.5.1?无监督离散化.............................................. 104
3.5.2?有监督离散化.............................................. 110
3.6?数据规范化....................................................... 113
第4章?特征选择........................................................... 124
4.0?特征选择简述..................................................... 124
4.1?封装器法......................................................... 127
4.1.1?循序特征选择.............................................. 127
4.1.2?穷举特征选择.............................................. 135
4.1.3?递归特征消除....................................... 140
4.2?过滤器法................................................. 144
4.3?嵌入法................................................... 149
第5章?特征抽取................................................... 154
5.1①?无监督特征抽取.......................................... 154
5.1.1?主成分分析......................................... 154
5.1.2?因子分析........................................... 161
5.2?有监督特征抽取........................................... 167
附录A?Jupyter简介................................................ 173
附录B?NumPy简介.................................................. 176
附录C?Pandas简介................................................. 185
附录D?Matplotlib简介............................................. 194
后记 199
- 电子工业出版社有限公司
- 电子工业出版社有限公司有赞官方供货商,为客户提供一流的知识产品及服务。
- 扫描二维码,访问我们的微信店铺