电子工业出版社有限公司店铺主页二维码
电子工业出版社有限公司
电子工业出版社有限公司有赞官方供货商,为客户提供一流的知识产品及服务。
微信扫描二维码,访问我们的微信店铺

数据准备和特征工程——数据工程师必知必会技能

33.75
运费: 免运费
数据准备和特征工程——数据工程师必知必会技能 商品图0
数据准备和特征工程——数据工程师必知必会技能 商品图1
数据准备和特征工程——数据工程师必知必会技能 商品图2
数据准备和特征工程——数据工程师必知必会技能 商品缩略图0 数据准备和特征工程——数据工程师必知必会技能 商品缩略图1 数据准备和特征工程——数据工程师必知必会技能 商品缩略图2

商品详情

书名:数据准备和特征工程——数据工程师必知必会技能
定价:45.0
ISBN:9787121382635
作者:齐伟
版次:2020
出版时间:2020-02

内容提要:

内容简介:

本书详细地介绍了大数据、人工智能等项目中不可或缺的环节和内容:数据准备和特征工程。书中的每节首先以简明方式介绍了基本知识;然后通过实际案例演示了基本知识的实际应用,并提供了针对性练习项目,将“知识、案例、练习”融为一体;*后以“扩展探究”方式引导读者进入更深广的领域。

本书既适合作为大学相关专业的教材,也适合作为大数据、人工智能等领域的开发人员的参考读物。

编辑推荐:

数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。

强调工程实践。书中通过大量案例,向读者演示了各种方法的具体实现方式。

基础与前沿结合。虽然本书在“基础知识”中介绍了相关的基本实现方法,但因为现实项目的复杂性,在具体项目中还会用到各种工具及*新的研发成果,为此专设了“扩展探究”供读者了解更精彩的内容。

以案例为载体,传授思想方法。数据科学项目需要严谨、科学的思想方法,这些方法并非通过简单说教就能让读者掌握,本书以“项目案例”为载体,不仅讲述操作技法,而且还让读者体验其中的思想方法,并且在“动手练习”中提供了练习项目,供读者检验和巩固所学内容。

批注版式,让阅读更容易。

配套在线实验平台。在实验平台中,读者可以运行本书的所有源码,应用书中所要求的数据集。

配套视频课程。

实时交互。

本书旨在:

?梳理常用的数据准备和特征工程操作技术

?将常见的特征工程问题进行归类,给出相应的解决方案

?为读者提供大量的动手练习项目

本书特色:

?强调工程实践,这也是本书作者所有书籍的共同特点。书中通过大量案例,向读者演示了各种方法的具体实现方式。

  

?基础与前沿结合。虽然本书在“基础知识”中介绍了相关的基本实现方法,但因为现实项目的复杂性,在具体项目中还会用到各种工具及*新的研发成果,为此专设了“扩展探究”供读者了解更精彩的内容。

  

?以案例为载体,传授思想方法。数据科学项目需要严谨、科学的思想方法,这些方法并非通过简单说教就能让读者掌握,本书以“项目案例”为载体,不仅讲述操作技法,而且还让读者体验其中的思想方法,并且在“动手练习”中提供了练习项目,供读者检验和巩固所学内容。

  


本书配套资源:1、在线实验和源码

              2、在线视频课程

              3、其他与本书相关技术

              4、读者交流群

更多信息可关注公众号:老齐教室




作者简介:

齐伟,自称老齐,现居苏州,所著在线教程《零基础学Python》及《零基础学Python(第2版)》在业内引起非常大的反响。愿意和来自各方的朋友讨论技术问题,并能提供相关技术服务。



目录:

目?录

第1章?感知数据........................................................... 001

1.0?了解数据科学项目................................................. 001

1.1?文件中的数据..................................................... 003

1.1.1?CSV文件................................................... 003

1.1.2?Excel文件................................................. 009

1.1.3?图像文件.................................................. 015

1.2?数据库中的数据................................................... 019

1.3?网页上的数据..................................................... 029

1.4?来自API的数据.................................................... 039

第2章?数据清理........................................................... 044

2.0?基本概念......................................................... 045

2.1?转化数据类型..................................................... 046

2.2?处理重复数据..................................................... 054

2.3?处理缺失数据..................................................... 057

2.3.1?检查缺失数据.............................................. 058

2.3.2?用指定值填补.............................................. 063

2.3.3?根据规律填补.............................................. 069

2.4?处理离群数据..................................................... 076

第3章?特征变换........................................................... 083

3.0?特征的类型....................................................... 084

3.1?特征数值化....................................................... 085

3.2?特征二值化....................................................... 088

3.3?OneHot编码....................................................... 093

3.4?数据变换......................................................... 098

3.5?特征离散化....................................................... 104

3.5.1?无监督离散化.............................................. 104

3.5.2?有监督离散化.............................................. 110

3.6?数据规范化....................................................... 113

第4章?特征选择........................................................... 124

4.0?特征选择简述..................................................... 124

4.1?封装器法......................................................... 127

4.1.1?循序特征选择.............................................. 127

4.1.2?穷举特征选择.............................................. 135

4.1.3?递归特征消除....................................... 140

4.2?过滤器法................................................. 144

4.3?嵌入法................................................... 149

第5章?特征抽取................................................... 154

5.1?无监督特征抽取.......................................... 154

5.1.1?主成分分析......................................... 154

5.1.2?因子分析........................................... 161

5.2?有监督特征抽取........................................... 167

附录A?Jupyter简介................................................ 173

附录B?NumPy简介.................................................. 176

附录C?Pandas简介................................................. 185

附录D?Matplotlib简介............................................. 194

后记    199

 



电子工业出版社有限公司店铺主页二维码
电子工业出版社有限公司
电子工业出版社有限公司有赞官方供货商,为客户提供一流的知识产品及服务。
扫描二维码,访问我们的微信店铺

数据准备和特征工程——数据工程师必知必会技能

手机启动微信
扫一扫购买

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏

微信支付

支付宝

扫一扫购买

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏