新华文轩书店店铺主页二维码
新华文轩书店 微信认证
新华文轩书店线上店 100%正版保证
微信扫描二维码,访问我们的微信店铺
你可以使用微信联系我们,随时随地的购物、客服咨询、查询订单和物流...

数据采集与预处理

28.30
运费: ¥ 0.00-15.00
库存: 4 件
数据采集与预处理 商品图0
数据采集与预处理 商品缩略图0

商品详情

数据采集与预处理

作  者:米洪,张鸰 编
定  价:39.8
出 版 社:人民邮电出版社
出版日期:2019年11月01日
页  数:176
装  帧:平装
ISBN:9787115519153

目录

项目1
数据采集与预处理准备1
学习目标1
项目描述1
任务1认识数据采集技术,熟悉数据采集平台1
任务描述1
任务目标2
知识准备2
任务实施10
任务2认识数据预处理技术13
任务描述13
任务目标13
知识准备13
任务实施19
项目2
网络爬虫实践24
学习目标24
项目描述24
任务1使用urllib爬取北京公交线路信息24
任务描述24
任务目标25
知识准备25
任务实施48
任务2使用Selenium爬取淘宝网站信息58
任务描述58
任务目标58
知识准备58
任务实施69
任务3使用Scrapy爬取北京公交信息75
任务描述75
任务目标75
知识准备75
任务实施78
任务4创新与拓展86
任务描述86
任务目标86
项目3
日志数据采集实践87
学习目标87
项目描述87
任务1Flume的安装和配置87
任务描述87
任务目标88
知识准备88
任务实施95
任务2Flume采集数据上传到集群105
任务描述105
任务目标106
知识准备106
任务实施110
任务3创新与拓展118
任务描述118
任务目标118
项目4
数据预处理实践119
学习目标119
项目描述119
任务1用Pig进行数据预处理119
任务描述119
任务目标120
知识准备120
任务实施134
任务2用Kettle进行数据预处理137
任务描述137
任务目标137
知识准备137
任务实施139
任务3用Pandas进行数据预处理150
任务描述150
任务目标150
知识准备150
任务实施153
任务4用OpenRefine进行数据预处理155
任务描述155
任务目标155
知识准备155
任务实施157
任务5用Flume Interceptor对日志信息进行数据预处理162
任务描述162
任务目标163
知识准备163
任务实施167
任务6创新与拓展176
任务描述176
任务目标176

内容介绍

本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践,全面地讲述了Scrapy、Flume、Pig、Kettle、Pandas、OpenRefine等技术,以及urllib、Selenium基本库和BeautifulSoup解析库的相关知识与应用案例。
本书内容实用,可操作性强,语言精练、通俗易懂,可作为高等院校计算机应用技术、大数据技术与应用、软件技术、云计算技术与应用等计算机相关专业的教材,也可作为大数据分析、云计算应用领域技术人员的参考用书。

米洪,张鸰 编

新华文轩书店店铺主页二维码
新华文轩书店 微信公众号认证
新华文轩书店线上店 100%正版保证
扫描二维码,访问我们的微信店铺
随时随地的购物、客服咨询、查询订单和物流...

数据采集与预处理

手机启动微信
扫一扫购买

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏

微信支付

支付宝

扫一扫购买

打开微信,扫一扫

或搜索微信号:kidswinshare
文轩儿童书店官方微信公众号

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏