电子工业出版社精品店店铺主页二维码
电子工业出版社精品店
微信扫描二维码,访问我们的微信店铺

R统计与数据可视化:社会科学数据分析实践(全彩)

79.00
运费: 免运费
R统计与数据可视化:社会科学数据分析实践(全彩) 商品图0
R统计与数据可视化:社会科学数据分析实践(全彩) 商品图1
R统计与数据可视化:社会科学数据分析实践(全彩) 商品图2
R统计与数据可视化:社会科学数据分析实践(全彩) 商品缩略图0 R统计与数据可视化:社会科学数据分析实践(全彩) 商品缩略图1 R统计与数据可视化:社会科学数据分析实践(全彩) 商品缩略图2

商品详情

书名:R统计与数据可视化:社会科学数据分析实践(全彩)  
定价:169.0  
ISBN:9787121461910  
版次:1  

内容提要:  

编辑推荐

学习统计学及数据分析的艺术与实践的*好方式,就是进行数据分析。本书用大量案例辅以数据可视化,将统计学知识融汇其中,循循善诱,帮助读者避坑排雷,培养正确的数据分析思维方式。本书适合数据分析初学者,也适合有经验的数据分析人员。

内容提要

《R统计与数据可视化:社会科学数据分析实践(全彩)》讲解了数据分析的方法、逻辑、艺术与实践。全书共17章,*1章介绍了R、RStudio、R Markdown 的安装和使用;*2章介绍了数据分析的动机和四个构成要素:①描述数据并形成假设,②模型的构建与估计,③诊断,④提出下一个问题,后续章节将按照数据分析构成要素的顺序来组织;对数据了解得越多,我们就越能够提出更好的问题,形成更好的假设,描述与数据相关的概念和所需的工具,这些内容将在第3~9章中详述;模型的构建与估计是一个应该在理论和证据之间来回往复迭代的过程,关于构建模型的练习将在*10~14章中进行;诊断既能帮助我们发现问题,又能帮助我们发掘有意义的关联,形成额外的解释或假设,关于诊断将会在*15章和*16章中详述;*17章将讨论许多涉及二元因变量的问题;附录A将提供创建其他新假设的技巧和窍门。

《R统计与数据可视化:社会科学数据分析实践(全彩)》的基本理念是通过上手操作来学习。学习统计学以及数据分析的艺术与实践的*好方式,就是进行数据分析。本书用大量案例辅以数据可视化,将统计学知识融汇其中,循循善诱,帮助读者避坑排雷,培养正确的数据分析思维方式。本书适合数据分析初学者,也适合有经验的数据分析人员。






作者简介:  

David S. Brown(戴维·S.布朗):科罗拉多大学博尔德分校政治学教授和社会科学系主任。获得了加利福尼亚大学洛杉矶分校的政治学博士学位,并且是科罗拉多大学博尔德分校行为科学研究所肯尼斯·博尔丁(他开辟了多个经济学和社会科学研究领域)的首届博士后研究员。在加入科罗拉多大学政治学系之前,他曾在莱斯大学担任助理教授。他研究的是比较政治学,侧重于体制及其对经济发展的影响。他的研究成果已发表在《美国政治科学评论》(American Political Science Review)、《美国政治学期刊》(American Journal of Political Science)、《英国政治学期刊》(British Journal of Political Science)和《美国地理学家协会年鉴》(Annals of the Association of American Geographers)上。



目录:  

*1章 ? 入门指南 001

概述 001

R、RStudio 和R Markdown 002

对象与函数 004

RStudio 入门 006

RStudio 的R Markdown 导览 012

R Markdown 文件与R 脚本 017

小练习 019


*2章 ? 数据分析导论 027

概述 027

数据分析的动机 028

大数据越来越大 028

数据分析是一项有市场需求的技能 029

数据分析是一种公益 030

数据分析的构成要素 031

描述数据并形成假设 033

假设一:民族语言碎片化 034

假设二:女性选举权 040

假设三:人力资本 046

假设四:政治稳定 048

模型的构建与估计 052

诊断 054

结果的稳定性 054

残差图 056

提出下一个问题 059


第3章 ? 描述数据 064

概述 064

数据集和变量 066

不同类型的变量 068

连续变量 069

分类变量 069

有序分类变量 070

描述数据可以节省时间和精力 073

数据的形状 073

数据的极差 077

辨识困惑、问题、假设和线索 079

困惑和问题:重要的区别 079

描述数据以改进问题 081

描述数据披露了更多线索 084

度量 086

有效性 086

可靠性 088


第4章 ? 集中趋势和离散程度 093

概述 093

集中趋势的度量:众数、平均数和中位数 094

众数 095

平均数 096

中位数 100

平均数与中位数 103

离散程度的度量:极差、四分位距和标准差 106

极差 107

四分位距 109

标准差 110

四分位距与标准差 116

关于方差的说明 117


第5章 ? 数据的单变量和双变量描述 123

概述 123

好的、差的和离群值 124

单变量数据的5 种视图 125

频率表 126

条形图 127

箱线图(或盒须图) 128

直方图 131

茎叶图 135

变量间是否相关 138

散点图 139

箱线图(双变量) 145

马赛克图 145

交叉表 148

气泡图 148


第6章 ? 数据变换 157

概述 157

数据变换的理论原因 158

变换数据确保符合理论 158

数据和问题都要变换以相互匹配 159

数据变换的实际原因 160

数据变换——从连续变量到分类变量 164

数据变换——改变类别 169

Box-Cox 变换 175


第7章 ? 数据展示的一些原则 186

概述 186

一些风格要素 187

消除杂乱 188

聚焦 190

整合图文 192

一图应该胜千言 195

了解你的受众 201

了解你的目的:解释性、探索性或信息性 203

故事的基本要素 208

文档(树立讲述者的可信度) 209

建立直觉(设定背景) 211

展示因果关系(旅程) 211

从因果到行动(决议) 213


第8章 ? 概率论精要 218

概述 218

总体和样本 219

样本偏差与随机样本 220

大数定律 222

大数定律的可视化 223

中心极限定理 227

平均数的抽样分布随着n 的增加而接近正态分布 228

和的抽样分布是正态的 230

从正态分布中抽取时的观测数量 231

中心极限定理的一个有用性质 232

从不同的分布中抽样 233

标准正态分布 239

标准正态分布与临界z 分数 242


第9章 ? 置信区间与假设检验 250

概述 250

大样本的置信区间 251

求总体比例 251

求总体平均数 256

小样本与t- 分布 260

自由度 263

小样本的样本标准差 264

用小样本构建置信区间 269

例子:女性薪酬与男性薪酬 270

比较两个样本的平均数 272

例子:两个群体和两种收入 273

例子:种族和对警察的看法 275

例子:收入和对特朗普的支持 275

置信水平 277

关于统计推断和因果关系的简要说明 280


*10章 ? 进行比较 285

概述 285

为什么要进行比较 286

需要比较的问题 287

比较两个分类变量 289

例子:对警察的看法 289

例子:哪些人去教堂 292

比较连续变量和分类变量 294

例子:奥巴马情感量表 294

比较两个连续变量 297

例子:性别与教育 297

例子:性别与政策制定 298

探索性数据分析:调查美国的堕胎率 301

重述要点 303

好的分析引出新的问题 308


*11章 ? 受控比较 312

概述 312

什么是受控比较 313

比较两个分类变量,同时控制第三个变量 314

例子:对警察的看法 314

例子:对移民的看法 320

比较两个连续变量,同时控制第三个变量 327

例子:婴儿死亡率 328

例子:凶杀率 331

论点与受控比较 334


*12章 ? 线性回归 340

概述 340

线性回归的优点 341

线性回归中的斜率和截距 342

对斜率和截距的解读 343

例子:选民投票率和教育 343

拟合优度(R2 统计量) 348

统计显著性 352

计算t- 比率 353

二元回归的例子 355

一个州的宗教信仰水平是否会影响堕胎率 356

宗教信仰是否会影响枪支法案 358

暴力会导致政治不稳定吗 359

收入(人均 GDP)与投票率有关吗 361


*13章 ? 多元回归 368

概述 368

什么是多元回归 369

为什么要使用多元回归 370

回归模型和论点 371

回归模型、理论和证据 372

解读多元回归中的估计值 376

实质显著性 376

统计显著性 377

拟合优度:R2 378

例子:凶杀率与教育 379

理论 379

描述数据 380

估计 384

经验蕴涵 386

讨论 389


*14章 ? 虚拟变量和交互作用 394

概述 394

什么是虚拟变量 395

加性模型与交互作用模型 396

二元虚拟变量回归 397

多元回归与虚拟变量 398

多元回归中的交互作用 398

例子:伯尼· 桑德斯,教育和收入 400

例子:外援,人均GDP 和民主 405


*15章 ? 诊断1 :普通*小二乘法是否适用 412

概述 412

回归分析中的诊断 413

统计量与估计量的性质 414

高斯- 马尔可夫假设 419

残差图 425


*16章 ? 诊断2 :残差、杠杆值与影响力的度量 438

概述 438

离群值 439

杠杆值 442

影响力的度量 448

库克距离 448

dfbeta 449

增加变量图 454


*17章 ? 逻辑回归 461

概述 461

需要逻辑回归解决的议题与难题 462

逻辑回归违反了高斯- 马尔可夫假设 463

使用对数发生比 466

使用预测概率 469

二元逻辑回归 469

多元逻辑回归 471

例子:2012 年奥巴马赢得的选举人团 472

逻辑回归模型拟合 475

例子:奥巴马,收入和教育 475

接收者操作特征曲线和曲线下面积 476


附录A ? 形成经验蕴涵 488



电子工业出版社精品店店铺主页二维码
电子工业出版社精品店
扫描二维码,访问我们的微信店铺

R统计与数据可视化:社会科学数据分析实践(全彩)

手机启动微信
扫一扫购买

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏

微信支付

支付宝

扫一扫购买

收藏到微信 or 发给朋友

1. 打开微信,扫一扫左侧二维码

2. 点击右上角图标

点击右上角分享图标

3. 发送给朋友、分享到朋友圈、收藏

发送给朋友、分享到朋友圈、收藏