商品详情

随着信息技术的飞速发展,数据已成为推动社会进步与经济发展的关键要素,数据分析已成为驱动创新与决策的核心引擎。近年来,我国;十四五规划明确提出;加快数字化发展,建设数字中国的战略目标。《;十四五大数据产业发展规划》更将数据定位为关键生产要素,强调通过技术创新与产业融合释放数据价值。与此同时,《关于构建数据基础制度更好发挥数据要素作用的意见》(又称;数据二十条)等政策持续完善数据基础制度体系,推动数据要素市场化配置改革,为数据分析技术的应用开辟了广阔空间。在此背景下,掌握数据分析技能变得尤为重要。Python作为一种功能强大且广泛应用的编程语言,凭借其简洁易读的语法、丰富的库生态系统(如NumPy、Matplotlib、Pandas、SymPy、SciPy等)及开源社区支持,已成为数据分析领域的首选工具之一。因此,本书以Python为工具,以;理论为基、实践为用为宗旨,系统构建从基础到进阶、从工具到场景的数据分析知识体系,旨在帮助读者掌握数据驱动的思维方法,并将其转化为解决实际问题的能力。本书共7章,各章节安排如下:第1章从数据的本质出发,剖析数据分析的体系架构、核心技术,带领读者走进数据分析的世界,了解其重要性、特征、分析思维方式、层次划分以及基本流程,为后续学习奠定坚实的理论基础。第2章聚焦于Python这门编程语言,深入剖析其在数据分析中的优势、与其他工具的对比、数据分析常用库以及工作环境配置,让读者对Python在数据分析领域的地位和作用有清晰的认识,帮助读者快速入门。第3章深入探讨NumPy库的数组及矩阵处理功能。作为Python数据分析的基础工具,NumPy提供了强大的多维数组对象及各种操作方法。本章详细讲解数组的创建、属性、操作、运算等内容,包括数组的索引、切片、形状变换、广播机制等。通过丰富的实例,展示如何利用NumPy进行高效的数值计算和数据处理,为后续章节的学习打下坚实的基础。第4章聚焦Matplotlib库的数据可视化方法。数据可视化是数据分析的重要环节,能够将复杂的数据以图表形式直观地呈现出来。本章介绍Matplotlib的基本绘图函数、各种图表类型(如折线图、柱状图、散点图等),以及高级绘图技巧。通过实际案例,读者将学会如何根据数据的特点选择合适的图表类型,并进行个性化的图表定制,使数据的展示更加生动、直观。第5章详细讲解Pandas库的数据挖掘技巧。Pandas是Python中功能强大的数据分析工具,提供了丰富的数据结构和操作方法。本章涵盖Pandas的基本数据结构Series和DataFrame、数据的读取与存储、数据清洗与预处理、数据筛选与排序、分组与聚合等内容。通过实际案例,读者可以掌握如何运用Pandas进行数据的探索性分析和挖掘,从数据中提取有价值的信息。第6章介绍SymPy库的符号计算应用。在数据分析中,有时需要使用符号计算来处理数学公式和方程。SymPy作为一个符号计算库,能够进行符号推导、方程求解、微积分等操作。本章通过实例讲解SymPy的基本语法,包括符号的定义、表达式的操作、方程求解、微积分计算等,帮助读者在数据分析中更好地处理数学问题。第7章介绍SciPy库的科学计算应用。SciPy建立在NumPy之上,提供了许多用于科学计算的模块,如优化、积分、插值、信号处理等。本章选择性地介绍一些常用的模块和函数,结合实际案例,展示如何利用SciPy解决科学计算中的常见问题,进一步拓展Python在科学计算领域的应用范围。本书特色如下:? 从数据分析的基础理论到Python编程实践,从单库应用到多库协同,内容层层递进,形成阶梯式学习路径,能够引导读者系统学习和掌握Python数据分析的方法。? 注重理论与实践相结合,主要章节都配有示例代码和应用案例,帮助读者将所学知识应用到实际问题中。同时,书中还提供习题,便于读者学以致用。? 语言简洁明了,表达通俗易懂,避免了过于复杂的数学公式和理论推导,适合不同专业背景的读者阅读。同时,书中还对一些重要概念、函数和方法进行了详细解释和说明,便于读者理解和记忆。通过本书的学习,读者将掌握数据分析的核心概念、技术与工具,能够运用Python高效处理和分析数据,挖掘有价值的信息以支持决策和创新。同时,也能培养读者解决实际问题的能力,通过丰富的案例将理论知识应用于商业、科研等领域,积累实践经验。本书适合数据工程师、科学家、研究人员以及对数据分析感兴趣的读者阅读。无论是作为高校相关专业的教材,还是作为自学参考书,我们都希望能够通过本书帮助读者开启Python数据分析之旅,掌握这一领域的核心技能,助力读者在数据科学领域不断前行。本教材得到中国矿业大学;十四五规划教材基金资助,由中国矿业大学经济管理学院王华清、田章朋、仝鹏、杨雷编著。其中,仝鹏编写了第1章,杨雷编写了第2章,田章朋编写了第3、4章,王华清编写了第5章至第7章,全书由王华清负责统稿工作。感谢张明慧、邓旭等老师为本书的撰写提供的诸多帮助。需要强调的是,数据分析的本质在于;以数据重构问题,以算法逼近真相。数据分析的核心价值在于从混杂的数据噪声中提取有效信息,并通过现象揭示其背后隐含的系统性关联与演化逻辑。本书虽以工具教学为主线,但始终贯穿问题导向的思维训练。由于编者水平有限,书中难免出现疏漏之处,诚挚欢迎广大读者、学界同仁及业界专家批评指正。在数据驱动的数字经济时代,我们相信,每一位读者都能借助Python的力量,在数据分析领域充分发掘数据的价值,为社会的进步贡献自己的智慧和力量!编 者
●系统介绍数据分析核心概念、方法、常用工具●详解Python五个数据分析核心库: NumPy. Matplotlib. Pandas. SymPy、SciPy●配备丰富的教学资源(电子课件、教学视频、教学大纲、程序源代码、习题及参考箸案)
本书以Python为工具,以;理论为基、实践为用为宗旨,系统构建从基础到进阶、从工具到场景的数据分析知识体系,旨在帮助读者掌握数据驱动的思维方法,并将其转化为解决实际问题的能力。全书共7章,数据分析概述;数据分析的重要工具:Python;Python数组及矩阵处理:基于NumPy;Python数据可视化:基于Matplotlib;Python数据挖掘:基于Pandas;Python符号计算:基于SymPy;Python科学计算:基于SciPy。通过本书的学习,读者将掌握数据分析的核心概念、技术与工具,能够运用Python高效处理和分析数据,挖掘有价值的信息以支持决策和创新。同时,也能培养解决实际问题的能力,通过丰富的案例将理论知识应用于商业、科研等领域,积累实践经验。本书可作为高等院校人工智能类专业、大数据管理与应用专业及其他数据分析类专业的教材,也适合数据工程师、科学家、研究人员,以及对数据分析感兴趣的读者阅读。
1993年至今,主要承担了本科生的:市场调查研究、管理博弈论、数据结构与算法、大数据分析技术、机器学习、多元统计分析等课程教学,研究生的:博弈论与机制设计、产业组织理论、数据挖掘与商务智能等课程的教学。目录前言第1章 数据分析概述 ?11.1 数据的含义及特征 ?11.1.1 数据的基本含义 ?11.1.2 数据的基本类型 ?11.1.3 数据的基本特征 ?21.2 数据分析思维 ?31.3 数据分析的层次 ?41.4 数据分析的流程与方法 ?51.5 练习题 ?6第2章 数据分析的重要工具:Python ?72.1 Python数据分析概述 ?72.1.1 Python特点 ?72.1.2 Python与其他数据分析工具的对比 ?72.1.3 Python数据分析常用库 ?82.2 Python数据分析环境配置 ?92.2.1 Anaconda的安装 ?92.2.2 Anaconda的使用 ?132.3 Python语言基础 ?152.3.1 Python语言中标识符与变量赋值 ?152.3.2 Python 语言的语法规范 ?172.3.3 Python语言的数据结构 ?182.3.4 Python语言的分支结构 ?222.3.5 Python语言的循环结构 ?242.3.6 Python语言的函数 ?272.3.7 Python语言的类与实例 ?282.4 Jupyter Notebook应用基础 ?322.4.1 Jupyter Notebook的安装与运行 ?322.4.2 Jupyter Notebook的主界面及工作目录的设置 ?342.4.3 Jupyter Notebook主界面功能介绍 ?352.4.4 Jupyter Notebook编辑界面功能介绍 ?362.4.5 魔法命令的使用 ?372.5 练习题 ?38第3章 Python数组及矩阵处理:基于NumPy ?403.1 NumPy简介 ?403.2 建立数组 ?413.2.1 什么是数组 ?413.2.2 数据的类型 ?423.2.3 数组的创建 ?433.2.4 数组的属性 ?483.2.5 数组的复制 ?503.2.6 数组的存取 ?513.3 数组操作 ?573.3.1 数组的变形 ?573.3.2 数组的拼接 ?593.3.3 数组的分割 ?623.3.4 数组的索引 ?643.3.5 数组的切片 ?663.3.6 替换数组值 ?683.3.7 删除行或列 ?713.3.8 插入行或列 ?723.4 数组运算 ?743.4.1 数组的广播原理 ?743.4.2 数组的四则运算 ?773.4.3 数组的复合运算 ?793.4.4 数组的逻辑运算 ?813.4.5 数组的集合运算 ?893.4.6 数组的数值排序 ?933.5 通用函数 ?1003.5.1 初等函数 ?1003.5.2 随机函数 ?1053.5.3 统计函数 ?1113.5.4 修约函数 ?1213.6 线性代数运算 ?1233.6.1 数组行列变换 ?1233.6.2 数组的行列式 ?1243.6.3 矩阵的乘积 ?1283.6.4 矩阵的秩和逆矩阵 ?1313.6.5 特征值和特征向量 ?1333.6.6 解线性方程组 ?1343.6.7 特征值分解 ?1353.7 案例:电影推荐分析 ?1383.7.1 问题理解 ?1403.7.2 数据探索 ?1403.7.3 代码实现 ?1433.8 练习题 ?144第4章 Python数据可视化:基于Matplotlib ?1504.1 Matplotlib简介 ?1504.1.1 Matplotlib的导入 ?1504.1.2 画布与坐标轴设置 ?1504.1.3 颜色与线型的设置 ?1554.1.4 中文与负号显示设置 ?1574.2 基本绘图函数 ?1594.2.1 plot函数 ?1594.2.2 grid函数 ?1604.2.3 axhline函数 ?1624.2.4 axvspan函数 ?1644.2.5 annotate函数 ?1654.2.6 text函数 ?1674.2.7 title函数 ?1684.2.8 legend函数 ?1704.2.9 table函数 ?1724.3 绘制二维图 ?1744.3.1 绘制柱状图 ?1744.3.2 绘制散点图 ?1764.3.3 绘制直方图 ?1784.3.4 绘制饼图 ?1804.3.5 绘制棉棒图 ?1814.3.6 绘制箱线图 ?1834.3.7 绘制误差棒图 ?1864.3.8 绘制极坐标图 ?1884.3.9 绘制多子图 ?1904.4 绘制三维图 ?1954.4.1 绘制三维柱状图 ?1964.4.2 绘制三维散点图 ?1984.4.3 绘制三维折线图 ?2004.4.4 绘制三维曲面图 ?2024.4.5 绘制三维矢量图 ?2044.5 数据可视化进阶 ?2054.5.1 绘制动态图 ?2054.5.2 响应鼠标事件 ?2074.5.3 图像艺术处理 ?2094.6 案例:在线商品浏览量与销售量的可视化分析 ?2164.6.1 问题理解 ?2164.6.2 数据探索 ?2164.6.3 代码实现 ?2244.7 练习题 ?227第5章 Python数据挖掘:基于Pandas ?2305.1 Pandas简介 ?2305.2 Series基本操作 ?2315.2.1 Series的创建 ?2315.2.2 Series的索引操作 ?2325.2.3 Series的修改操作 ?2325.2.4 Series的删除操作 ?2335.3 DataFrame的基本操作 ?2345.3.1 创建DataFrame ?2355.3.2 DataFrame数据的检索 ?2365.3.3 修改DataFrame数据 ?2375.3.4 删除DataFrame数据 ?2385.3.5 DataFrame合并数据 ?2385.3.6 排序与排名 ?2425.3.7 重置行的索引或标签 ?2445.3.8 多层级索引 ?2455.3.9 算术运算与广播原理 ?2465.4 数据的读写 ?2475.4.1 CSV文件的读写 ?2475.4.2 Excel文件的读写 ?2495.4.3 其他文件的读写 ?2515.4.4 其他操作技巧 ?2535.5 数据预处理 ?2555.5.1 重复值的处理 ?2565.5.2 缺失值的处理 ?2585.5.3 数据标准化 ?2595.6 数据分析 ?2605.6.1 描述性统计 ?2605.6.2 分组分析 ?2615.6.3 归类统计 ?2625.6.4 交叉分析 ?2635.6.5 相关分析 ?2655.7 案例:电商平台订单数据分析 ?2665.8 练习题 ?276第6章 Python符号计算:基于SymPy ?2796.1 SymPy简介 ?2796.2 定义符号 ?2806.2.1 常规方式定义符号 ?2806.2.2 序列方式定义符号 ?2816.2.3 定义符号函数 ?2816.3 表达式 ?2826.3.1 表达式操作 ?2826.3.2 替换与求值 ?2846.4 微积分运算 ?2846.4.1 极限运算 ?2856.4.2 微分运算 ?2856.4.3 积分运算 ?2866.4.4 级数展开 ?2876.5 SymPy绘图 ?2886.5.1 二维绘图 ?2886.5.2 参数方程绘图 ?2906.5.3 隐式方程绘图 ?2916.5.4 三维绘图 ?2916.6 练习题 ?293第7章 Python科学计算:基于SciPy ?2967.1 概述 ?2967.2 优化问题 ?2977.2.1 优化问题的分类 ?2977.2.2 单变量优化 ?2987.2.3 无约束的多变量优化 ?3017.2.4 非线性最小二乘问题 ?3067.2.5 有约束的优化问题 ?3077.3 插值处理 ?3117.3.1 概述 ?3117.3.2 应用场景 ?3127.3.3 多项式函数和类 ?3137.3.4 多项式插值 ?3167.3.5 样条插值 ?3197.3.6 多变量插值 ?3217.4 练习题 ?326参考文献 ?331
- 新华一城书集 (微信公众号认证)
- 上海新华书店官方微信书店
- 扫描二维码,访问我们的微信店铺
- 随时随地的购物、客服咨询、查询订单和物流...