
在数据驱动决策的时代,会计工作正经历从“手工录入”到“智能采集”的深刻变革。面对海量、分散、格式多样的财务数据,传统处理方式效率低下且易出错,已成为制约财务数字化转型的瓶颈。本书是一部系统讲解运用Python实现会计数据智能采集的实战书籍。作者以会计人员的视角,将编程技术与财务场景深度融合,构建了“原理—技术—实例”的完整知识体系。全书以构建智能会计大数据为引领,从零基础开始,循序渐进地讲解相关的网络知识、Python基础语法、网页智能解析、智能数据库存储等核心技术,并通过真实案例串联全书,手把手教您构建智能会计数据采集流程。

本书是一部系统讲解运用Python实现会计数据智能采集的实战书籍。作者以会计人员的视角,将编程技术与财务场景深度融合,构建了“原理—技术—实例”的完整知识体系。全书以构建智能会计大数据为引领,从零基础开始,循序渐进地讲解相关的网络知识、Python基础语法、网页智能解析、智能数据库存储等核心技术,并通过真实案例串联全书。全书共分为7章:第1章为与会计大数据爬取相关的Python基础,第2章为与会计大数据爬取相关的网络知识基础,第3章为会计大数据爬取与第三方库的使用,第4章为会计大数据的存储与数据库管理系统,第5章为会计大数据爬取的关键事项,第6章为爬取和构建会计信息披露大数据的实例解析,第7章为基于XBRL的会计大数据爬取实例解析。

曾建光 ?____________________________ ?重庆大学经济与工商管理学院会计系教授,博士生导师,重庆市学术技术带头人,《产业经济评论》执行副主编。2005年毕业于北京大学软件与微电子学院,获计算机软件工程硕士学位,2013年毕业于北京大学光华管理学院,获会计学博士学位,2016年香港理工大学会计与金融学院博士后出站。在攻读博士学位之前,从事了8年网络软件开发与嵌入式软件开发工作。目前主要致力于新兴信息技术与会计学的交叉学科研究。在《经济研究》《管理世界》《会计研究》《金融研究》《世界经济》《南开管理评论》、Clinical Psychology Review、 Neuroscience and Biobehavioral Reviews、Psychological Medicine、Translational Psychiatry等学术期刊上发表60余篇论文,持有13项专利,独立拥有2个App版权和著作权。王尧 ?____________________________ ?重庆大学经济与工商管理学院实验中心计算机技术工程师。毕业于重庆大学计算机学院,具备扎实的计算机知识背景与丰富的技术实践经验。

第1章 与会计大数据爬取相关的Python基础 ………………………… 11.1 Python简介、安装及入门 ……………………………………………… 11.2 ?Python中的注释 …………………………………………………… 151.3 Python中的代码块…………………………………………………… 161.4 ?Python中的错误报告 ………………………………………………… 171.5 ?Python中的变量 …………………………………………………… 181.6 ?Python中的基本数据类型 ……………………………………………191.7 ?程序的逻辑控制 …………………………………………………… 331.8 ?程序的循环控制 …………………………………………………… 371.9 ?Python中的函数 …………………………………………………… 451.10 ?Python异常捕获 …………………………………………………… 481.11 ?Python模块与第三方库安装使用 …………………………………… 511.12 ?Python与面向对象编程 …………………………………………… 56第2章 与会计大数据爬取相关的网络知识基础 ……………………… 662.1 ?HTTP介绍 ………………………………………………………… 662.2 ?HTML介绍 ………………………………………………………… 712.3 ?URL介绍 …………………………………………………………… 752.4 ?浏览器开发者工具 ………………………………………………… 762.5 ?网络爬取总结 ……………………………………………………… 81第3章 会计大数据爬取与第三方库的使用 …………………………… 833.1 ?requests的使用 ……………………………………………………… 843.2 ?BeautifulSoup的使用 ………………………………………………… 883.3 ?selenium的使用 ……………………………………………………… 99第4章 会计大数据的存储与数据库管理系统 ………………………… 1094.1 ?会计大数据的存储文件 …………………………………………… 1094.2 ?将会计大数据存储为csv文件 ……………………………………… 1154.3 ?将会计大数据存储为Excel文件 …………………………………… 1204.4 ?会计大数据与数据库存储 ………………………………………… 1254.5 ?MySQL的安装与使用 ……………………………………………… 1354.6 ?数据库管理工具 …………………………………………………… 150第5章 会计大数据爬取的关键事项 …………………………………… 1575.1 文本编码 ………………………………………………………… 1575.2 绝对路径和相对路径 ……………………………………………… 1605.3 会计大数据的爬取与操作系统的兼容性 …………………………… 1645.4 爬取会计大数据的流程 …………………………………………… 1695.5 爬取会计大数据的超时问题………………………………………… 1705.6 养成良好的编程习惯 ……………………………………………… 173第6章 爬取和构建会计信息披露大数据的实例解析 …………………1756.1 巨潮资讯网大数据爬取任务分析 …………………………………… 1756.2 巨潮资讯网大数据的数据库设计 ……………………………………1826.3 巨潮资讯网大数据的数据库创建 …………………………………… 1836.4 巨潮资讯网大数据的爬取请求代码解析 ……………………………1846.5 巨潮资讯网大数据的目标源数据获取解析 ………………………… 1876.6 巨潮资讯网大数据的数据内容提取解析 …………………………… 1916.7 巨潮资讯网大数据的信息披露公告PDF文件爬取解析 ……………… 1936.8 巨潮资讯网大数据的爬取优化 ………………………………………1956.9 会计大数据爬取的思路 …………………………………………… 197第7章 基于XBRL的会计大数据爬取实例解析 ……………………… 1987.1 基于XBRL的会计大数据爬取的任务分析 …………………………1987.2 基于XBRL的会计大数据爬取的数据库设计………………………… 2067.3 基于XBRL的会计大数据爬取的公告列表的获取解析…………………… 2087.4 基于XBRL的会计大数据的请求报告页爬取解析 ……………………… 2117.5 基于XBRL的会计大数据的内容提取的方法解析 ……………………… 2127.6 基于XBRL的会计大数据的内容提取的代码实现 ……………………… 2197.7 基于XBRL的会计大数据存储解析 ……………………………………2217.8 基于XBRL的会计大数据爬取总结 ……………………………………224附录A 爬取巨潮资讯网,构建会计大数据的Python源代码……………… 226附录B 爬取基于XBRL的会计大数据的Python源代码 ………………… 231后记 …………………………………………………………………… 236【书摘与插画】跨界融合的创新之作。系统讲解如何运用Python技术实现会计数据智能采集,打破会计与编程的技术壁垒,让传统会计工作拥抱大数据时代的自动化与智能化。原理与实践并重。采用“原理讲解—技术实现—真实案例”三位一体的结构,既深入浅出地阐释数据获取的核心逻辑,又提供可落地的代码方案,更以完整实例串联全书知识点。场景驱动的实战导向。涵盖网页智能解析、智能抓取、数据库智能存储等真实智能会计工作场景,所有代码均经过实际项目验证,即学即用。低门槛高成长路径。专为会计人员设计的Python学习曲线:从零基础语法起步,逐步延伸至正则表达式、爬虫技术、自动化流程等进阶技能,助力读者完成从“传统会计”到“智能会计”的跃迁。数字化转型的必备工具。不仅教授技术本身,更注重培养数据思维与自动化意识,为财务分析、管理决策、风险预警等更高价值工作释放人力,是会计人员应对数字化转型的实战指南。