
本书作者主要从事经济统计、金融统计、大数据和机器学习等方面的研究工作,且参与完成了多个国家级和省部级基金项目。2019年_2022年,作为第二完成人参与国家社科基金项目“多源数据融合下企业纳税行为甄别智能学习方法研究”,对数据采集、数据清洗、数据质量控制和数据融合等相关工作,以及机器学习算法有较为深入的研究;2020_2022年参与国家社科基金项目“我国固定资本服务核算的理论、方法及其实证研究”;2021年,作为第二完成人参与了山东省社会科学规划研究课题“山东省地区税收征管效率实证研究”。同时还发表了5余篇相关领域的CSSCI、SCI等核心期刊学术论文。本书研究对象为企业纳税行为甄别,采用大数据和机器学习等前沿方法解决税务领域关键问题,是作者研究积累的自然延伸和系统化应用。 ???????????????

随着数字经济时代的到来,丰富的数据资源有利于全面精准地刻画企业纳税情况, 但数据来源广、类别不平衡以及噪音多等问题,也给企业纳税行为的甄别工作带来挑战。本书融合多来源涉税数据,基于K_S检验和随机森林等算法,构建了企业纳税行为甄别指标体系;将不同行业、涉及不同税种的企业纳税行为甄别工作视为不同任务,提出基于多任务学习的分行业/分税种企业纳税行为甄别模型,与传统Logistic、支持向量机和神经网络等单任务机器学习模型进行对比,研究发现多任务学习模型的企业纳税行为甄别能力、泛化能力和稳健性更强。本书为政府智慧税务治理工作提供了新的思路。