
张良康,浙江大学统计学博士,现就职于恒瑞医药,负责医药临床试验数据分析和统计工作,参与临床试验方案设计沟通和讨论,为临床试验方案中统计学相关内容提供技术支持,包括研究设计方法的选择、样本量计算、随机和盲法、统计方法的选择等。擅长使用Python、R语言、SAS、SPSS等多种技术进行数据挖掘、分析和统计工作。具有多年的数据统计分析经验,对商务数据、销售数据、科研数据、医学数据和金融数据的统计分析工作也颇有研究。 ???????????????

本书系统介绍如何借助豆包大模型开展统计分析与可视化工作,兼顾理论讲解与实战操作,内容翔实且具有较强实用性。全书共13章,涵盖从数据获取、预处理到各类统计分析、可视化呈现,再到实际应用系统搭建的完整流程。具体而言,书中先对豆包大模型进行概述,包括其在统计分析与可视化中的优势及使用入门方法;随后详细讲解利用豆包获取虚拟数据、编写爬虫脚本、保存数据的方法,以及数据清洗、转换与整合等预处理操作;接着阐述如何使用豆包绘制多种常见统计图,实现描述性统计分析、探索性数据分析、特征提取,还涉及推论统计、回归分析、方差分析、非参数检验、主成分分析、聚类分析、生存分析、因子分析等多种统计方法,同时介绍了机器学习与统计分析的结合,以及基于豆包实现黄金价格预测系统的搭建方法。本书搭配丰富的实操案例与代码示例,以“豆包大模型十统计分析与可视化”为核心主线构建知识体系,适合统计分析初学者、数据从业人员、相关专业学生等阅读,以助力读者快速掌握利用豆包大模型进行统计分析与可视化的技能,为开展数据分析工作提供有力支持。 ???????????????

第1章 ?豆包大模型介绍1.1 豆包大模型概述21.1.1 豆包大模型的概念与特点21.1.2 豆包大模型的发展历程31.2 豆包大模型在统计分析与可视化中的优势41.2.1 高效的数据处理能力41.2.2 强大的分析功能集成51.2.3 直观的可视化效果呈现61.3 豆包大模型的使用初体验81.3.1 注册账号81.3.2 安装软件91.3.3 开始使用111.4 豆包的“数据分析”技能12第2章 ?利用豆包获取数据2.1 利用豆包生成虚拟数据162.1.1 明确数据需求与格式162.1.2 生成数据的示例模板172.1.3 利用批量处理功能生成数据192.2 利用豆包编写爬虫脚本202.2.1 编写爬虫脚本202.2.2 抓取百度热搜信息212.2.3 抓取北京大学出版社网页的新闻信息242.3 利用豆包保存数据302.3.1 保存为CSV格式302.3.2 保存为Excel格式33第3章 ?利用豆包实现数据预处理3.1 使用豆包实现数据清洗393.1.1 缺失值处理393.1.2 异常值检测与处理463.1.3 数据清洗实操案例523.2 使用豆包实现数据转换与整合533.2.1 数据类型转换543.2.2 数据标准化与归一化58第4章 ?使用豆包绘制可视化统计图4.1 使用豆包绘制常用的图表654.1.1 柱状图、折线图和饼图654.1.2 散点图、箱线图和热力图754.2 足球运动员的可视化分析实战884.2.1 基本数据分析884.2.2 精简数据904.2.3 数据概览分析914.2.4 身价 球员的柱状图914.2.5 绘制球员年龄的散点分布图934.2.6 综合可视化图表94第5章 ?使用豆包实现描述性统计分析5.1 使用豆包实现集中趋势度量995.1.1 均值计算与分析995.1.2 中位数与分位数计算1065.1.3 众数识别1175.2 使用豆包实现离散程度度量1245.2.1 极差与四分位差计算1245.2.2 方差与标准差分析1325.2.3 变异系数应用1375.2.4 异常值检测方法141第6章 ?使用豆包实现探索性数据分析6.1 使用豆包实现数据分布探索1496.1.1 概率分布拟合与检验1496.1.2 数据分布可视化方法1556.2 使用豆包实现变量间关系探索1606.2.1 相关性分析方法1606.2.2 变量关系可视化展示165第7章 ?使用豆包提取特征7.1 使用豆包实现特征工程1737.1.1 数值型特征处理1737.1.2 类别型特征编码1817.1.3 时间特征构造1887.1.4 特征组合与派生1937.2 使用豆包实现特征降维2007.2.1 线性降维技术2007.2.2 非线性降维技术2057.2.3 特征选择式降维209第8章 ?使用豆包实现推论统计和回归分析8.1 使用豆包实现推论统计2168.1.1 抽样分布与参数估计2168.1.2 假设检验2228.2 使用豆包实现回归分析2288.2.1 线性回归分析2288.2.2 非线性回归分析233第9章 ?使用豆包实现方差分析和非参数检验9.1 使用豆包实现方差分析2409.1.1 单因素方差分析2409.1.2 多因素方差分析2449.2 使用豆包实现非参数统计分析2489.2.1 单样本非参数检验2499.2.2 两独立样本非参数检验2539.2.3 多独立样本非参数检验258 0章 ?使用豆包实现主成分分析和聚类分析10.1 使用豆包实现主成分分析27110.1.1 数据标准化与协方差矩阵计算27110.1.2 特征值分解与主成分提取28210.1.3 主成分得分计算与结果解释28910.2 使用豆包实现聚类分析29510.2.1 使用豆包实现K_Means聚类算法29510.2.2 使用豆包实现层次聚类分析300 1章 ?使用豆包实现生存分析和因子分析11.1 使用豆包实现生存分析30711.1.1 使用豆包实现Kaplan_Meier估计30711.1.2 使用豆包实现Cox比例风险模型31211.2 使用豆包实现因子分析31611.2.1 数据适用性检验31611.2.2 因子提取与旋转方法选择321 2章 ?机器学习与统计分析12.1 使用豆包实现线性判别分析32912.2 使用豆包实现机器学习中的统计 ?方法33312.2.1 使用豆包实现回归分析33312.2.2 使用豆包实现贝叶斯方法33712.2.3 使用豆包实现统计假设检验34112.2.4 使用豆包实现概率图模型345 3章基于豆包实现黄金价格预测系统13.1 系统介绍 35013.2 基于机器学习的黄金价格预测系统 ?????35113.2.1 需求分析35113.2.2 数据预处理 ?35413.2.3 创建机器学习模型36113.2.4 创建交易策略 ?37013.3 基于深度学习的金价预测模型37513.3.1 准备数据37813.3.2 使用MLP神经网络进行预测 38413.3.3 创建MLP模型 38913.3.4 MLP模型优化393