商品详情
在当今大数据时代,流数据统计建模作为一种核心技术,正在重塑数据分析与决策支持的范式。随着物联网、5G通信技术和云计算的快速发展,数据生成与传输的速度呈现指数级增长,传统离线分析方法已无法满足实时性需求。流数据统计建模技术应运而生,能够对持续产生的数据进行实时分析与建模,为各领域的智能化应用提供了重要的技术支撑。流数据是指连续生成并以实时顺序形式到达的数据集,如社交媒体数据、金融市场交易数据、传感器数据等。其特点是无限长、生成速率快、数据量大,需要实时处理和分析。本研究在吸收现有相关理论和研究成果基础上,立足于流数据统计建模的前沿,从流数据的复杂性和实时性特征出发,结合变量选择、稳健统计建模和分位数回归等方法,提出了一系列创新的在线更新模型和算法,为流数据环境下的实时分析和决策提供了理论和方法支持。(1)针对流数据变量选择问题,本研究提出了基于平方根Lasso的在线变量选择方法,通过动态更新损失函数和滚动交叉验证策略,解决了新数据到达时如何为线性模型动态选择变量的问题,并证明了在线估计量与全数据离线方法得到的Oracle估计量具有相同的收敛速度。(2)紧接着,考虑到大多数模型都面临着高维协变量的流数据建模挑战,本研究提出了更一般的广义线性模型的在线更新变量选择框架,结合可更新的优化目标函数和增量更新算法,实现了参数估计和变量选择的一致性,同时通过在线BIC准则动态选择惩罚参数,确保了方法的适用性和高效性。(3)在分位数回归领域,本研究提出了平滑分位数回归(SQR)的在线更新方法,通过显式解和动态带宽选择机制,简化了计算过程并提高了推断精度,同时开发了在线筛选方法,用于实时检测和处理异常数据批次,增强了模型的稳健性和可靠性。(4)为进一步提升流数据统计建模的稳健性和效率,本研究提出了复合分位数回归(CQR)的在线更新方法,通过结合多个分位数的信息,降低了估计的方差并提供了对响应变量条件分布更全面的理解,同时证明了在线估计器与Oracle估计器具有相同的渐近分布,且不受批次数量限制。本研究通过系统性研究,为流数据统计建模的理论和实践提供了重要参考,推动了实时数据分析与决策支持技术的发展,为应对复杂多变的流数据环境提供了有力的方法论支持。盖玉洁教授有较强的研究实力,现为中央财经大学统计与数学学院数理统计系主任,博士生导师。在国内外重要学术期刊发表了海量数据的统计推断和统计建模、高维统计模型、复杂数据模型、测量误差数据、稳健统计、复杂网络统计分析和相关应用领域论文30多篇。另外,申请人主持过1项国家自然科学基金面上项目、1项国家自然科学基金青年基金项目、参与过多项国家自然科学基金面上项目和青年项目,收集了充足的研究资料,与国内外从事相关研究人员保持较密切的联系交流和合作研究。
- 新华一城书集 (微信公众号认证)
- 上海新华书店官方微信书店
- 扫描二维码,访问我们的微信店铺
- 随时随地的购物、客服咨询、查询订单和物流...