非连续暴露数据时间序列分析中分布滞后效应的三阶段估计方法
编号:936
访问权限:仅限参会人
更新:2026-04-09 10:44:36 浏览:6次
张贴报告
摘要
分布滞后模型是时间序列分析中估计环境暴露滞后健康效应的重要方法,但其应用受限于对完整连续暴露数据的要求,而仅纳入单一暴露的滞后特异性模型虽能利用更多数据,却存在遗漏变量偏倚。本研究构建并验证了一种三阶段方法,可通过校正遗漏变量偏倚,从非连续暴露数据中准确估计分布滞后效应:第一阶段利用非连续数据拟合单一滞后模型,得到有偏效应值;第二阶段基于暴露时间序列的自相关结构完成偏倚校正;第三阶段对校正后的估计值进行平滑处理。统计仿真验证了该方法的有效性,即便每周仅存在一条有效日记录,其仍能稳健且准确地还原真实的滞后效应与累积效应。本研究还将该方法应用于2013-2015年北京市PM2.5及其化学组分与全因死亡率的关联分析,结果显示,传统分布滞后模型因数据缺失导致样本量大幅受限,未检测到显著关联。而本研究提出的三阶段方法与传统分布滞后模型相比多利用了约90%的观测数据,识别出显著的健康效应,PM2.5浓度每升高10 μg/m3,0-13天滞后的累积全因死亡风险增加0.37%(95% CI:0.23%,0.50%),且PM2.5各化学组分也与全因死亡率存在显著关联。该三阶段方法是应对时间序列分析中非连续暴露数据问题的有效稳健统计工具,其通过校正遗漏变量偏倚最大化利用现有稀疏数据,显著提升统计检验效能,为面临同类数据限制的环境流行病学研究提供了实用可靠的解决方案。
关键词
分布滞后,非连续数据,遗漏变量偏倚,时间序列分析
发表评论