首页轮播

王一楠等-GRL: 机器学习揭示并订正ERA5在地球第三极的云底高度系统偏差

在ERA5中,云底高度(CBH)是由模式云量与凝结水含量经诊断算法生成的产品,并非直接同化的观测变量,其精度受云识别方案与模式垂直分层结构的双重制约。在青藏高原,这一结构性短板尤为突出,羊八井站 3 年地基激光雷达观测显示ERA5的CBH 平均偏差达 -1.8 km,低云出现频率被高估至 76.2%(实测约 31%)。而ERA5 是目前唯一可追溯至 1940 年的逐小时全球 CBH 数据源,对其在第三极的偏差结构开展系统辨识与订正,是青藏高原云–气候与水循环研究的重要基础工作。

中国科学院大气物理研究所中层大气和全球环境探测实验室-羊八井全大气层观测站研究团队,提出物理重构 + 机器学习融合的两步式 CBH 订正框架。第一步依据 ECMWF 官方协议重构 ERA5 137 层模式的几何高度场,并以云量和凝结水含量双约束识别云底,参数标定参考羊八井站 3 年的激光雷达观测数据,初步构建区域化的云底高数据集(ERA5_NEW);第二步以 CALIPSO 星载激光雷达 CBH 产品为参照样本,融合 ERA5_NEW 垂直廓线与地表属性,通过贝叶斯框架对 XGBoost 模型进行超参寻优。

研究表明,物理重构数据在羊八井站经地基激光雷达独立验证,CBH平均偏差绝对值由 1.8 km 收敛至 0.1 km,为整套框架的精度提供了可信基线。第二步机器学习融合进一步将测试集 RMSE 降至 1.87 km、R² 提升至 0.71、平均偏差降至 -0.02 km(图 1);原始 ERA5 相对 CALIPSO 在高原南部高达 -5.20 km 的偏差收敛至 -0.11 km(图 2),四季相关系数稳定在 0.72–0.86,证实了方法在不同季节与地形条件下的稳健性。特征重要性分析显示,温度通过控制抬升凝结高度与对流触发,是最重要的预测因子。

该研究面向第三极构建了地面激光雷达–星载激光雷达–再分析三源协同的 CBH 订正路径,为高原地形长时间序列 CBH 重建奠定方法基础,对改进区域气候模式中云–辐射反馈的表征以及评估青藏高原水循环演变具有重要参考价值。

该研究成果近期发表于《Geophysical Research Letters》上,论文共同第一作者为中国科学院大气物理研究所在读博士赵薇、王一楠高级工程师,吕达仁研究员为论文共同通讯作者。该研究得到中国科学院战略性先导科技专项(XDA0470301)和国家自然科学基金项目(42475068、W2521143)资助,并受到国家子午工程二期的支持。

图1.青藏高原及周边地区(20°–45°N, 70°–110°E)2012–2022 年平均 CBH 空间分布。(a) 原始 ERA5;(b) 物理订正后的 ERA5_NEW;(c) 机器学习融合产品;(d) CALIPSO 卫星观测。

图2. 高原主体(T)、北部(N)、东部(E)、南部(S)四个子区域 CBH 相对 CALIPSO 偏差的小提琴–箱线复合图。(a) 原始 ERA5;(b) ERA5_NEW;(c) 机器学习产品;红色虚线为零偏差线。

Zhao, W., Wang, Y. N.*, Pan, Y. B., Pan, L. J., Bi, Y. H., Wu, X., Y. F. Tian, Y. H. Qiu, T. Q. Wang, D. R. Lu*. (2026). Machine learning reveals hidden bias in ERA5 cloud heights over Earth's third pole. Geophysical Research Letters, 53, e2025GL121301. https://doi.org/10.1029/2025GL121301

附件下载: