1.背景
太阳辐射和热辐射是大气和海洋运动的最根本的驱动力。大气辐射传输过程实际上已经可以通过一种叫做LBLRTM的辐射模型精确计算,但是LBLRTM模型同时也最为耗时。因此,有各种各样的辐射传输参数化方案用来近似计算辐射传输过程,并应用在数值天气预报中。参数化方案的概念源于数值天气预报模式。大气中一些至关重要的物理过程的规模都要小于当前数值预报模式的网格分辨率,比如小尺度流体运动(小涡,旋涡,涡旋),下图展示了次网格尺度下的水汽凝结最终生成云的过程。一些物理过程非常复杂包括湍流过程、散射等。网格尺度的运动和次网格尺度的运动必然存在一定程度的相互作用,可以通过引入一些参数,来近似建立网格尺度的物理量与次网格尺度的物理量之间的关系,而确定这些参数的方案,被称为参数化方案。
次网格中云的生成(gif动图)
此外辐射参数化方案尽管经过了简化,但是仍然是数值预报模式中最为耗时的,因此辐射传输参数化方案通常在比模式网格分辨率更低的网格中采用更低的频次调用。例如,在欧洲中尺度天气预报ECMWF的确定性预报中,辐射传输方案的调用空间分辨率比原网格粗糙10.24倍,时间调用频次为其他参数化方案和动力框架的1/8。
已经有许多科研工作者尝试一些方案用于替换原辐射参数化方案,包括采用神经网络的方式。早在1998年,欧洲中尺度数值预报中心的Chevallier等人利用单隐藏层的浅层神经网络去计算从一个有31层垂直层的数值模式中大气层顶到地面的长波辐射,也被称为NeuroFlux。NeuroFlux的精度达到了和原ECMWF中辐射传输方案相近的精度,并且要快22倍。但是当模式的垂直分层达到了60层及以上的时候,NeuroFlux就难以同时保持精度和加速的效果。2020年,韩国研究人员Roh, Soonyoung和Song, Hwan Jin通过实验证明:基于神经网络的辐射方案运算速度更快,高频次的调用基于神经网络的辐射方案与低频次调用原先基于物理的辐射方案,在耗时接近的情况下,获得的预报精度更高。
此外,基于深度学习模型的参数化方案除了追求精度以外,也应该通过将物理定律融入到模型中以获得更让人信服的结果。在大气辐射传输问题中,辐射通量和辐射加热率之间存在中一定的关系,如下面公式所表达的。早期的一些研究训练出来的模型直接输出辐射加热率廓线以及地面和大气层顶的辐射通量,没有考虑到能量守恒问题。近来,有部分研究人员通过让模型只预测出辐射通量,然后根据下面公式计算辐射加热率,保证物理上的一致性。但是,Ukkonen等人发现辐射加热率对于辐射通量的误差,特别是相邻垂直层的辐射通量差值非常敏感,很小的辐射通量误差即会造成辐射加热率的相对较大的误差。因此,有必要同时对辐射通量和辐射加热率同时监督,并满足物理规律。
公式中,HRl为辐射加热率(单位为K/day),g为重力常数,cp为定压热容量, Flup、Fldown和pllev分别为模式第l个level上的向上辐射通量、向下辐射通量,和气压。
我们在训练深度学习模型模拟辐射传输计算之前,通过跨尺度大气预报模式MPAS-A模型以及使用非常普遍的RRTMG辐射传输方案生成大量的训练和验证数据集。同时,我们提出了一种包含前面提到的物理约束的训练框架。基于该框架,我们采用和对比了不同类型的深度学习模型网络结构,并分析了每种网络结构在辐射传输问题上的优缺点。
2.数据
2.1.数据生成
数据集生成采用跨尺度大气预报模式MPAS-A模型(7.1版本),美国国家环境预报中心(NCEP)的全球预报系统(GFS)数据作为初始场。本次MPAS-A模型的设置采用了约60公里的准均匀网格,总共包含了163842个网格点。垂直分层方面采用混合的地形跟随坐标系,共57个垂直层(level),大气层顶在30公里高空。并且,垂直分层的间隔从近地面到大气层顶显著增加。
物理参数化方案上采用了称为"mesoscale reference"的套装。MPAS-A模型运行12次,每次为在2020年的1个月份随机选择一天运行连续3天,3天中的前两天数据作为训练数据,后一天作为测试数据。模型每隔1小时(模拟时间,并非真实时间)输出1次。随机选择的初始时间如下:20200108,20200213,20200302,20200420,20200528,20200615, 20200719,20200811,20200927,20201012, 20201124,20201204。
2.2.模型的输入和输出
下面表格列举了所有的输入和输出变量,包含29个输入变量,6个输出变量。输入变量中,11个变量为地面变量,其他的为3维变量(模式layer或level)。因此,有必要对不同类型的变量进行预处理,通过将地面变量重复拷贝以及将模式layer的变量的地面layer变量拷贝一份的方式,将所有变量的维度都统一成与模式level层变量相同。基于训练数据集,采用z-score的归一化方式,并且对于任一一种原三维变量,均采用该变量的所有模式layer或level的数值计算平均值和标准差。
Type |
Variable name |
Definition |
Location |
Unit |
Input |
aldif |
Surface albedo (near-infrared spectral regions) for diffuse radiation |
Surface文章来源地址https://www.toymoban.com/news/detail-554578.html |
1 |
aldir |
Surface albedo (near-infrared spectral regions) for direct radiation |
Surface |
1 |
|
asdif |
Surface albedo (UV/visible spectral regions) for diffuse radiation |
Surface |
1 |
|
asdir |
Surface albedo (UV/visible spectral regions) for direct radiation |
Surface |
1 |
|
cosz |
Cosine solar zenith angle for current time step |
Surface |
1 |
|
landfrac |
Land mask (1 for land, 0 for water) |
Surface |
1 |
|
sicefrac |
Sea ice fraction |
Surface |
1 |
|
snow |
Snow water depth |
Surface |
kg/m2 |
|
solc |
Solar constant文章来源:https://www.toymoban.com/news/detail-554578.html |
Surface |
到了这里,关于AI Earth 深度学习模型替换数值天气预报模型中的参数化方案-大气辐射传输方案的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!