当前位置:首页  媒体聚焦

人工智能:延长厄尔尼诺预测时效的钥匙

2020-02-21来源:中国气象报作者:刘钊作者(文):作者(图): 发布: 责编:林雯访问量:484

 

  本期嘉宾:南京信息工程大学气候与应用前沿研究院院长、国家特聘教授 罗京佳


  本期观点:数十年来,人类预测厄尔尼诺/南方涛动(ENSO)时效很难达到1年以上。利用卷积神经网络,了解海洋温度与未来厄尔尼诺事件的对应关系,将气候模式与人工智能方法结合起来,用人工智能深度学习的方法,利用卷积神经网络模型,为ENSO 预测领域打开了一扇新的大门,预测时效可延长到1年半。这证明了深度学习等方法在地球科学大数据应用上的可行性。


  在无数气候现象中,论公众知名度和影响力,很少有能出厄尔尼诺/南方涛动(ENSO)之右者。ENSO 是全球气候年际变化的最主要信号,影响广泛、持续时间长,与各种区域性极端气候事件和生态系统息息相关,几乎使整个世界的气候形势为之变化,也对我国气候有着巨大的影响。

  如能提前预测厄尔尼诺/南方涛动,其价值不言而喻。数十年来,专家学者们在预测ENSO 方面付出了巨大努力,但提前一年以上进行预测仍是一个很大的挑战。韩国全南国立大学Yoo-Geun Ham团队和南京信息工程大学罗京佳教授,利用人工智能机器深度学习构建了卷积神经网络模型改进ENSO预测,将预测时效提前到一年半,并达到80%左右的预测准确率。

  厄尔尼诺预测仍有改进空间

  每当ENSO“来袭”,中美洲、非洲南部、太平洋岛屿国家往往就会“陷入”干旱,引发粮食和健康危机,另一些地区则饱受因过量降雨带来的洪水威胁,以及随洪水而来的传染病困扰。如能实现对ENSO 更长时效的预测,人们就能更早着手准备,进而采取相应对策。但长期以来,人们对ENSO的预测时效很难超出一年。

  ENSO 中存在振荡元素,与缓慢的海洋变化及其与大气的耦合有关,这表明对ENSO 进行多年预测是有可能性的。有趣的是,在几次拉尼娜事件中,赤道太平洋冷海温异常持续了数年。高频赤道风的可预测性较差,但赤道风的缓慢变化的成分与海面表层温度(SST)可以一定程度地预测。赤道太平洋以外的海表温度异常也会触发ENSO事件,其时滞可以超过一年。这些研究表明,当前的方法可能存在不适用于ENSO预测的地方,ENSO预测仍有改进的空间。 

  随着大数据时代的到来,人们通过深度学习发现大型数据集内的线性和非线性等复杂关系,对许多领域产生了巨大影响。研究团队认为,机器深度学习方法得出的统计预测模型,可能是突破这一瓶颈的有效手段。

  卷积神经网络为预测助力

  研究团队选取了名为卷积神经网络(CNN)的深度学习方法,用于ENSO 预测试验。

  通俗地说,这是一种擅长识别图像的算法。例如,经过训练,神经网络可以通过识别猫共有的特征(如胡须和四条腿)来识别照片中的猫。它的识别方法和人眼有所不同,具体说来,当我们给计算机一张需要识别的猫的照片,计算机便将这张待识别的图片划分成若干小格,与其内部存储的猫的“标准照”一个局部一个局部地仔细比对,如果二者一致,则判定未知图案确实是一只猫。由于识别基于若干个局部的集合,即便未知图案可能有一些平移或稍稍变形,计算机依然能辨别出它是一只猫。而未知图案的局部和标准图案的局部逐一比对时的计算过程,便称为卷积操作。

  这种擅长识别图像的方法,同样可以用在气候预测上。

  虽然气象观测得出的是一组组数字,但根据这些观测数据,人们能够绘制海平面温度和深海温度的图片,而海温的异常变化正是引起厄尔尼诺现象的一个本质成因。研究者希望利用卷积神经网络,了解海洋温度与未来厄尔尼诺事件的对应关系。

  气候模式结合人工智能训练

  大量训练是深度学习的必然要求,卷积神经网络也需要大量图像用于训练,才能提高预测的准确率。尽管气象数据规模庞大,但卷积神经网络用在ENSO 预测上却遇到了数据短缺的困难。

  全球海洋温度分布的观测资料可追溯至1871年。虽然这个时间看上去很早,但具体算下来,到现在也不足150年。如果把每年的相同月份拿出来对比,这意味着每个月的样本数量都少于150个。对于深度学习的样本数量而言,这是明显不足的。

研究者为了解决历史厄尔尼诺事件数据短缺的问题,将气候模式与人工智能方法结合起来。利用CMIP5几十个全球气候模式,研究者根据历史海洋数据生成了一系列模拟数据。因此,科学家们不仅有一组实际历史观测数据,还得到了用于训练的数千个模拟结果。

  研究结果显示,预测时效超过6个月时,新方法对Nino3.4指数的预测能力显著高于目前国际上最优秀的动力预测系统。在对1984年至2017年的真实数据进行测试时,这一方法能够提前18个月预测厄尔尼诺事件。当然,这种预测方法还远远没有达到完美的程度,它对未来1.5年厄尔尼诺事件预测的准确率仅为80%左右。但这仍然比目前最好的数值模型要好,因为后者在1.5年时效上的准确率不到75%。

  卷积神经网络还能预测海表温度异常的不同空间分布,对不同厄尔尼诺类型 (东太平洋型、中太平洋型、混合型) 预测也有较高的准确率,弥补了目前动力预测系统的不足。与此同时,它还充分证明了机器深度学习等方法在地球科学大数据上应用的可行性,为地球科学研究提供了新的思路与方法。

http://epaper.zgqxb.com.cn/epaper/index/item_read?id=203538 20200203 3版


返回原图
/