卷积神经网络预测模型：提前24个月...

卷积神经网络预测模型：提前24个月预测ENSO

来源：中国气象报　　　发布时间：2020-12-21

分享到：

　　抛开传统模式 ENSO预测另辟蹊径

　　厄尔尼诺-南方涛动（ENSO）是热带地区最重要年际气候信号之一，对大气环流和降水具有全球性的影响，准确的ENSO 季节-年际预测有助于预报相关气象灾害。目前，国际和国内的预报中心大多依赖数值模式的多初值集合预报、多模式集合预报等，这些是常用的提高ENSO预报技巧的集合方法。

　　但目前业务部门一般的ENSO 预测时效只有6~9个月，最长为1年左右，这样的预报时效无法满足现实需求。较长时间的ENSO预测也是国际上的难点，如何延长ENSO的预测时效，成为众多科学家迫切想要解决的问题。

　　罗京佳及其研究团队目前正在攻克这个难题。2016年3月，罗京佳被一个新闻热点所吸引——“人工智能击败世界围棋冠军”。“‘阿尔法狗’为什么厉害”，它的背后是专家利用神经网络算法，将围棋高手的比赛记录输入计算机，并让计算机自己与自己进行比赛，在这个过程中不断学习训练。既然‘阿尔法狗’能够击败世界围棋冠军，说明它具有很强的优越性，那么我们的ENSO预测能否也引入机器学习呢？”罗京佳表示，“‘阿尔法狗’用的深度神经网络与传统的神经网络不一样，它有很强大的自我学习能力。”

　　通过不断探索，研究团队选取相对成熟的卷积神经网络进行ENSO 预测。近年来，卷积神经网络在多个方向得到应用，在语音识别、人脸识别、通用物体识别等方面均有突破。在人工智能领域，它是比较成熟的方法，并且有很多的开源程序和网站，可以直接使用。

　　“卷积神经网络的优点是可以处理大量数据。其实，这既是优点，也是缺点。因为只有足够的数据量，卷积神经网络才可以训练出一个比较好的模型，否则会导致很多问题，训练出来模型的性能也不会好。”罗京佳解释。

　　卷积神经网络助力 ENSO预报时效延长

　　人工智能领域有一个普遍使用的方法——迁移学习，是针对小样本数据的一种训练方法。例如，练习骑摩托车，若摩托车不足但有很多的自行车，可以先练习骑自行车，在此基础上再去训练骑摩托车，这样就会取得很好的效果，迁移学习的原理亦如此。

　　研发团队利用国际CMIP5（第五次国际耦合模式比较计划）几十个模式的工业化以来100多年的模拟结果，建立预训练模型，即把卷积神经网络的很多参数通过CMIP5的模拟数据进行训练后，得到第一套初步参数的估值。

　　随后，团队利用这个预训练模型，再利用过去100多年的观测资料进一步训练。因为数值模式都是存在偏差的，所以还需要通过观测资料对模型参数进行调整改进。改进后，研究团队得到了最后的预测模型，进而对1983年至2017年发生的ENSO事件进行历史回报，并得到了比较不错的预测效果。

　　罗京佳说：“目前，人工智能预测模型可以做24个月ENSO预测，不仅在提前几个月，甚至提前12个月、18个月、24个月的预报时效上基本比我们的动力模式预测都要好。例如，提前18个月，该模型对冬季ENSO预测技巧可以达到0.64，而南京信息工程大学的动力模式预测技巧是0.5左右。”

　　通过卷积神经网络建立的ENSO模型的预测效果在国际上形成了很大的影响力。相比于动力模式超大的计算量，人工智能模型建立过程需要一定的计算量，但建立起来后，计算量非常少。在经济上比较节约，而且速度也快，一旦建立起模型，实时预测结果很快就能出来。

　　人工智能利弊兼而有之研发需久久为功

　　值得注意的是，利用卷积神经网络预测气候现象研究目前还处于初步阶段，而且人工智能方法并非针对理学领域研发的，所以还存在很多问题。首先，深度学习在有大数据的基础上才具备较好的建模能力，而气候观测样本数量较少，尤其是极端事件现象等样本量更少。这种情况下，机器深度学习方法的自我学习能力存在很大的限制，所以研发针对小样本事件的机器深度学习方法是目前的一个发展方向。此外，近年来深度学习模型越来越复杂，一般来讲，模型越复杂，它的学习能力越好，但是带来的问题就是模型结果的可解释性越差。

　　动力模式是基于动力学方程、热力学方程等进行离散化、积分得出的，是基于物理规律约束下计算得到的结果。但深度学习是模拟人脑学习能力和思维方式，得到的结果是否符合物理规律，是不是基于正确的理由得出的结果，人们现在还无从得知。

　　“这是机器深度学习当前面临的困境。目前人工智能研究领域也在往可行性解释方向发展，比如研发对卷积神经网络构建的每一个过程，建立一套可解释性的方法。”罗京佳说，研发团队正在攻关，希望在几年内能够对热带气候、东亚气候等机理认识方面有所提高，在关键气候预测能力等方面，借助人工智能等跨学科方法进一步加以改进。

（来源：《中国气象报》2020年12月18日三版责任编辑：王美丽）