专家顾问:
国家气象中心副主任 代刊
国家气象信息中心副主任 邓鑫
国家气象信息中心系统发展室主任 何文春
中国气象局地球系统数值预报中心副主任 陆其峰
中国气象局地球系统数值预报中心计算技术室主任 肖华东
中国气象局气象探测中心总工程师 雷勇
中国气象局公共气象服务中心服务产品研发室主任 王慕华
中国气象科学研究院人工智能气象应用研究所所长 王亚强
1月20日,Deep-Seek-R1模型正式发布,并同步开源模型权重。凭借远低于行业平均成本的研发投入,多模态交互、低能耗运算、多语言适配等关键技术的突破,以及模型推理能力的极大提升,DeepSeek进一步加速人工智能应用的普及,迅速成为全球科技界关注的焦点。
激活人工智能在气象监测、预报和服务中作用,也是近年来中国气象局持续发力探索的重要领域。气象专家发现,借助深度学习算法以及多头潜在注意力(MLA)机制、混合专家模型(MoE)架构、强化学习(RL)、知识蒸馏等关键技术,DeepSeek能在高效处理卫星图像、雷达数据和地面观测数据,快速分析并提炼复杂关键气象信息,压减人工处理时间和降低成本,加速气象预报智能化步伐,以及赋能精细气象服务等方面发挥重要作用。可以说,DeepSeek等大语言模型为加速推进气象服务智能化发展提供了一把关键“钥匙”。
全流程赋能气象数据信息
点击进入气象大数据云平台“天擎”,2500余种气象服务数据、2000余个数据要素、1000余个数据接口相继呈现。
“用户要找到自己所需要的数据或要素,选择合适的接口调用服务等,往往要在网站上花时间熟悉说明文档,所以我们开发了智能‘小助手’——ChatMUSIC。”何文春介绍,用户只需通过自然语言对话,说出自己想要的数据,例如“获取昨日全国范围降水量最大的前10个站点数据”,ChatMUSIC便能马上识别其需求,生成数据获取代码,同时提供数据样例及可视化图形。
ChatMUSIC是国家气象信息中心(以下简称“信息中心”)探索人工智能气象应用的一个缩影。而气象信息领域有关大语言模型的部署,则可追溯至2023年7月。为支持国家气象中心(中央气象台)等单位的生成式人工智能应用,信息中心陆续部署了智谱GLM、通义千问、书生浦语等大语言模型。2月8日,DeepSeek-R1 671B模型在中国气象局气象超算中心(和林格尔)完成本地化部署,将ChatMUSIC与DeepSeek对接,开始测试网页对话交互应用。
“从目前的测试来看,DeepSeek具有较强的计算分析和模型优化能力,其在推理逻辑、自我反思以及对中文语言的语义理解和生成等方面质量更优。”何文春介绍,这样的强推理模型对气象数据全流程赋能具有重要意义,例如结合当前地球系统大数据平台建设发展,DeepSeek可根据不同业务需求,通过互联网在全球范围内主动识别发现有价值的地球系统科学数据,并进行清洗处理。在数据存储与服务方面,DeepSeek等大语言模型则能根据用户访问需求,合理规划和动态调整各层级数据布局,以更简洁、自然的方式优化用户交互体验,“大家可以使用自然语言代替界面操作和程序开发等方式使用数据资源。”何文春说。此外,DeepSeek在业务运维、政务办公、安全风险研判等方面也具有很好的应用前景。
在地球系统科学研究中,代码编写和审查是关键环节之一,涉及复杂的技术学习和语法分析任务。以往,科研人员需耗费大量时间和精力编写代码,且人工审查代码时难免出现疏漏。如今,DeepSeek等大语言模型可在其中发挥关键作用。
近日,中国气象局地球系统数值预报中心(以下简称“数值预报中心”)通过DeepSeek-R1大模型辅助科研工作。“通过对海量代码数据的学习,它能够根据科研人员的自然语言描述,快速生成高质量代码框架,涵盖Python、Fortran等多种常用于地球科学研究的编程语言。”肖华东说,对于通常的数据处理和产品绘制代码开发,只需通过交互方式依次输入代码的要求,DeepSeek-R1大模型就能迅速生成结构清晰的基础代码,科研人员在此基础上进行微调即可,缩短了开发周期;在代码审查方面,它能依据行业标准和常见错误模式,检测出代码中的语法错误、逻辑漏洞以及潜在的性能问题,并给出修改建议,提供详尽和规范的代码标注。
面对海量气象数据的处理和加工,DeepSeek可促进天气雷达、地基遥感等各类异构、多模态遥感观测数据的高质量融合,帮助解决当前气象监测数据获取和处理中存在多源异构性、时空不一致性以及精度不足等问题。“我们还可以考虑通过智能算法优化观测站点的选址和布局,如运用遗传算法、模拟退火算法综合考虑地形、人口密度、历史灾害记录、城市功能区分布等因素。伴随算法的完善改进,蒸馏专有的观测站网布局模型,为科学规划观测站网提供支撑,进而提升探测效益。”雷勇介绍,通过构建面向装备保障的自然语言模型,发展人工智能会话式远程故障技术支持系统等,还将有效提升气象观测数据的运维保障效率。
除了在气象数据各环节有应用价值外,DeepSeek在模型架构和优化、跨学科协作以及实际场景落地等方面的经验也值得借鉴。
针对计算机系统各组成部件特性,DeepSeek开展了诸多精细的优化软件设计开发。“这对于我们下一代数值预报模式的计算效率优化具有很好的参考借鉴意义,后续模式代码的计算优化需更多考虑软硬件协同,针对机器特性展开精巧设计。”陆其峰介绍,此外,还可在数值预报模式开发及各流程中应用DeepSeek模型的特色技术,如在观测资料预处理、同化极小化算法、四维变分切线性伴随方程求解、模式动力计算等环节精巧利用人工智能技术实现改进及融合,进而提高精度及计算效率。
多场景深化气象预报服务
作为AI领域的一颗新星,DeepSeek也深刻影响着气象服务的个性化升级、气象灾害预警能力的增强以及气象服务与各行业的深度融合,为气象预报和服务注入前所未有的动力。
去年6月,中国气象局相继发布“风清”“风雷”“风顺”三个气象专业领域预报预测大模型,完成了基于国产全球大气再分析资料CRA-40、雷达观测资料、风云卫星遥感资料的模型训练和检验评估,进一步提升大气运动、天气现象的预报精度。对比来看,尽管目前DeepSeek等大语言模型无法直接提高气象预报预测的准确率,“但气象数据包含卫星云图、雷达回波、地面观测、数值模式输出等多源异构数据,具有时空密集、高维度、多模态的特点,可以参考DeepSeek跨模态模型(如文本—图像联合训练)技术,构建气象领域的多模态融合端到端模型(如结合卫星图像与数值预报数据),进而提升灾害性天气预报预测精度。”代刊说,我们也可以借鉴其MoE专家模型等架构,优化气象预报大模型的多任务处理能力。
“气象垂直行业模型的研发,是DeepSeek应用的一个重要方向。”王亚强指出,DeepSeek的开源特性与本地部署能力,使其能够方便地应用于垂直行业模型的研发,同时避免数据泄露的风险。气象垂直模型可为研究人员在推理诊断、问答服务、智能代理等方面提供新的助力,以及构建本地化气象智能体,从而为气象预报的精准化提供更加坚实的支撑。
此外,DeepSeek用到的模型训练技术可以借鉴到气象预报人工智能大模型的研发中。模型微调与知识蒸馏技术能将气象物理模型中的有效信息提取出来,简化为更高效、精准的计算模型,从而有效提升气象预报大模型的预测能力与精度。知识蒸馏技术还能显著降低大模型训练的算力和存储需求,提升模型训练效率和精度,为气象预报和服务提供更高效的解决方案。此外,强化学习技术的加入,可以为气象预报大模型在环境气象、交通气象、农业气象等领域的专业拓展提供支撑。
在智能气象服务方面,国家气象中心于2023年启动了以“智脑”为核心的下一代天气预报业务一体化平台建设。通过基于大语言模型打造预报员智能体——“数字预报员助手”,预报员可以在天气分析、模式诊断、预报研判和产品生成等环节实现效率的显著提升。代刊介绍,该系统涵盖聊天、知识库问答、材料生成、翻译和工具箱等模块,初步实现了气象专业知识检索、与部分业务网站自动交互、历史天气个例检索、预报服务材料生成等功能,将有效帮助预报员快速精准地获取、处理、制作气象信息和产品。
随着技术发展和服务升级,气象服务不仅仅是天气预报的简单输出,个性化、精准化的气象服务体系逐渐成为行业发展的新趋势。王慕华认为,DeepSeek在深度推理技术方面的优势,可以用来执行复杂的多步骤研究任务,有效提高气象数据检索的准确性和服务内容的生成质量。
与此同时,中国气象局公共气象服务中心已在“风和”气象服务大模型中集成DeepSeek-R1,极大提升模型的深度推理能力。该模型依托智谱GLM和其他开源的通用大模型,结合大规模气象书籍、气象科普网站、气象服务材料等专业气象语料和知识库,进行预训练和微调,构建气象服务垂域基座大模型。通过AI Agent平台(一种以大语言模型为大脑驱动的系统),扩展接入权威气象数据和气象工具,构建基于“风和”的气象服务智能体平台,适应不同应用场景。通过技术创新,气象服务不仅在精度和时效上得到显著提升,更能与农业、交通、能源、旅游、健康等行业深度融合,为各行业发展提供更精确、更高效的气象支撑,形成气象服务智能应用新生态。
例如,在预警领域,“风和”+DeepSeek可以实现分众化预警信息传播和靶向发布,确保老人、残障人士等特殊人群获取气象服务的公平性;在农业领域,“风和”+DeepSeek可以通过精准天气预报和农事建议,帮助农民合理安排生产,优化农业效益……提升社会整体气象服务的价值与影响力。
挑战和机遇
DeepSeek的全面应用仍面临着一些挑战。大语言模型并非“开箱即用”,当前气象部门构建智能应用的环境与现有业务的算法、插件、接口等开发资源尚未完全打通,且未建立起规则完善、标准统一、安全可靠的人工智能气象语料库。
眼下,各级气象部门都在探索推进DeepSeek的应用。邓鑫表示,信息中心正加快完善气象人工智能基础支撑技术平台的建设,为用户提供统一的大模型部署和一站式的智能应用开发环境,升级气象大数据云平台能力,提供数据、算力、算法、组件、接口、智能等统一支撑,确保稳定安全。
随着人工智能技术的迅猛发展,气象领域正在迎来深刻变革。然而,如何将这些前沿技术与气象业务实际需求紧密结合,仍然是一个值得深入探讨的课题。这要求气象部门在积极推进技术应用的同时,更加审慎地思考如何注重多维度的合作与探索,确保模型能够真正为气象预报、气候变化研究、灾害响应等提供切实可行的解决方案,为气象事业发展写好“高质量”注解。
(作者:王婉 刘丹 责任编辑:张林)