综合新闻

大气所“全球天气—气候精细化预测数据集”入选首批100个高质量数据集

329日下午,以“数据驱动,智绘未来”为主题的2024北京AI原生产业创新大会暨北京数据基础制度先行区成果发布会在北京经济技术开发区(北京亦庄)举办。本次大会发布了第一批人工智能大模型高质量训练数据集。大气所包庆研究员团队的“全球天气—气候精细化预测数据集”入选首批100个高质量数据集,包庆研究员受邀参加发布仪式。

第一批人工智能大模型高质量训练数据集是北京国际大数据交易所联合北京人工智能产业联盟共同征集的,包括中国科学院大气所、北京科学技术研究院、中国知网、中汽智联、北方健康、中文在线、中国搜索、牡丹集团等36家机构及企业提供的大模型语料训练数据,共同为先行区人工智能训练场示范基地建立模型训练语料资源库。首批发布的数据集覆盖科技创新、金融服务、医疗健康、医药研发、自动驾驶、气象服务、商业航天、影视创作等20多个应用场景,共计100余个语料数据,数据总量逾150PB,涵盖了专业知识问答、古今文化书籍、互联网舆情资讯、多语种音视频、教学资源题库、科研数据、高清图片等多领域、多模态的数据语料。

全球天气—气候精细化预测数据集”基于大气所自主研发气候系统模式(FGOALS-f2)产生的全球预报数据集。气候系统模式的水平分辨率约为100公里,数据要素包括全球位势高度场,温度场,风场,比湿、地面的温度、降水等54个气象要素。“全球天气—气候精细化预测数据集”包括建立在FGOALS-f2版本上的全球聚焦多尺度精细化预测数据集,数据集为聚焦中国区域的变网格降尺度预测结果,聚焦区域数据集分辨率可达25公里。气象预测数据作为数据要素市场的重要组成部分,已成为农业、林业、水利、应急、人们生产生活等国民经济各行业发展的重要数据支撑。

大会还发布了北京经开区AI原生产业政策、点亮人工智能公共算力平台3000P智能算力(规划算力10000P)并投入使用、启用北京人工智能数据训练基地、发布多个创新平台、落地多个重点项目,用AI打造新质生产力“强引擎”。大会由北京市发展和改革委员会,北京市经济和信息化局,北京市科学技术委员会、中关村科技园区管理委员会,北京市市场监督管理局,北京市政务服务和数据管理局,北京市通信管理局,北京经济技术开发区管理委员会,北京亦庄投资控股有限公司主办;北京亦庄智能城市研究院集团有限公司,中国信息通信研究院承办;中国人工智能产业发展联盟、经开区国家信创园、中电云计算技术有限公司、北京市建筑设计研究院股份有限公司支持。清华大学图灵奖获得者姚期智院士、国务院前副秘书长、中国工业经济学会会长、中国数字经济发展和治理学术年会主席团主席江小涓出席并进行主旨演讲,国家数据局副局长、北京经开区管委会书记、北京经开区管委会主任、以及主办机构负责人出席大会。

本次大会还邀请来自顶尖学术机构、人工智能及生态链先锋企业、知名创投机构的百余位代表,共话人工智能领域最新成果,集聚核心要素,推进优质数据和可信算力的可及可用,助力企业更快更好发展;探索制度创新,推动数据政策先行先试,打造大模型深化应用的试验田。努力为建设“高质量数据集-国产算力底座-自主可控算法-示范性应用场景”全要素的AI原生产业创新高地贡献力量。

附件下载:
d