以高质量数据“喂养”AI,提升模型智能成行业新焦点
在人工智能领域,数据的质量正被视作决定模型“聪明”程度的关键。8月28日,一场以高质量数据集为主题的交流活动在贵阳举行。与会专家从学术界和企业界角度,就数据安全制度构建、技术防护手段升级与治理模式创新等议题展开讨论,为推动高质量数据集建设提供了思路与路径。
中国工程院院士吴世忠在发言中指出,我国在大模型训练方面拥有包括文献、方言、行业数据、民俗文化在内的多样化语料优势,资源总量位居国际前列。但他也强调,当前仍面临数据来源合规性与内容真实性等挑战。他提出应推进数据分级分类管理,强化脱敏公共数据的溯源能力,以保障大模型数据使用的安全可控。
中国移动数智化部副总经理陶涛则从实践角度指出,尽管数据是AI进化的重要基础,但目前仍存在私有数据开发利用不充分、质量差异大、相关技术尚未成熟等瓶颈。为支持高质量数据流动与运用,中国移动已建成集采集、传输、存储、计算与应用于一体的基础设施。目前每日采集数据量接近6PB,实时接入超2亿条/秒,涵盖50余类数据源。此外,公司还构建了覆盖全国的传输网络,以极高效率完成跨域数据调度——例如在5000公里距离传输1TB数据仅需两分钟。
活动同时公布了104个“高质量数据集典型案例”,覆盖农业、医疗、通信等多个垂直领域,显示出数据与行业深度融合的广泛前景。为进一步促进行业协作,中国信通院、中国移动等机构共同发起“高质量数据集领航计划”,旨在凝聚产业共识,构建开放生态,助推人工智能技术加速落地。
数据显示,截至2025年上半年,全国高质量数据集总量已突破3.5万个,累计交易额近40亿元。作为国家大数据综合试验区,贵州已发展200余家数据服务企业,发布金融、工业、医疗、商贸等领域的高质量数据集900余个,持续为AI训练提供优质“数据燃料”。
更多文章
-
人工智能标准体系加速成型,深圳贡献核心力量
近日,我国人工智能标准化工作迎来重要进展。国家市场监管总局透露,当前已正式发布人工智能国家标准30项,另有84项标准正在紧锣密鼓制定中,构建起覆盖基础软硬件、关键技术、行业应用与安全治理的完整标准体系。在这一国家战略推进过程中,深圳市凭借前瞻布局、企业创新和国际化参与,成为推动标准体系建设的重要力量。一
-
中国统筹算力与能源布局,破解AI发展电力瓶颈
面对人工智能迅猛发展带来的巨大电力需求,全球正面临一场新的能源考验。以一座千兆瓦数据中心为例,其年度耗电量几乎等同于一个中等规模城市的全年用电。若全球范围内AI大模型同时全速运行,电力供应能否跟上,已成为业界关注的焦点。在美国弗吉尼亚州等地,随着数据中心不断扩张,居民电费显著上涨,折射出AI繁荣背后日益
-
科技助农“飞”速度 屯留无人机抢收解民忧
连日阴雨给秋玉米收获带来严峻挑战。关键时刻,屯留经开区迅速组织区内企业的无人机投入抢收一线,以科技创新破解了传统农业面临的“抢收难”困境。1.科技破局 无人机打通抢收“快车道”在屯留区李高乡西李高村的玉米田里,多架配备专业吊装设备的无人机正在紧张作业。它们灵活悬停在玉米秆上方,通过机械臂准确抓取成袋玉米
-
科技点亮文旅新图景:上海构建水陆空融合网络,重塑智慧旅游体验
在上海,一场以科技赋能旅游的实践正悄然展开。中国电信携手久事旅游集团与华为,共同打造了一套覆盖水、陆、空的5G-A与人工智能融合网络体系,并以黄浦江游轮为试点,推出AI智能眼镜租赁服务。这一举措不仅有效解决了传统游览中的网络与服务短板,更以“科技+文旅”的创新模式,为上海乃至全国旅游业的高质量发展提供了新的
-
花江峡谷大桥创双项世界纪录 中国智慧破解山区建桥难题
历经三年半的攻坚克难,花江峡谷大桥于2025年9月正式通车。这座横跨贵州深切峡谷的钢铁长桥,不仅以2890米的总长和625米的桥面至水面高度刷新世界纪录,其1420米的主跨更成为山区桥梁建设的全球新标杆。面对峡谷间变幻莫测的乱流强风,建设团队开创性地运用多普勒激光雷达进行立体化风场监测,结合风洞实验与数字模拟,最终