源图-高质量Skills数据集正式发布:首批20万条高质量Agent Skill赋能大模型智能化生态
2026-06-25 17:21:58
6月25日,在2026开放原子开源生态大会开幕式上,源图-高质量Skills数据集正式发布。该数据集由中国科学院软件研究所依托“源图”开源软件供应链重大基础设施打造,首批开放20万条经过严格筛选与结构化处理的高质量Agent Skill,为我国大模型智能体生态构建提供规范化、可追溯、可扩展的基础数据。业内专家表示,这是国内首个大规模、标准化的Agent Skill数据集,对推动开源软件供应链智能化生态演进具有重要意义。

当前,人工智能已成为推动全球开源生态演进的重要驱动力,大模型智能体技术加速向实体经济各领域渗透,开源软件供应链的可复用资源范畴持续拓展,已从传统代码组件、依赖包延伸至可被智能体调用、组合并执行的能力单元。然而,当前Agent Skill资源普遍存在来源分散、结构不统一、描述粒度不一致、追溯信息不足等问题,难以支撑大规模检索、比较、复用与治理,制约了Agent生态的规模化发展。
中国科学院软件研究所立足开源软件供应链领域长期技术积累,依托“源图”基础设施在数据治理方面的能力优势,从多个Agent Skill平台及开源仓库等来源采集候选资源,通过格式校验、重复消解、质量评分与分类处理,将异构分散的Skill资源转换为统一规范的Skill实体,最终形成源图-高质量Skills数据集。
数据集建设过程中,研究团队围绕元数据完整性、描述清晰度、接口可识别性、依赖可解析性和来源可信度等维度,建立了科学、全面的综合评价机制,系统过滤了格式不完整、语义信息不足或来源不可追溯的候选项,确保入库Skill具备较高的可用价值与安全水平。数据集完整保留了每条Skill从原始采集、加工处理到标准化入库的全链路追溯信息,并详细标注了每条Skill的能力类别、应用场景、运行环境、依赖项、接口信息、输入输出规范及外部服务依赖等关键属性,不仅能够帮助使用者快速精准匹配自身开发需求,更为Agent技能的安全审计、风险溯源提供了完整可信的数据支撑。
中国科学院软件研究所相关负责人表示,源图-高质量Skills数据集的发布,将有效提升Agent能力资源在描述规范、结构组织、质量评价和来源追溯等方面的数据治理能力,填补国内高质量Agent Skill数据集的空白,为技能检索、依赖分析、工具推荐与任务规划等核心场景提供高质量数据支撑,加速开源产业智能化转型进程。当前,源图-高质量Skills数据集首批资源已同步向产业界与开发者开放取用,后续将逐步建立社区共建与贡献回馈机制,广泛吸纳产学研各界优质技能资源,持续扩充垂直行业场景覆盖,迭代完善数据治理标准与安全评估体系。
开源是人工智能发展的重要基石,当前人工智能领域的竞争,本质上是开源生态的竞争。开放原子开源基金会始终秉持“共建、共治、共享”的核心理念,积极推动国内开源基础设施的建设与健康可信开源生态的培育。源图-高质量Skills数据集的发布,是基金会推动产学研协同,完善人工智能开源基础能力的一项重要成果。基金会将持续发挥中立平台优势,汇聚产学研各方力量,推动数据集的迭代升级与规模化应用。
龙蜥社区正式升级为“AI原生操作系统社区”,从服务器底座迈向下一代智能基础设施
2026-06-25 16:30:506月25日,在2026开放原子开源生态大会上,龙蜥社区(OpenAnolis)正式宣布升级为“AI原生操作系统社区”。这一战略升级标志着龙蜥不再仅仅是承载应用的操作系统底座,而是向能够理解AI、调度AI、协同AI的新一代智能中枢演进,为千行百业的智能化转型筑牢根基。
上一篇让代码背后的贡献者站到台前:开放原子开源基金会致谢明星开源项目贡献者
2026-06-25 18:23:326月25日,在2026开放原子开源生态大会上,开放原子开源基金会致谢来自开源鸿蒙、开源欧拉、openKylin、OpenTenBase、OpenLoong等明星开源项目的三十六位优秀开发者,这也是基金会面向旗下重点开源项目核心贡献者打造的专项荣誉盛典。
下一篇