构建、评估与连接 AI 技能 | SkillNet:大规模智能体“技能图谱”知识库
本文也提供英文版本 English。
导读
当前AI智能体已能灵活调用工具、规划复杂任务,但能力的持续进化取决于智能体技能(Agentic Skills)的积累与迁移。由于缺乏系统化的Skill沉淀与共享机制,即便同类问题早已被反复解决,智能体仍需在不同环境中从零试错、重复踩坑。通用模型提供了基础能力,却未形成领域化、可复用的技能结构,导致每个智能体都在孤立情境中重复构建相似经验。
SkillNet 正是为破解这一困境而构建的大规模智能体技能知识库。它将分散的实践经验,沉淀为可计算、可检索、可组合的结构化技能知识网络。这样一来,智能体就能像查阅地图一样,快速定位特定领域中的系统知识——包括需要什么专业知识、使用什么专业工具、遵循怎样的技能路径——从而实现技能的高效共享与快速迁移。初步实验结果表明,引入SkillNet相关技能后,在ALFWorld、WebShop、ScienceWorld等常见基准上可取得约10-30个百分点得性能提升。
目前,SkillNet已覆盖科学、工程、创作等多个领域,收录超过 20 万项技能,并从中精选出 15 万余高质量技能节点。本次发布不仅提供完整的技能资源下载,同时配套推出了可直接上手的 Python 工具库,支持研究者与开发者快速集成与实验,欢迎通过 pip install skillnet-ai 使用。
SkillNet官方主页:http://skillnet.openkg.cn/
SkillNet代码库: https://github.com/zjunlp/SkillNet
1. SkillNet:让智能体"知技·善任"
人工智能的发展史,本质上是对知识表征、理解与利用的探索史。这一历程可划分为三个阶段:
文本知识(Textual Knowledge):知识以非结构化文本存在,覆盖面广但语义模糊,机器难以直接理解,形成"语义鸿沟"。
符号知识(Symbolic Knowledge):通过知识图谱、描述逻辑等符号化表示,赋予知识精确语义,支持严谨推理。但知识获取成本高,难以规模化应用。
向量化知识(Vectorized Knowledge):大语言模型将知识编码于高维向量空间,泛化能力强、调用便捷,但存在可解释性缺失、过程不可控、事实一致性脆弱等问题,在高可靠性任务中表现不稳定。
上述三种形态都侧重于描述"世界是什么"(Know What),而缺乏对"如何做"(Know How)的程序性知识的有效表征。这正是当前智能体面对复杂任务时的核心困境。
为突破此困境,我们提出从静态知识转向动态"技能型知识"(Skill Knowledge)的工程化构建思路。简单而言,技能(Skill) 是封装了特定意图、可参数化调用并能产生确定性输出的程序性知识单元,它融合了引导智能体正确完成任务所需的上下文知识、行动步骤与历史经验,具体包含以下核心要素:
- 适用场景:定义前提条件、约束及失败场景
- 工具与接口:声明所需的外部资源与依赖
- 推理结构:固化已验证的决策链与操作序列
- 元认知信息:记录成功率、资源消耗、执行时延等评估指标
Skill 不仅是可执行的知识,更是可衡量、可复用、可演化的能力构件。正是这种模块化表征,使智能体得以基于既有能力库进行高效组合与灵活迁移,彻底摆脱从零试错的困境,从而实现真正的"知技·善任"——既能掌握技能,更能善于任用,为构建更通用、更鲁棒的人工智能系统奠定关键的能力基石。
2. Skill Ontology:构建技能知识网络
SkillNet 并非技能的简单堆积,而是一个结构化的技能网络。我们提出 Skill Ontology 来刻画技能间的系统性组织关系,分为三层结构:
- 第一层:分类体系 — 按功能与抽象层级组织技能
- 第二层:关系层 — 刻画技能间的依赖、组合、相似/替代等关系,为工作流规划提供结构化支撑
- 第三层:技能包层 — 具体技能以本地可部署的包形式存在,通过依赖关系接入上层网络
通过 组合(compose)、归属(belong_to)、依赖(depend_on)、相似/替代(similar_to) 等关系,SkillNet 不仅刻画了技能之间的静态关联,还形成了一个可随经验持续更新的动态本体,构建出可推理、可规划、可进化的能力空间。在这一能力空间中,技能关系会随着任务分布、执行反馈与环境变化不断被修正与扩展。智能体得以像工程系统一样"组装"能力:选择合适模块、按需组合、规避已知失败模式,并在真实任务中快速迭代。
本质上,SkillNet 将"知识"从静态存储转化为可执行的能力工具箱,不仅提升了智能体在复杂任务中的可信性与可控性,也为长期在线 Agent、跨领域协作及科研自动化提供了可维护、可扩展、可演化的能力基础。
3. SkillNet的构建与评估
多源数据采集
SkillNet 的构建基于大规模、多源的技能数据采集。我们从以下渠道系统性收集技能:
- 全网已有 Skill:整合开源社区中已验证的技能实现
- 实现学术数据集:从学术数据集提取多个领域的标准化方法与流程
- GitHub 代码仓库:挖掘真实项目中的可复用能力模块
- 智能体执行轨迹:从我们自主运行的 Agent 任务中自动抽取技能
自动化构建流水线
在数据采集的基础上,我们提出了一套自动化流水线,将多源异构数据转化为结构化、可复用的技能表示。该流程首先对任务空间进行系统性探索,采集涵盖成功与失败的完整行为轨迹;随后对多步骤决策过程进行自动归纳与分解,抽象出具有明确语义边界与接口定义的模块化 Skill。在此之上,进一步结合大语言模型的推理能力与规则约束,自动构建技能之间的层级、依赖与组合关系,从而形成结构化、可演化的技能关系网络。
多维度质量评估
评估机制是 SkillNet 可靠运行的关键。为避免技能在真实执行中不稳定或不可控,SkillNet提出了对技能质量进行多维度系统化评估,包括:安全性(Safety)、完备性(Completeness)、可执行性(Executability)、可维护性(Maintainability)以及成本感知(Cost-Awareness) 等关键指标。
4. SkillNet实操应用
目前,SkillNet 已在科学研究、工程实践与内容创作等多个领域完成大规模构建,累计覆盖 超过 20 万项候选技能,经自动化质量评估筛选出 15 万余个高质量技能节点,形成了具有明确语义结构与依赖关系的能力网络。
本次发布同时提供配套的 Python 工具库(pip install skillnet-ai),支持技能的加载、组合、评估与执行,为研究者与开发者在不同智能体框架中进行快速集成与可复现实验提供基础设施支持。
以科学技能为例,SkillNet 覆盖了从文献检索、假设生成、实验设计到结果分析与失败归因的完整科研流程,将隐含于专家经验中的过程性知识与策略性决策,转化为可显式建模、可复用、可组合的能力结构。这不仅降低了复杂科研任务的执行门槛,也为构建具备规划、反思与持续改进能力的科学智能体提供了新路径,为 AI for Science 提供支撑。
下面以Python包为例介绍SkillNet的使用方式,详细文档请参见Github。
⚡ 3 分钟上手 SkillNet
# 安装
$ pip install skillnet-ai
from skillnet_ai import SkillNetClient
client = SkillNetClient(api_key="sk-xxx")
# 搜索技能
skills = client.search(q="bioinformatics pipeline")
# 下载并使用
local_path = client.download(url=skills[0].skill_url, target_dir="./my_skills")
print(f"Skill successfully installed at: {local_path}")
# 创建技能
created_paths = client.create(github_url="https://github.com/openai/openai-python", output_dir="./my_skills", model="gpt-4o" )
# 评估技能
result = client.evaluate(target="https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/biopython", model="gpt-5")
print(f"Evaluation Result: {result}")
# 分析技能关系
relations = client.analyze(skills_dir="./my_skills", save_to_file=True, model="gpt-4o")
for rel in relations:
print(f"{rel['source']} --[{rel['type']}]--> {rel['target']}")
OpenClaw 集成
SkillNet 已与 OpenClaw 集成,作为一种内置的、延迟加载的技能(使用指南)。安装后,你的智能体可以自动:
- 搜索 现有技能,再启动复杂任务
- 创建 新技能,从代码仓库、文档或已完成的工作中提炼
- 评估与分析 你的本地技能库,确保质量并梳理技能间的关系
社区技能指导执行 → 成功的执行结果转化为新技能 → 定期分析保持技能库整洁。
5. 使用 SkillNet 增强智能体
获取技能资源提升任务表现
SkillNet 提供了经过去重、筛选和质量评估的高质量技能集合,从源头上保证技能的可靠性。我们在多个基准数据集上进行了实验,为避免数据泄露,构建技能轨迹时严格排除了测试集,相关数据已开源。 在公开基准的实验中,引入 SkillNet 中的相关技能提升了智能体在 ALFWorld、WebShop、ScienceWorld 等任务环境中的表现,性能提高约 10–30 个百分点。
这说明,把能力抽象成可复用的技能模块,确实能实打实提升任务成功率,而不是靠反复调 prompt 碰运气。更重要的是,每一次真实任务中的经验都可以沉淀为标准化能力组件,下次直接调用,而不是做完即丢、从头再来。
自动构造能力网络,沉淀行业知识资产
SkillNet不仅提供技能集合,更提供技能之间的结构化联结机制。通过自动构造"组合、依赖、归属、相似"等关系形成能力网络。
这套机制带来的价值很直接:原本零散分布在项目代码、文档和个人经验中的做法,可以被整理成结构化的能力网络,变成真正可查询、可复用的"行业知识"。企业可以持续沉淀业务能力,逐步形成能力资产库,并在不同项目、不同团队之间直接复用。
6. 展望: 重构智能体时代的知识工程
我们发布的 SkillNet 是面向智能体的大规模技能知识网络。尽管如此,我们深知当前工作仍处于初步探索阶段,距离构建真正通用且鲁棒的技能网络还有很长的路要走。我们期待与学术界、工业界及开源社区携手合作,共同推动这一方向的持续迭代与完善。 以下几个方向尤其值得深入探索:
开放世界的技能演化
在开放世界中,实现技能的自动发现、抽象与跨领域迁移仍充满挑战。在 工业制造、金融和科学 等领域,这涉及复杂任务的动态组合与优化。将技能演化机制与在线反馈、因果推理及不确定性建模结合,有望提升技能选择的可靠性。
模型与技能的协同
尽管 SkillNet 为智能体提供了大规模可执行技能,但其与底层模型能力的协同仍有待探索。特别是,如何通过神经符号结合与记忆机制,使技能结构反向引导模型决策路径,并在模型能力变化时动态重构技能层级与依赖关系,仍是值得系统研究的核心问题。
多智能体协作与知识共享
在多智能体协作环境下,SkillNet 有潜力作为共享的能力表示与交换层,支撑多智能体间的协同规划、知识迁移与经验积累。我们期待看到 SkillNet 在更广泛的协作场景中发挥作用。
我们由衷希望,SkillNet能够为构建可维护、可扩展且可进化的智能体系统提供有益的参考与支撑。我们热忱欢迎社区的批评指正与共同建设。
👉 更多使用细节请参考: https://github.com/zjunlp/SkillNet





