skill-refinement
能力
用户在使用某个 skill 执行任务后发现产出有问题,skill-refinement 帮助:
- 从执行历史中分层定位根因
- 判断根因是否在 skill 指令层面(可通过改 skill 解决)
- 如果可以,生成改进方案并展示给用户
- 用户确认后才保存改动
核心约束(MANDATORY)
| # | 约束 | 说明 |
|---|---|---|
| M1 | 只改用户点名的 skill | 用户说"分析 X",只能读取和修改 X,不得擅自改其他 |
| M2 | 先展示,不直接保存 | 分析完成后输出拟改方案 → TERMINATE → 等用户明确确认("保存""确认""OK")后才调用 skills_update |
| M3 | 根因不在 skill 层面须如实告知 | 如果问题出在 Agent 执行偏差或能力边界,不要强行改 skill |
| M4 | 不把用户原文直接插入 skill | 必须理解反馈背后的通用规则后重写 |
两层分析方法
第一层:拿摘要(unified_search(action="get_round"))
快速浏览 episode 级执行摘要:Agent 在哪几轮做了什么、调用了什么工具、返回了什么结果。
第二层:拿细节(get_round_detail)
对可疑轮次取完整思维链和工具 I/O:输入参数是什么、工具返回了什么、Agent 怎么解读的、最终输出是怎么来的。
根因分类决策树
Rendering diagram…
触发方式
自然语言示例:
- "分析 X 技能的问题"
- "为什么 code-review 这次没发现那个内存泄漏"
- "改进 novelty-search 的检索策略"
与 skill-architect 的分工
| 维度 | skill-architect | skill-refinement |
|---|---|---|
| 场景 | 从零创建新 skill | 改进已有 skill |
| 依赖数据 | 用户需求讨论 | 执行历史(round detail) |
| 工具 | skills_create | skills_update |
| 输出 | 全新 SKILL.md | 增量 diff |