从轨迹到技能:模型自动生成 Agent Skills 全生命周期的系统研究
精读 arXiv 2605.23899,全面解析 Agent Skill 生命周期三阶段(经验生成、技能抽取、技能消费)中的关键发现与工程启示。
Latest
精读 arXiv 2605.23899,全面解析 Agent Skill 生命周期三阶段(经验生成、技能抽取、技能消费)中的关键发现与工程启示。
解读 Self-Policy Distillation 如何用正确性 token 的梯度抽取能力子空间,再用 KV 投影生成更可蒸馏的数据。
解读 SkillOpt 如何用 rollout、反思、文本学习率和验证门,把冻结 Agent 的技能文档训练成可迁移的程序性知识。