Reading / Notes / Interpretation

把值得反复阅读的内容，整理成可复用的思考。

分享、阅读、文章解读与思考札记。

浏览文章关于本站

Latest

从轨迹到技能：模型自动生成 Agent Skills 全生命周期的系统研究

精读 arXiv 2605.23899，全面解析 Agent Skill 生命周期三阶段（经验生成、技能抽取、技能消费）中的关键发现与工程启示。

Paper ReadingAILLMResearch

2026年5月27日15 min readHTML

解读 Self-Policy Distillation 如何用正确性 token 的梯度抽取能力子空间，再用 KV 投影生成更可蒸馏的数据。

Paper ReadingAIHTMLLLM

2026年5月26日14 min readHTML

解读 SkillOpt 如何用 rollout、反思、文本学习率和验证门，把冻结 Agent 的技能文档训练成可迁移的程序性知识。

Paper ReadingAIHTML