research - 标签 - Ajax Zhan's Blog

2026-03-30

摘录｜林俊旸大佬的From reasoning thinking to agentic thinking

林俊旸博文指明reasoning与agentic thinking的未来研究方向。o1/R1启示RL是reasoning模型崛起的关键，需稳定可扩展的反馈信号；thinking与instruct合并难点在于数据分布差异，需融合形成推理强度连续谱。Anthropic强调思考应围绕目标负载（如编程、长时任务），而非冗长轨迹。Agentic Thinking本质是通过行动完成推理，环境从配角成核心研究对象，训练与推理需解耦，环境稳定性、真实性等成为关键能力。未来将从训练模型走向训练系统，多智能体组织与Harness工程成核心，环境构建成智能体能力栈一部分。

标签: #research

摘录｜林俊旸大佬的From reasoning thinking to agentic thinking