标签: #research

摘录|林俊旸大佬的From reasoning thinking to agentic thinking

林俊旸博文指明reasoning与agentic thinking的未来研究方向。o1/R1启示RL是reasoning模型崛起的关键,需稳定可扩展的反馈信号;thinking与instruct合并难点在于数据分布差异,需融合形成推理强度连续谱。Anthropic强调思考应围绕目标负载(如编程、长时任务),而非冗长轨迹。Agentic Thinking本质是通过行动完成推理,环境从配角成核心研究对象,训练与推理需解耦,环境稳定性、真实性等成为关键能力。未来将从训练模型走向训练系统,多智能体组织与Harness工程成核心,环境构建成智能体能力栈一部分。