Ajax Zhan's Blog

Welcome！This is Ajaxzhan.
坚信：品味优先于执行，价值驱动下创造、系统工程保安全
持续跟进AI前沿研究，持续思考技术、产品与思维。

解一个问题，然后在解这个问题的过程中学习和探索，不断获得环境反馈和奖励信号，然后调整自己的策略，更新自己的“激活知识”，整个过程是一个探险的过程。不管解不解得出来，整个过程都更新了“激活参数”，锻炼了肌肉，将主体往正向状态拉。

一种错误的思维方式是：想要一次性解决一个问题，想要直接追求结果奖励，企图通过现有的知识将整个问题给覆盖住。整个过程尽管会不断的试错，但都是无用功，只会不断的探索错误路径，单纯做 sampling 而不做learning，逐渐陷入死循环，感到绝望。

最近越来越发现心态的重要性。要把自己从第二种错误思维方式纠正过来。

Kimi K2.6使用下来太失望了，今天一直并行开发/修复三个小项目，没有一个能正常做好。

第一个是卡在Dockerfile不会修，重复迭代给反馈了4-5次都没解决，CodeX一下子就解决了。

第二个是让他写一个Obsidian同步插件，也是疯狂出问题，给截图给反馈就是修复不好，真的是把我蠢到了，估计还不如DeepSeek-V4，本来是看着他有多模态才买的套餐，失望了。

第三个让美化一下UI，跑了2个多小时，美化的点我基本看不出来。

总结：Kimi K2.6比较拉，远不如CodeX，但是Token卖的并不便宜。。。

Kimi Code不如CodeX好用，今晚一个Dockerfile的问题解决了好几轮都没好，一般来说CodeX这种问题交互个2-3轮就好了。可见Agent好不好用还有一个关键问题——能否分析日志后fix bug以及在多轮迭代中找出真正bug的能力，而不是仅仅是搭建一些前后端代码的事情。Kimi在这方面显然不如CodeX，出现问题的次数和频率比较高。

1、Context浪费与Harness的重要性：（1）OpenClaw带来的问题：Context管理一塌糊涂，Token浪费十分严重。Claude Code则通过大量的工程优化提升了Token利用率。（2）外部工具的可靠性决定Agent是否经常试错，决定了Context利用效率。

2、Agent互联网的特点：（1）工具调用是高频、短请求、高并发的特点。（2）Agent上网不一定有合适的“CDN”，导致资源的不可缓存与浪费（3）缺乏针对Agent的身份鉴权机制。相关创业思考：（1）时间窗口很短，估计5-10年成型。（2）市场规模很大，Agent带来的算力消耗是巨大的。

酒神时代诚不我欺，Claude code源码泄漏，今天一堆公众号在讨论和分析，算是今年的一个必学项目了，在我看来这比龙虾关键多了，现在还有多少人讨论龙虾？好可怕的迭代速度。

这是AI时代，也是一个酒神时代——新技术、新产品、新SOTA层出不穷，从传统大厂到创业公司到OPC到每个个体——每个人都在拼了命想赶上这波浪潮。

神奇的是，在感性和理性的拉扯中，我的理性在这一个月里面变得淡了许多，几乎没有占据过主导地位，感性倒是久不散去，给我带来了许多欢乐和痛苦。

只需要将VPN改成虚拟网卡模式，再打开Cursor的HTTP2.0模式就不会有模型被拦截的问题了，很神奇。解决了HTTP1.1网络环境太差的问题。

最近开始意识到一种很重要的能力——幽默，当然这种幽默不仅仅是对别人，更多是对自己的一种幽默。如果一个人都无法进行自嘲和对生活中的事情进行解构，那么这个人绝对会获得特别痛苦和憋屈，更不用说会产生什么有价值的思考了。所以保持一种对自己冷幽默的态度还是很重要。

兼具深度与启发性的分析，能有效帮助培养更敏锐的Research Taste：关于大海捞针是一个很好的评估长上下文的指标——https://www.zhihu.com/question/654570878/answer/1965228622118888157

2026-06-02

AI软件工程范式革命的思考

本文指出软件工程过去五十年未真正实现工程化，核心在于未能将人脑认知固化。大模型首次实现“能源换高阶智能”，推动软件工程从“人为中心”转向“AI为中心”，但也带来模型不确定性。工程化需通过确定性裁判（如编译器、测试系统）强制验证AI输出，形成“AI自我纠偏+人拉回偏差”的闭环。人将退守至价值定义、边界守卫等高阶角色，落地需闭环优先、隐性知识蒸馏。这场变革是软件工程成为真正工程学的范式革命，核心是构建AI驱动的认知工程系统。

2026-03-30

摘录｜林俊旸大佬的From reasoning thinking to agentic thinking

林俊旸博文指明reasoning与agentic thinking的未来研究方向。o1/R1启示RL是reasoning模型崛起的关键，需稳定可扩展的反馈信号；thinking与instruct合并难点在于数据分布差异，需融合形成推理强度连续谱。Anthropic强调思考应围绕目标负载（如编程、长时任务），而非冗长轨迹。Agentic Thinking本质是通过行动完成推理，环境从配角成核心研究对象，训练与推理需解耦，环境稳定性、真实性等成为关键能力。未来将从训练模型走向训练系统，多智能体组织与Harness工程成核心，环境构建成智能体能力栈一部分。

2026-03-19

软件行业思考｜Agent 时代的兴奋与冷静、GUI和CLI之争

钟天杰在《我们也许不该再投资GUI思维的软件公司》中提出，GUI本质是补偿人类认知局限性的注意力经济产物，而Agent时代软件需转向“信息获取、信任授权、决策判断、算力执行”四重需求，竞争逻辑从“吸引用户进入”变为“暴露在Agent路径上被调用”，核心是成为“协议即软件”的默认标准。但文章也冷静反思：Agent独立完成长程任务的责任归属、GUI对系统可理解性的价值、以及协议设计中“可推理性”的老挑战。这标志着从人类执行到Agent主力的范式转移，但演进更可能是复杂共存而非简单替代。

2026-03-15

日思｜Vibe Any时代下的学习｜以人为本、协同进步、第一性原理、综合能力

AI时代，信息获取即时化，“会写代码”等技能稀缺性消解，但学习底层逻辑未变，核心始终是“人”。需拒绝成为知识搬运工，转向人机协作共创：以自身理解外化输入AI，批判性审视输出，让知识沉淀为能力。学习方法上，宜项目驱动，结合Top-Down实践与Roadmap梳理，夯实核心基础；同时强化沟通、表达等综合能力，构筑AI时代护城河。本质而言，学习反人性，工具越强大，人的能动性越珍贵。选择权在个人：是做知识的搬运工，还是驾驭AI杠杆的进化者。

2026-03-12

商业思考｜SaaS 终结论、企业软件、代码质量危机、工程师分化

“SaaS终结论”存在逻辑断层：企业软件价值不在于代码复杂度，而在于对业务流程的深度理解、跨部门协调及长期维护，如Samsara需硬件集成与销售网络支撑。AI生成代码能力提升不会替代软件，反而可能因开发成本下降释放更多需求（类比杰文斯悖论）。企业规模差异显著：小团队效率提升与大企业系统定制、合规要求不可同日而语。AI还带来“垃圾代码”危机，需解决海量生成代码的质量管理问题。未来工程师将分化为“产品型”（快速构建）与“系统型”（保障质量），多产品捆绑或成AI时代核心防御策略，而非单一产品专注。

2026-03-12

大模型安全观察｜提示词注入的致命三角、自动化红队、防御困境、权限边界

Prompt注入并非传统漏洞，而是大模型理解上下文机制带来的固有风险，通常源于Agent同时拥有访问数据、接触不可信内容及外发能力。攻击手段已从直接指令进化为社会工程学误导，防御面临“攻击者后手”的困境，完美防御几乎不可能。因此，解决之道在于风险管理而非彻底消除：遵循最小权限原则，高风险操作需人工确认，并配合沙箱隔离与输出防御。我们应将AI视为不完全可信的实习生，通过限制权限构建有韧性的系统。

2026-02-03

阅读思考｜Agent Infra、Agent 心智模型、日抛型代码

随着AI Agent成为基础软件的主要使用者，软件设计需从用户本质转变出发。核心在于构建贴合经典心智模型（如文件系统、SQL）的系统，而非发明新接口；接口设计需满足自然语言描述意图、符号逻辑固化执行、交付确定性结果。AI Infra特征体现为“日抛型代码”的长尾需求、虚拟化实现的极致低成本，以及单位时间算力的高效撬动。商业模式上，成功企业更像放大千倍的云服务商，通过沉淀确定性能力将边际成本趋近于零。工程重点转向设计可被AI大规模低成本试错与复用的基础能力。

2026-01-16

Agent工程化｜Agent Infra、FUSE技术、Unix设计哲学、Bash Agent

本文探讨了如何通过"FS + Agent"架构将各类SaaS和数据服务统一抽象为文件系统，实现Agent的自动化操作。核心思想是利用Linux FUSE技术，将HTTP接口、数据库等数据源映射为虚拟文件系统，使Agent能够通过标准文件操作访问和管理各类服务。文章详细介绍了FUSE的工作原理，展示了其通过用户态进程实现文件系统接口的能力，并分析了FUSE与Sandbox的互补关系——前者提供数据抽象层，后者提供权限隔离层。AgentFS作为具体实现方案，采用写时复制机制确保数据安全，并支持多终端共享会话，为构建统一的Agent操作环境提供了可行的技术路径。

2026-01-04

工作流思考｜AI提效思考与Claude Code使用技巧

Boris Cherny的Claude Code使用技巧聚焦高效协作与AI杠杆最大化：并行运行本地及云端Agent实例提升产出，需技术基础支撑；团队共用并每周更新CLAUDE.md记录错误，通过代码审查让Agent迭代文件；采用计划模式优先架构设计，再落地代码；封装工作流为命令如commit-push-pr提效；设置质量验证环节确保代码质量。对比Cursor，Claude支持多工具调用、subagents及执行Hook（如代码检查、长时任务处理）。建议不跳过权限，用/permissions预批安全命令，并通过“AI意识”优先用AI解决理解偏差问题，避免低效卡顿。

2025-12-16

Git子目录迁移：如何将项目子目录迁移到另一个仓库并保留完整提交历史

本文介绍了如何使用 `git subtree` 命令，将一个项目中的子目录完整迁移到另一个独立仓库，并保留其全部提交历史。核心操作分为两步：首先，在源仓库使用 `git subtree split` 从指定子目录抽取历史，生成一个内容为该子目录的新分支；然后，在目标仓库通过 `git subtree add --prefix` 将此分支合并到指定目录下。该方法解决了直接复制粘贴丢失历史的问题，能优雅地整合两条独立的Git历史线，确保代码的演进轨迹完整可追溯，是项目重构与代码整合的最佳实践。

1 / 10 下一页