Ajax Zhan's Blog

Welcome!This is Ajaxzhan.
坚信:品味优先于执行,价值驱动下创造、系统工程保安全
持续跟进AI前沿研究,持续思考技术、产品与思维。

解一个问题,然后在解这个问题的过程中学习和探索,不断获得环境反馈和奖励信号,然后调整自己的策略,更新自己的“激活知识”,整个过程是一个探险的过程。不管解不解得出来,整个过程都更新了“激活参数”,锻炼了肌肉,将主体往正向状态拉。

一种错误的思维方式是:想要一次性解决一个问题,想要直接追求结果奖励,企图通过现有的知识将整个问题给覆盖住。整个过程尽管会不断的试错,但都是无用功,只会不断的探索错误路径,单纯做 sampling 而不做learning,逐渐陷入死循环,感到绝望。

最近越来越发现心态的重要性。要把自己从第二种错误思维方式纠正过来。

Kimi K2.6使用下来太失望了,今天一直并行开发/修复三个小项目,没有一个能正常做好。

第一个是卡在Dockerfile不会修,重复迭代给反馈了4-5次都没解决,CodeX一下子就解决了。

第二个是让他写一个Obsidian同步插件,也是疯狂出问题,给截图给反馈就是修复不好,真的是把我蠢到了,估计还不如DeepSeek-V4,本来是看着他有多模态才买的套餐,失望了。

第三个让美化一下UI,跑了2个多小时,美化的点我基本看不出来。

总结:Kimi K2.6比较拉,远不如CodeX,但是Token卖的并不便宜。。。

Kimi Code不如CodeX好用,今晚一个Dockerfile的问题解决了好几轮都没好,一般来说CodeX这种问题交互个2-3轮就好了。可见Agent好不好用还有一个关键问题——能否分析日志后fix bug以及在多轮迭代中找出真正bug的能力,而不是仅仅是搭建一些前后端代码的事情。Kimi在这方面显然不如CodeX,出现问题的次数和频率比较高。

1、Context浪费与Harness的重要性:(1)OpenClaw带来的问题:Context管理一塌糊涂,Token浪费十分严重。Claude Code则通过大量的工程优化提升了Token利用率。(2)外部工具的可靠性决定Agent是否经常试错,决定了Context利用效率。

2、Agent互联网的特点:(1)工具调用是高频、短请求、高并发的特点。(2)Agent上网不一定有合适的“CDN”,导致资源的不可缓存与浪费(3)缺乏针对Agent的身份鉴权机制。相关创业思考:(1)时间窗口很短,估计5-10年成型。(2)市场规模很大,Agent带来的算力消耗是巨大的。

酒神时代诚不我欺,Claude code源码泄漏,今天一堆公众号在讨论和分析,算是今年的一个必学项目了,在我看来这比龙虾关键多了,现在还有多少人讨论龙虾?好可怕的迭代速度。

这是AI时代,也是一个酒神时代——新技术、新产品、新SOTA层出不穷,从传统大厂到创业公司到OPC到每个个体——每个人都在拼了命想赶上这波浪潮。

神奇的是,在感性和理性的拉扯中,我的理性在这一个月里面变得淡了许多,几乎没有占据过主导地位,感性倒是久不散去,给我带来了许多欢乐和痛苦。

只需要将VPN改成虚拟网卡模式,再打开Cursor的HTTP2.0模式就不会有模型被拦截的问题了,很神奇。解决了HTTP1.1网络环境太差的问题。

最近开始意识到一种很重要的能力——幽默,当然这种幽默不仅仅是对别人,更多是对自己的一种幽默。如果一个人都无法进行自嘲和对生活中的事情进行解构,那么这个人绝对会获得特别痛苦和憋屈,更不用说会产生什么有价值的思考了。所以保持一种对自己冷幽默的态度还是很重要。

兼具深度与启发性的分析,能有效帮助培养更敏锐的Research Taste:关于大海捞针是一个很好的评估长上下文的指标——https://www.zhihu.com/question/654570878/answer/1965228622118888157

From Vibe Coding to SDD:用 Spec-Driven Development 重构AI 编程工作流

本文探讨了AI编程中“氛围编程”的局限。这种方式仅凭模糊提示快速生成代码,却常导致开发者陷入难以维护的“氛围调试”困境。为此,文章提出“规范驱动开发”(SDD)作为解决方案。 SDD强调在编码前先创建详细、结构化、可执行的规范(Spec),将其作为AI的核心输入和“单一事实来源”。这能将不确定的“概率性抽奖”转变为高质量的“确定性工程”,确保AI生成代码的可靠性与一致性。通过AGENTS.md等工具实践,SDD不仅解决了AI在复杂项目中理解不足的问题,更推动开发者角色从代码生产者,转变为驾驭AI的系统架构师与质量审查者。

Python现代项目管理:从 venv 到 uv

本文系统梳理了Python项目管理工具从`venv`、`conda`到新兴工具`uv`的演进。`venv`轻量原生,适合单人项目,但依赖管理能力有限。`conda`能管理Python及系统级依赖,是科学计算的利器,但部署相对笨重。而基于Rust的`uv`速度极快,通过`pyproject.toml`实现现代化的项目依赖管理与锁定,更适配团队协作与工程化需求。文章强调,`pyproject.toml`已成为现代Python项目的核心配置标准,统一了项目构建、依赖声明及工具配置。

本地Git多身份配置

为应对论文评审、开源贡献等场景需在同一机器配置两个Git身份:实名与匿名。本文推荐“全局实名+局部匿名”策略,即通过`git config --global`设置默认身份,再在特定仓库内用`git config`局部覆盖。同时,为匿名身份生成独立SSH密钥,并配置`~/.ssh/config`文件创建专属Host别名(如`github-anon`),最后在匿名项目中使用该别名设置远程地址,即可实现身份隔离与安全管理。该方法利用Git配置层级和SSH别名,清晰、安全地解决了多身份切换需求。

Vibe Coding最佳实践

本文介绍了“Vibe Coding”这一以AI为核心编码主力、人类聚焦于需求定义、项目管理等高价值环节的协同工作模式。文章分享了其最佳实践:强调编码前先规划并沉淀文档以建立AI的长期记忆;主张用脚本和配置固化确定性流程,提升系统可靠性;倡导小步迭代以便评审与学习;并分享了手动管理AI上下文的技巧。作者最后指出,AI时代的工程师需掌握结构化表达、系统思维等元技能,其角色正从“写代码”转向“设计系统、拆解任务、验收成果”。

大模型显存占用分析:训练与推理

本文聚焦大模型底层显存占用与推理优化,核心涵盖训练与推理两阶段分析。训练时显存主要由模型参数、优化器、激活值、梯度值构成,其中优化器(如AdamW的梯度指数平滑值、梯度平方指数平滑值、参数值)占用最大,混合精度下llama13b训练显存可达222.5GB,LoRA通过冻结主体参数、仅优化低秩矩阵显著节约显存。推理阶段引入KV Cache缓存历史token的k、v向量,避免重复计算,使flops基本恒定;显存开销源于模型参数与KV Cache,时间分预填充(TTFT)与解码(TPOT)阶段,受GPU算力与HBM速率影响,如llama-7B解码阶段TPOT约9.3ms。

如何定期备份MySQL数据库

本文介绍了MySQL数据库定时备份的三种方法:Linux/Unix系统可通过`mysqldump`命令编写备份脚本,结合cron定时任务实现;Windows系统可使用任务计划程序执行批处理脚本;Spring Boot项目则可通过`@Scheduled`注解实现定时备份。关键注意事项包括:确保备份脚本权限安全,定期验证备份完整性,将备份文件存储到远程位置避免单点故障。建议在低峰期执行备份以减少性能影响,或专门开一个服务负责备份任务,保障数据安全。

深度学习中的数学:香农熵、交叉熵、KL散度

本文围绕香农熵、交叉熵与KL散度的关联展开,旨在帮助理解KL散度这一大模型强化学习中的核心概念。信息量用-log表示,小概率事件信息量更大;香农熵是概率分布的平均信息量,描述不确定性,均匀分布熵大、聚拢分布熵小。交叉熵为估计分布q对真实分布p的平均信息量估计,通常大于等于香农熵,分布越接近越趋近。KL散度量化两分布差异,定义为交叉熵减香农熵,具有非负(仅相等时为0)、不对称(非距离)性质,最小化KL散度等价于最小化交叉熵,故交叉熵可用于损失函数。另一理解角度:基于P采样,比较两分布下概率相近程度可判断分布相似度。

心经的六度修行:雕刻自己,关注自我成长

本文分享了《金刚经》中的“六度”修行法门,将其视为一种引导人从烦恼此岸到达智慧彼岸的生活方法论。六度包括:布施,即从“要”到“给”的心态转变;持戒,即有所不为,规范自身;忍辱,即面对逆境的智慧与勇气;精进,即纯粹不懈的努力;禅定,即专注调心以求澄澈;般若,即看透事物本质的根本智慧。作者强调,这并非抽象教义,而是实在的生活态度,旨在通过自我雕琢,关注内心成长,从而实现内心的平静。

如何构建高质量代码相关基准数据集

本文聚焦代码相关基准数据集构建,香港科技大学Jialun CAO博士通过分析10年内274个基准,发现普遍存在样本重复、错误参考代码、未处理敏感信息等问题。为此提出55条标准清单,并系统阐述基准开发的五阶段生命周期:设计阶段需明确动机、范围与能力;构建阶段需规范数据收集、预处理与验证;验证阶段需确保模型选择、参数配置与环境一致性;分析阶段需评估难度、可区分度与稳定性;发布阶段需保障材料可访问性与开源规范。该研究为研究人员提供了构建高质量、高可靠、可复现基准的实用指南,助力规避常见问题,提升研究严谨性。

书途漫记1:头脑安静下来,内心却充满热情

本文基于克里希那穆提《生命之书》的阅读感悟,探讨“活在当下”的实践误区:过度强调“当下”易使其沦为概念,反而远离实相。作者指出,实相无路径可循,唯有心脑单纯清晰时才会自然降临;而真正的自在,需成为“无标签的人”——不依附外在定义,保持内在自察的精神内核。最后强调,觉知实相的状态,是头脑安静却内心充满热情,如熏风、阳光般不请自来。