瞬间
记录生活中的点点滴滴
解一个问题,然后在解这个问题的过程中学习和探索,不断获得环境反馈和奖励信号,然后调整自己的策略,更新自己的“激活知识”,整个过程是一个探险的过程。不管解不解得出来,整个过程都更新了“激活参数”,锻炼了肌肉,将主体往正向状态拉。
一种错误的思维方式是:想要一次性解决一个问题,想要直接追求结果奖励,企图通过现有的知识将整个问题给覆盖住。整个过程尽管会不断的试错,但都是无用功,只会不断的探索错误路径,单纯做 sampling 而不做learning,逐渐陷入死循环,感到绝望。
最近越来越发现心态的重要性。要把自己从第二种错误思维方式纠正过来。
Kimi K2.6使用下来太失望了,今天一直并行开发/修复三个小项目,没有一个能正常做好。
第一个是卡在Dockerfile不会修,重复迭代给反馈了4-5次都没解决,CodeX一下子就解决了。
第二个是让他写一个Obsidian同步插件,也是疯狂出问题,给截图给反馈就是修复不好,真的是把我蠢到了,估计还不如DeepSeek-V4,本来是看着他有多模态才买的套餐,失望了。
第三个让美化一下UI,跑了2个多小时,美化的点我基本看不出来。
总结:Kimi K2.6比较拉,远不如CodeX,但是Token卖的并不便宜。。。
Kimi Code不如CodeX好用,今晚一个Dockerfile的问题解决了好几轮都没好,一般来说CodeX这种问题交互个2-3轮就好了。可见Agent好不好用还有一个关键问题——能否分析日志后fix bug以及在多轮迭代中找出真正bug的能力,而不是仅仅是搭建一些前后端代码的事情。Kimi在这方面显然不如CodeX,出现问题的次数和频率比较高。
1、Context浪费与Harness的重要性:(1)OpenClaw带来的问题:Context管理一塌糊涂,Token浪费十分严重。Claude Code则通过大量的工程优化提升了Token利用率。(2)外部工具的可靠性决定Agent是否经常试错,决定了Context利用效率。
2、Agent互联网的特点:(1)工具调用是高频、短请求、高并发的特点。(2)Agent上网不一定有合适的“CDN”,导致资源的不可缓存与浪费(3)缺乏针对Agent的身份鉴权机制。相关创业思考:(1)时间窗口很短,估计5-10年成型。(2)市场规模很大,Agent带来的算力消耗是巨大的。
酒神时代诚不我欺,Claude code源码泄漏,今天一堆公众号在讨论和分析,算是今年的一个必学项目了,在我看来这比龙虾关键多了,现在还有多少人讨论龙虾?好可怕的迭代速度。
这是AI时代,也是一个酒神时代——新技术、新产品、新SOTA层出不穷,从传统大厂到创业公司到OPC到每个个体——每个人都在拼了命想赶上这波浪潮。
神奇的是,在感性和理性的拉扯中,我的理性在这一个月里面变得淡了许多,几乎没有占据过主导地位,感性倒是久不散去,给我带来了许多欢乐和痛苦。
只需要将VPN改成虚拟网卡模式,再打开Cursor的HTTP2.0模式就不会有模型被拦截的问题了,很神奇。解决了HTTP1.1网络环境太差的问题。
最近开始意识到一种很重要的能力——幽默,当然这种幽默不仅仅是对别人,更多是对自己的一种幽默。如果一个人都无法进行自嘲和对生活中的事情进行解构,那么这个人绝对会获得特别痛苦和憋屈,更不用说会产生什么有价值的思考了。所以保持一种对自己冷幽默的态度还是很重要。
兼具深度与启发性的分析,能有效帮助培养更敏锐的Research Taste:关于大海捞针是一个很好的评估长上下文的指标——https://www.zhihu.com/question/654570878/answer/1965228622118888157