软件行业思考｜Agent 时代的兴奋与冷静、GUI和CLI之争

最近读了真格基金钟天杰的《我们也许不该再投资 GUI 思维的软件公司》，我第一感受是兴奋——它提供了一个锋利的框架来理解正在发生的变化。但第二感受是警觉：这种锋利是否也遮蔽了一些复杂现实？

作者的逻辑链条

让我先梳理文章的核心逻辑。

人类的工作被抽象为「长程目标」任务，销售盯成交、采购控成本——这些目标在入职时就被定义好，并在执行过程中不断微调。Agent 的运行结构与此完全一致：被分配长程目标、调用资源、完成任务。所以人类和 Agent 的区别可能只在硬件：人类是效率更低的 Agent，注意力带宽极窄，工作记忆极浅，需要持续的视觉锚点才能维持任务状态。

这个硬件缺陷在过去几十年催生了一个庞大的软件产业，而现在这个前提正在被推翻。GUI 的存在本质上是一个补偿系统。Figma 的精美、Notion 的简洁、Linear 的流畅——这些设计溢价的本质不是提升效率，而是让人类更愿意盯着屏幕。人类对 GUI 的需求，包括「用户体验」行业的繁荣，不是因为 GUI 好，恰恰是围绕人类硬件局限性的商业化。那些被归入效率工具类目的软件产品，实则享受的是注意力经济的红利。以用户体验为护城河的软件公司，都是注意力公司的变体，它们将竞争优势建立在人类认知局限性上。一旦用户不是人类，这种竞争优势就会归零。

四重需求框架

那么 Agent 时代的产品应该是什么样？文章提出了一个四重需求框架：信息获取、信任授权、决策判断、算力执行。这四样东西都不在软件「里面」，而在软件「边界上」。Agent 时代的软件要主动把自己暴露出去、让 Agent 路过时必须调用。这意味着软件竞争方向的彻底反转——旧逻辑是建一个封闭空间，让用户走进来，用体验把他留住；新逻辑是把自己暴露出去，站在 Agent 执行长程目标的路径上，让它经过时不得不调用你。

这让我重新思考「协议即软件」这个概念。协议完全不在乎界面是否好看，协议需要稳定、可靠、无处不在。产品竞争靠更好看、更好用、更有品牌溢价；协议竞争靠更早成为标准。最有价值的软件公司，是那些成为 Agent 工作流里默认协议的公司。目前对协议本身的评价体系几乎还是一片空白，我们仍然只能依靠人类能感知的环境来评价一个协议是否靠谱，这显然需要改变。

GUI变成内容产品

2026 年初，Google Workspace、Salesforce、Atlassian、Obsidian、Polymarket 等主流软件公司相继官宣支持和开发 CLI 和官方 MCP 服务。Stripe、Cloudflare、Supabase、Sentry、Vercel 等已有 CLI 界面的企业主动面向 Agents 提供官方 skills。这些公司过去花了数十亿美元打磨 GUI，而现在他们在主动绕开它。

与此同时，作者认为移动互联网时代同时维护 PC 版和 Mobile 版的团队往往两个都做不好，现在完全一样。同时维护 GUI 和 Agent-Native 接口是一种资源的浪费，把核心资源投在 CLI、API、官方 Skills 上，真正的用户在那里。

GUI 在 Agent 时代的价值是满足人类对长程目标运行的掌控感——一种情绪价值。它从执行工具降级成为控制面板，仍然有价值，但会变成标配，不构成护城河。大幅降低的研发成本让 GUI 产品变成了一种内容产品，和生产一条短视频、一篇图文笔记没有本质区别。

“我们也许正在见证人类商业文明的一次范式转移——从以人类作为主力执行者，转向以 Agent 作为主力执行者。这需要重新思考所有的组织形态、重新思考每一种生产任务、协作任务、娱乐任务的最佳实践路径。Agent 原生的网络里，一切才刚刚开始。”

冷静后的思考

文章的框架很有冲击力，但有几个问题值得冷静思考。

Agent 真的能独立完成长程任务吗？

文章假设 Agent 可以像人类一样被分配目标并独立执行，但这个假设跳过了一些关键问题。Agent 犯错谁来兜底？权限和责任如何划分？你真的放心让 Agent 去做采购决策吗？

这些问题不是简单的「情绪价值」可以概括的。人类在长程任务中不仅仅是执行者，还是责任承担者和异常处理者。当供应链出了问题，当合同条款有歧义，当需要现场判断供应商的可靠性——这些场景需要的不仅是计算能力，还有社会经验、政治敏感度和责任承担意愿。

更现实的情况可能是：Agent 和人类形成分工，Agent 处理结构化、可验证的子任务，人类保留决策权和责任兜底。这不是「GUI 降级为控制面板」这么简单，而是人机协作模式的重新定义。

对 GUI 的贬低是否过分了？

文章把 GUI 定义为「人类认知缺陷的补丁」，这种表述很有冲击力，但也可能过度简化了。GUI 的价值不仅仅是「让人类更愿意盯着屏幕」，它还承载着信息架构、认知负荷管理和协作共识的功能。

一个精心设计的界面，本质上是对复杂系统的建模和抽象。它帮助人类建立心智模型，理解系统的状态和边界。即使 Agent 成为主要执行者，人类仍然需要理解系统在做什么、为什么这么做、以及如何在必要时介入。这种「可理解性」不是情绪价值，而是系统可信度的组成部分。

退一步说，即使 Agent 成为主力执行者，不同 Agent 之间、Agent 与人类之间，仍然需要交互界面。这个界面可能不是传统的 GUI，但「如何让智能体理解彼此」仍然是一个界面设计问题，只是对象从人类变成了 Agent。

「协议即软件」是老问题还是新课题？

文章提出「协议即软件」的转向，认为 Agent 时代软件的竞争标准变成了稳定、可靠、无处不在。但这其实一直是软件工程的核心课题。

构建稳定可靠的系统，面临的是分布式系统的经典挑战：一致性、可用性、分区容错性的权衡；版本兼容性；依赖管理；故障隔离和恢复。这些挑战不会因为执行者变成 Agent 就消失，反而可能因为 Agent 的自主性而变得更加复杂——Agent 可能会做出不可预期的调用组合，产生 emergent behavior。

Agent 时代真正的新变化可能是：系统需要为「不可预测但合理」的使用方式设计。传统的 API 设计假设人类开发者会按照文档使用，而 Agent 可能会基于上下文推理出文档没有明确说明的用法。这要求协议不仅是「稳定可靠」，还要是「可推理的」——Agent 能从接口定义中推断出语义和边界，而不仅仅是调用签名。

最后

这篇文章的价值在于提出了一个大胆的框架，让我们重新审视软件的本质。但技术的演进很少是线性的替代，更多的是复杂的共存和演化。GUI 不会消失，只是形态会变化；Agent 不会完全替代人类，而是会重新定义人机分工；协议的重要性一直被低估，但让它真正发挥价值需要解决的还是那些老问题——只是难度和规模变了。

在 Agent 原生的网络里，一切确实才刚刚开始。但开始意味着不确定性，而不是确定性。

原文：https://mp.weixin.qq.com/s/NZSPWSvQoonU0XK7t2Jt6w