最近读了真格基金钟天杰的《我们也许不该再投资 GUI 思维的软件公司》,我第一感受是兴奋——它提供了一个锋利的框架来理解正在发生的变化。但第二感受是警觉:这种锋利是否也遮蔽了一些复杂现实?

作者的逻辑链条

让我先梳理文章的核心逻辑。

人类的工作被抽象为「长程目标」任务,销售盯成交、采购控成本——这些目标在入职时就被定义好,并在执行过程中不断微调。Agent 的运行结构与此完全一致:被分配长程目标、调用资源、完成任务。所以人类和 Agent 的区别可能只在硬件:人类是效率更低的 Agent,注意力带宽极窄,工作记忆极浅,需要持续的视觉锚点才能维持任务状态

这个硬件缺陷在过去几十年催生了一个庞大的软件产业,而现在这个前提正在被推翻。GUI 的存在本质上是一个补偿系统。Figma 的精美、Notion 的简洁、Linear 的流畅——这些设计溢价的本质不是提升效率,而是让人类更愿意盯着屏幕。人类对 GUI 的需求,包括「用户体验」行业的繁荣,不是因为 GUI 好,恰恰是围绕人类硬件局限性的商业化。那些被归入效率工具类目的软件产品,实则享受的是注意力经济的红利。以用户体验为护城河的软件公司,都是注意力公司的变体,它们将竞争优势建立在人类认知局限性上。一旦用户不是人类,这种竞争优势就会归零。

四重需求框架

那么 Agent 时代的产品应该是什么样?文章提出了一个四重需求框架信息获取、信任授权、决策判断、算力执行。这四样东西都不在软件「里面」,而在软件「边界上」。Agent 时代的软件要主动把自己暴露出去、让 Agent 路过时必须调用。这意味着软件竞争方向的彻底反转——旧逻辑是建一个封闭空间,让用户走进来,用体验把他留住;新逻辑是把自己暴露出去,站在 Agent 执行长程目标的路径上,让它经过时不得不调用你

这让我重新思考「协议即软件」这个概念。协议完全不在乎界面是否好看,协议需要稳定、可靠、无处不在。产品竞争靠更好看、更好用、更有品牌溢价;协议竞争靠更早成为标准。最有价值的软件公司,是那些成为 Agent 工作流里默认协议的公司。目前对协议本身的评价体系几乎还是一片空白,我们仍然只能依靠人类能感知的环境来评价一个协议是否靠谱,这显然需要改变。

GUI变成内容产品

2026 年初,Google Workspace、Salesforce、Atlassian、Obsidian、Polymarket 等主流软件公司相继官宣支持和开发 CLI 和官方 MCP 服务。Stripe、Cloudflare、Supabase、Sentry、Vercel 等已有 CLI 界面的企业主动面向 Agents 提供官方 skills。这些公司过去花了数十亿美元打磨 GUI,而现在他们在主动绕开它。

与此同时,作者认为移动互联网时代同时维护 PC 版和 Mobile 版的团队往往两个都做不好,现在完全一样。同时维护 GUI 和 Agent-Native 接口是一种资源的浪费,把核心资源投在 CLI、API、官方 Skills 上,真正的用户在那里。

GUI 在 Agent 时代的价值是满足人类对长程目标运行的掌控感——一种情绪价值。它从执行工具降级成为控制面板,仍然有价值,但会变成标配,不构成护城河。大幅降低的研发成本让 GUI 产品变成了一种内容产品,和生产一条短视频、一篇图文笔记没有本质区别。

“我们也许正在见证人类商业文明的一次范式转移——从以人类作为主力执行者,转向以 Agent 作为主力执行者。这需要重新思考所有的组织形态、重新思考每一种生产任务、协作任务、娱乐任务的最佳实践路径。Agent 原生的网络里,一切才刚刚开始。”

冷静后的思考

文章的框架很有冲击力,但有几个问题值得冷静思考。

Agent 真的能独立完成长程任务吗?

文章假设 Agent 可以像人类一样被分配目标并独立执行,但这个假设跳过了一些关键问题。Agent 犯错谁来兜底?权限和责任如何划分?你真的放心让 Agent 去做采购决策吗?

这些问题不是简单的「情绪价值」可以概括的。人类在长程任务中不仅仅是执行者,还是责任承担者和异常处理者。当供应链出了问题,当合同条款有歧义,当需要现场判断供应商的可靠性——这些场景需要的不仅是计算能力,还有社会经验、政治敏感度和责任承担意愿。

更现实的情况可能是:Agent 和人类形成分工,Agent 处理结构化、可验证的子任务,人类保留决策权和责任兜底。这不是「GUI 降级为控制面板」这么简单,而是人机协作模式的重新定义。

对 GUI 的贬低是否过分了?

文章把 GUI 定义为「人类认知缺陷的补丁」,这种表述很有冲击力,但也可能过度简化了。GUI 的价值不仅仅是「让人类更愿意盯着屏幕」,它还承载着信息架构、认知负荷管理和协作共识的功能。

一个精心设计的界面,本质上是对复杂系统的建模和抽象。它帮助人类建立心智模型,理解系统的状态和边界。即使 Agent 成为主要执行者,人类仍然需要理解系统在做什么、为什么这么做、以及如何在必要时介入。这种「可理解性」不是情绪价值,而是系统可信度的组成部分。

退一步说,即使 Agent 成为主力执行者,不同 Agent 之间、Agent 与人类之间,仍然需要交互界面。这个界面可能不是传统的 GUI,但「如何让智能体理解彼此」仍然是一个界面设计问题,只是对象从人类变成了 Agent。

「协议即软件」是老问题还是新课题?

文章提出「协议即软件」的转向,认为 Agent 时代软件的竞争标准变成了稳定、可靠、无处不在。但这其实一直是软件工程的核心课题。

构建稳定可靠的系统,面临的是分布式系统的经典挑战:一致性、可用性、分区容错性的权衡;版本兼容性;依赖管理;故障隔离和恢复。这些挑战不会因为执行者变成 Agent 就消失,反而可能因为 Agent 的自主性而变得更加复杂——Agent 可能会做出不可预期的调用组合,产生 emergent behavior。

Agent 时代真正的新变化可能是:系统需要为「不可预测但合理」的使用方式设计。传统的 API 设计假设人类开发者会按照文档使用,而 Agent 可能会基于上下文推理出文档没有明确说明的用法。这要求协议不仅是「稳定可靠」,还要是「可推理的」——Agent 能从接口定义中推断出语义和边界,而不仅仅是调用签名。

最后

这篇文章的价值在于提出了一个大胆的框架,让我们重新审视软件的本质。但技术的演进很少是线性的替代,更多的是复杂的共存和演化。GUI 不会消失,只是形态会变化;Agent 不会完全替代人类,而是会重新定义人机分工;协议的重要性一直被低估,但让它真正发挥价值需要解决的还是那些老问题——只是难度和规模变了。

在 Agent 原生的网络里,一切确实才刚刚开始。但开始意味着不确定性,而不是确定性。


原文:https://mp.weixin.qq.com/s/NZSPWSvQoonU0XK7t2Jt6w