过去,人工智能产业的竞争焦点在于“谁拥有最先进的模型”。模型参数、推理能力以及在各类基准测试中的排名,几乎构成了所有AI公司发布会的全部内容。无论是OpenAI、Anthropic,还是智谱、MiniMax、月之暗面,它们在介绍自身时都遵循着相似的叙事模式:模型越智能,公司价值就越高。这是第一代大型模型公司的普遍认知。

然而,这种叙事正在发生转变。以MiniMax M3的发布为例,其最引人注目的内容不再仅仅是模型本身的能力,而是BrowserComp、SWE Bench、Terminal Bench、OSWorld、MCP Atlas等一系列新的评估维度。这些评估的共同特点是,它们不再关注模型“知道什么”,而是转向模型“能够完成什么”。

许多人将这种转变解读为“Agent”能力的体现。但若将时间线拉长,M3更值得关注之处在于MiniMax对其自身价值的重新定义。该公司正试图回答一个此前行业鲜少认真探讨的问题:一家AI公司真正销售的到底是什么?

第一代AI公司,出售的是“智能”

过去几年,竞争逻辑非常直接:模型能力即产品,基准测试即价值。MMLU、GSM8K、HumanEval、LiveCodeBench等测试,不仅是技术检验,更被视为市场认可的价值衡量标准。如同CPU有SPEC、GPU有MLPerf、数据库有TPC一样,成熟的产业需要统一的标准来评估产品价值、指导采购决策,并帮助资本形成共识。因此,参数规模或排行榜上的位置,成为了市场理解AI公司最直接的途径,模型本身即是商品。

在MiniMax M3的发布中,一个容易被忽视的细节是,MiniMax花费了大量篇幅介绍另一类能力。SWE Bench、BrowserComp、Terminal Bench、OSWorld、MCP等测试,其共同点在于它们几乎不关心模型能否回答问题,而是关注模型能否修复真实世界的Bug、能否独立完成网页操作、能否调用开发环境、能否集成企业现有系统,以及能否完成一项完整的工作。

换言之,基准测试的评价对象发生了变化。过去评价的是“智能”,现在评价的是“任务完成度”。模型首次面临的是“岗位考核”,而非“知识考试”。这不仅仅是评测体系的改变,更是MiniMax向市场传递的一个信号:模型能力依然重要,但真正决定商业价值的将是工作能力。

MiniMax为何开始强调“工作”?

过去,大型模型的首要客户是开发者,他们购买的是模型的能力,关心的是模型的智能程度和解决复杂问题的能力。但对于企业而言,采购AI时很少关注模型在排行榜上的名次。企业更关心的是AI能帮助业务完成多少工作、减少多少人力、融入多少流程、提升多少效率。

因此,产品表达也随之改变。Browser不再仅仅是浏览器的能力,而是融入办公流程;Coding不只是代码生成,而是进入研发流程;Terminal不只是Linux命令,而是进入开发环境;MCP也不只是协议,而是集成到企业已有的软件系统。将这些能力整合起来看,MiniMax展示的并非单一模型,而是一套工作流能力。

从Token到Workflow

很多人仍将AI公司视为API提供商,收入主要来源于Token消耗。调用次数越多,收入越高,这是第一代AI的商业模式。然而,一种新的趋势正在显现:越来越多的企业购买AI,并非为了获得更多回答,而是为了完成更多工作。修复一个Bug、整理一次会议、处理一张工单、分析一份合同、完成一次网页操作,价值的衡量单位正在发生变化。过去,一次调用对应一个Answer;如今,一次调用越来越对应一项Task。

MiniMax M3的产品设计也日益围绕这一逻辑展开。模型正在成为底层基础,而Workflow成为产品。将M3置于整个行业背景下,它代表了一种新的产品叙事。越来越多的AI公司开始证明其“工作能力”。这种变化并非MiniMax独有。Claude Code强调开发工作流;OpenAI的Operator和Computer Use关注任务执行;Google不断强化Gemini在Workspace和浏览器中的协同能力。整个行业正在围绕一个新的竞争单位展开:Workflow和Productivity。

为何这种变化值得资本关注?

资本市场真正关心的是技术如何转化为持续收入,而非技术领先本身。模型能力可以构建技术壁垒,但Workflow更容易构建商业壁垒。一旦工作流嵌入企业,就意味着数据沉淀、流程绑定、员工习惯以及系统集成。这些都将带来更高的续费率、更强的客户粘性以及更稳定的商业模式。

因此,越来越多的AI公司开始将其产品叙事从模型能力转向工作能力。这并非放弃模型,而是在模型之外寻找更长期的价值来源。从更宏观的角度看,M3最值得关注的并非某项基准测试,而是MiniMax对未来竞争对手的重新定义:从其他模型公司,转变为企业工作入口、浏览器、IDE、Office、ERP、CRM等。企业的数据不会沉淀在一次聊天中,而是最终沉淀在日常工作流里。谁能进入更多工作流,谁就拥有更强的商业基础。

从这个意义上说,MiniMax未来面对的竞争对手,不仅包括OpenAI或Anthropic,更包括所有定义企业工作方式的软件平台。

尾声:一家AI公司价值重构的开端

如果说过去的大模型竞争围绕“智能”展开,那么MiniMax M3所展示的是另一种竞争逻辑。模型依然重要,但正从产品转变为基础设施。真正走到台前的是模型如何进入企业、连接软件、完成工作。对于MiniMax而言,这或许比一次Benchmark排名更为关键,因为它意味着公司开始尝试回答一个新的问题:当模型能力逐渐趋同,一家AI公司还能依靠什么建立长期价值?

M3给出的答案,不是更多参数或排行榜,而是更多真实工作的完成。这或许也是AI行业进入下一阶段最重要的信号。未来,决定一家AI公司价值的,将不只是模型有多聪明,而是它能帮助企业重新组织多少生产力。