MiniMax M3：一家AI公司，为什么开始重新定义自己的价值？

赛事聚焦

过去，人工智能产业的竞争焦点在于“谁拥有最先进的模型”。模型参数、推理能力以及在各类基准测试中的排名，几乎构成了所有AI公司发布会的全部内容。无论是OpenAI、Anthropic，还是智谱、MiniMax、月之暗面，它们在介绍自身时都遵循着相似的叙事模式：模型越智能，公司价值就越高。这是第一代大型模型公司的普遍认知。

然而，这种叙事正在发生转变。以MiniMax M3的发布为例，其最引人注目的内容不再仅仅是模型本身的能力，而是BrowserComp、SWE Bench、Terminal Bench、OSWorld、MCP Atlas等一系列新的评估维度。这些评估的共同特点是，它们不再关注模型“知道什么”，而是转向模型“能够完成什么”。

许多人将这种转变解读为“Agent”能力的体现。但若将时间线拉长，M3更值得关注之处在于MiniMax对其自身价值的重新定义。该公司正试图回答一个此前行业鲜少认真探讨的问题：一家AI公司真正销售的到底是什么？

第一代AI公司，出售的是“智能”

过去几年，竞争逻辑非常直接：模型能力即产品，基准测试即价值。MMLU、GSM8K、HumanEval、LiveCodeBench等测试，不仅是技术检验，更被视为市场认可的价值衡量标准。如同CPU有SPEC、GPU有MLPerf、数据库有TPC一样，成熟的产业需要统一的标准来评估产品价值、指导采购决策，并帮助资本形成共识。因此，参数规模或排行榜上的位置，成为了市场理解AI公司最直接的途径，模型本身即是商品。

在MiniMax M3的发布中，一个容易被忽视的细节是，MiniMax花费了大量篇幅介绍另一类能力。SWE Bench、BrowserComp、Terminal Bench、OSWorld、MCP等测试，其共同点在于它们几乎不关心模型能否回答问题，而是关注模型能否修复真实世界的Bug、能否独立完成网页操作、能否调用开发环境、能否集成企业现有系统，以及能否完成一项完整的工作。

换言之，基准测试的评价对象发生了变化。过去评价的是“智能”，现在评价的是“任务完成度”。模型首次面临的是“岗位考核”，而非“知识考试”。这不仅仅是评测体系的改变，更是MiniMax向市场传递的一个信号：模型能力依然重要，但真正决定商业价值的将是工作能力。

MiniMax为何开始强调“工作”？

过去，大型模型的首要客户是开发者，他们购买的是模型的能力，关心的是模型的智能程度和解决复杂问题的能力。但对于企业而言，采购AI时很少关注模型在排行榜上的名次。企业更关心的是AI能帮助业务完成多少工作、减少多少人力、融入多少流程、提升多少效率。

因此，产品表达也随之改变。Browser不再仅仅是浏览器的能力，而是融入办公流程；Coding不只是代码生成，而是进入研发流程；Terminal不只是Linux命令，而是进入开发环境；MCP也不只是协议，而是集成到企业已有的软件系统。将这些能力整合起来看，MiniMax展示的并非单一模型，而是一套工作流能力。

从Token到Workflow

很多人仍将AI公司视为API提供商，收入主要来源于Token消耗。调用次数越多，收入越高，这是第一代AI的商业模式。然而，一种新的趋势正在显现：越来越多的企业购买AI，并非为了获得更多回答，而是为了完成更多工作。修复一个Bug、整理一次会议、处理一张工单、分析一份合同、完成一次网页操作，价值的衡量单位正在发生变化。过去，一次调用对应一个Answer；如今，一次调用越来越对应一项Task。

MiniMax M3的产品设计也日益围绕这一逻辑展开。模型正在成为底层基础，而Workflow成为产品。将M3置于整个行业背景下，它代表了一种新的产品叙事。越来越多的AI公司开始证明其“工作能力”。这种变化并非MiniMax独有。Claude Code强调开发工作流；OpenAI的Operator和Computer Use关注任务执行；Google不断强化Gemini在Workspace和浏览器中的协同能力。整个行业正在围绕一个新的竞争单位展开：Workflow和Productivity。

为何这种变化值得资本关注？

资本市场真正关心的是技术如何转化为持续收入，而非技术领先本身。模型能力可以构建技术壁垒，但Workflow更容易构建商业壁垒。一旦工作流嵌入企业，就意味着数据沉淀、流程绑定、员工习惯以及系统集成。这些都将带来更高的续费率、更强的客户粘性以及更稳定的商业模式。

因此，越来越多的AI公司开始将其产品叙事从模型能力转向工作能力。这并非放弃模型，而是在模型之外寻找更长期的价值来源。从更宏观的角度看，M3最值得关注的并非某项基准测试，而是MiniMax对未来竞争对手的重新定义：从其他模型公司，转变为企业工作入口、浏览器、IDE、Office、ERP、CRM等。企业的数据不会沉淀在一次聊天中，而是最终沉淀在日常工作流里。谁能进入更多工作流，谁就拥有更强的商业基础。

从这个意义上说，MiniMax未来面对的竞争对手，不仅包括OpenAI或Anthropic，更包括所有定义企业工作方式的软件平台。

尾声：一家AI公司价值重构的开端

如果说过去的大模型竞争围绕“智能”展开，那么MiniMax M3所展示的是另一种竞争逻辑。模型依然重要，但正从产品转变为基础设施。真正走到台前的是模型如何进入企业、连接软件、完成工作。对于MiniMax而言，这或许比一次Benchmark排名更为关键，因为它意味着公司开始尝试回答一个新的问题：当模型能力逐渐趋同，一家AI公司还能依靠什么建立长期价值？

M3给出的答案，不是更多参数或排行榜，而是更多真实工作的完成。这或许也是AI行业进入下一阶段最重要的信号。未来，决定一家AI公司价值的，将不只是模型有多聪明，而是它能帮助企业重新组织多少生产力。