他山之石可以攻玉。今年是 AI 大模型改变科技行业的第三年,美国在算力与商业模式方面领先。其 AI 应用产业面临的主要矛盾以及人工智能原生公司的经验教训,值得我们借鉴。
一、繁荣表象下的深层矛盾:成本与增长的失衡
观察美国三年来的 “人工智能 +” 发展,一个显著现象是:在 AI 垂直应用领域,融资消息不断,收入增长惊人,但却未出现真正定义时代的全球现象级产品。过去三年,AI 应用领域热点不断切换,从 AI 陪聊、AI 视频生成、AI 教育到通用 AI agent,如今 AI 编程成为新的明星赛道。市场观察者逐渐聚焦到一个核心问题:在科技巨头和大模型厂商主导的行业中,AI 创新公司正面临一个根本困境 —— 成本与增长难以兼顾。
从增长速度看,AI 垂直应用领域处于黄金时代。在各个细分赛道,都有企业借助 AI 迅速将代码、创意和算力转化为实际收入。

这些高估值背后是否存在泡沫?尤其是在面临成本难题时,其可持续性受到质疑。AI 编程赛道的繁荣,就是大模型淘金热的一个典型例子。
人工智能编程工具 Replit 的年化收入增长迅猛,2024 年 8 月仅为 200 万美元,2024 年全年达到 1000 万美元,2025 年 2 月飙升到 3200 多万美元,2025 年 7 月更是达到 1.44 亿美元。经过最新一轮融资,其估值已达 30 亿美元。来自瑞典的 AI 编程助手 Lovable 发展同样迅速,2025 年 7 月其年经常性收入突破 1 亿美元大关,自推出仅用了八个月就达到这一里程碑。此前在 2025 年 6 月,Lovable 宣布其年经常性收入为 7500 万美元,简单推算其一个月收入为 2500 万美元。经过最新一轮融资,Lovable 的估值达到 18 亿美元。另一款大型 AI 编程产品 Cursor 也成绩斐然,据彭博社报道,2025 年 6 月 Cursor 背后的创业公司 Anysphere 年收入突破 5 亿美元,三个月前公开报道的年化收入还是 2 亿美元,期间收入增长了 3 亿美元,其估值现已达到 200 亿美元。
AI 垂直应用本质上是大模型厂商最忠实的 “token 消费者”。它们凭借精准的用户群体、模型的强大能力和精准的产品设计,直接服务终端用户,拦截了部分原本属于大模型厂商的用户,这也是为何 Sam Altman 也要亲自下场做 AI 编程产品。
然而,在这繁荣背后,成本困境日益凸显。根据 The Information 的报道,随着用户需求激增,编程助手 Replit 的毛利润率在 36% 到 14% 之间剧烈波动。事实上,从国内外各种公开报道来看,AI 编程助手企业普遍毛利率偏低,基本在 30% - 40% 左右。

图:AI编程赛道代表性公司的基本毛利率情况
低毛利的核心原因是难以压缩且不可控的大模型 token 成本,这是 AI 编程助手的关键成本。以另一款 AI 编程产品 Windsurf 为例,其架构成本高昂,特别是大型语言模型(LLM)的使用成本。在激烈竞争下,为保持用户粘性,每当大模型厂商发布新模型,AI 编程产品就不得不跟进迭代底层模型。新模型虽能提升任务完成度和效果,但技术型用户对模型是否最新十分敏感,若不及时更新,易导致用户流失。目前,几款热门的 AI 编程产品尚未形成独特的核心竞争力。
从价格方面看,一方面,模型厂商竞争使单个 token 价格下降;另一方面,模型效果提升带动用户实际使用量大幅飙升。模型 token 价格下降 1 倍,模型使用量可能上涨数倍甚至 10 倍,这使得 AI 垂直应用企业的利润空间被压缩。大模型 API 调用的 Token 成本无法随规模扩大而有效稀释,这与传统 SaaS 企业(如 Salesforce 或 Zoom)以及典型订阅模式的 Netflix 财务模型截然不同。
二、矛盾根源剖析:token 成本与 scaling 定律引发的困境
Anthropic 的联合创始人 Dario Amodei 在播客节目中描述了模型投入成本和收入之间的滚动过程:2023 年训练一个模型花费 1 亿美元;2024 年模型创造 2 亿美元收入,但因 scaling 定律,训练模型成本上升到 10 亿美元;2025 年模型带来 20 亿美元收入,而训练模型成本可能高达 100 亿美元。从传统财务角度看,这是一个可怕的亏损循环。虽然 Dario Amodei 针对的是大模型厂商,但 AI 垂直应用赛道同样存在 “成本悖论”。该赛道本质上是大模型厂商的 “token 消费者” 或分发渠道。对于创业公司而言,token 成本是随使用量变化的变动成本,而非固定成本,几乎不存在边际效应递减。这意味着每多一个用户,就多一份 token 消耗;每多一次调用,就多一笔成本支出;用户任务越复杂,消耗 token 越多,成本越高。
构建一个简单的单位经济模型可说明这一问题。若一款 AI 产品定价为每月 10 美元,当用户量级不同时,收入和成本变化如下:1 个用户时,token 成本 6 美元,收入 10 美元,毛利润 4 美元,毛利率 40%;1 万个用户时,token 成本 6 万美元,收入 10 万美元,毛利润 4 万美元,毛利率 40%;100 万个用户时,token 成本 600 万美元,收入 1000 万美元,毛利润 400 万美元,毛利率仍为 40%。这种成本结构表明,token 成本无法压缩,是实实在在的 COGS,严重影响毛利润率。收入增长越快,成本膨胀越快,毛利率甚至可能不增反降。
这就是单一订阅模式的弊端,也是与 Netflix 这类订阅业务或 SaaS 模式的核心差异。其成本不会因用户增长而有效分摊,而是随订阅量增长。此外,企业拓展市场时,订阅模式可能并非理想的付费方式。在欧美市场,部分 AI 垂直项目因高端用户和高订阅渗透得以成功,但在其他市场,付费率低,商业模型不稳定。由于经济水平差异,全球许多国家用户抵触订阅,习惯一次性买断或免费 + 广告模式。
三、AI 应用个体困境:低护城河与激烈竞争
目前众多 AI 编程工具在技术上并无本质差异。以 Cursor 为例,其架构由 Electron 的 VS Code 封装器和类似 Copilot 的代理构成,代理负责 token 调用和任务处理,其他编程工具也类似。本文关注的几款 AI 编程产品虽为行业翘楚,但彼此差异仅体现在 UI 风格、开发环境便利性等狭窄领域,无法形成有效护城河。例如,Lovable 面向非技术创始人、小团队和初学者,简化应用创建过程,降低入门门槛;Replit 适合个人和小型团队,提供 “护栏” 功能帮助新手快速上手;Cursor 面向经验丰富的开发者,尤其是 VS Code 用户,需更多技术交互;Windsurf 定位一站式智能开发环境,适合初中级开发者,UI 类似现代 IDE。
而它们共同争夺的程序员群体规模有限。Slash 今年 5 月发布的数据推测全球开发者最新人数为 4700 万,即便如此,对于诞生一款稳定营收和利润的 AI 编程产品来说,用户数量仍显不足。或许只有这些赛道明星们持续竞争,最终可能仅剩下一家服务这 4700 万用户。
四、破局之策:从定价到商业模式的全面创新
(一)定价模式优化:混合订阅与按算力计费
从竞争角度看,AI 垂直应用创业公司竞争远超大模型企业。在资本驱动下,AI 行业公司估值模型更加残酷清晰。订阅模式在互联网商业模式中难度较大,收入增长依赖订阅价格提升和订阅人数增加,这要求企业服务能匹配提价并吸引更多订阅者。AI 应用产品本质上属于 API business,自身难以构建强大护城河,议价权较弱。在激烈竞争下,单一订阅价格模式难以持续,需采用更复杂的定价模型。首先是调整 token 价格模式,按任务收费无法反映任务复杂度和模型消耗,按算力计费能更精准与后台成本挂钩,保证毛利率。
已有企业迫于成本压力调整定价模式。如 Replit 原本每个 “checkpoint”(类似 agent 执行一次编程任务)收取 25 美分固定费用,但底层模型更新后任务运行成本大增,毛利率降为负值。为此,7 月份 Replit 宣布将定价模式从单一任务收费改为 “基于算力” 收费,根据任务执行所需算力定价,部分任务价格从 25 美分上涨到 2 美元。这一调整虽可缓解利润困境,但可能对订阅量产生负面影响。不过,其他 AI agent 同样面临成本压力,也将陆续调整价格,届时客户流失或可减缓,订阅量有望回升。据公开报道,Cursor 似乎也在同步进行类似定价模式调整。
(二)商业模式创新:拓展增值服务
仍以 AI 编程应用为例,面向微小企业端的应用是短暂的蓝海。许多企业 IT 部门已自行开发内部 AI 平台,但技术水平和数据安全保护参差不齐,这为 AI 垂直应用产品提供了增值服务空间。通过私有化部署,将数据安全和隐私保护等服务作为增值模块融入 AI 垂直应用服务,既能增加收入,又能扩大服务范围,增强服务安全性和稳定性。AI 垂直应用在服务用户过程中会积累大量行为数据和行业数据。这些数据经清洗和分析,能为企业客户提供有价值的行业报告、趋势预测或用户行为洞察。例如,AI 编程工具可分析数百万开发者编程习惯,为企业提供技术栈偏好、效率瓶颈等方面的洞察报告。
(三)大胆畅想:重新定义行业价格模式
回顾 2023 年 OpenAI 的生成式 AI 横空出世,三年来 AI 已渗透到日常生活诸多方面。未来,大模型可能成为像 “水、电、燃气和移动流量” 一样的基础服务。基于此,AI 垂直应用可衍生更多定价模式。参考水电燃气的付费方式,采用按使用量计费和阶梯定价。用户可先低价 “存储” 一定量 token,使用完毕后以稍高价格购买新 token。更具参考价值的是移动流量的定价模式,采用 “基础订阅费 + 流量包 / 算力包”。用户可根据实际使用量购买不同价位套餐,超出 token 使用量时,可额外支付 token 费用或购买新的 “token 包”,当月 token 余量还可转移到次月。
五、结语:AI 发展的必然与挑战
AI 大模型无疑是当今时代最激动人心的技术变革之一,AI 垂直应用的火热发展让人们与 AI 的距离更近。我们已享受大模型带来的诸多便利,工作中的繁琐任务可交给 AI 处理。随着大模型升级迭代,我们将更加依赖 AI,难以回到没有 AI 的日子。既然 AI 已如移动流量般普遍,那么跳出科技技术束缚,从日常角度思考定价,不失为一种创新。当前 AI 垂直应用的成本困境未来必将得到解决,尤其在中国,正如 DeepSeekV 3.1 通过算法创新推动中国芯片算力业生态化突破一样。我们有理由相信,在技术与商业模式的不断创新中,AI 应用产业将迎来新的发展阶段。