Cursor扒了自己18个月数据,还原出最真实的Vibe Coding现状
Cursor对自身18个月的数据进行了梳理,由此还原出了当前Vibe Coding最真实的现状
AI Coding 是一个百倍杠杆
AI Coding 正在从“工具红利”逐步走向“系统重构”。在过去两年里,开发者最直观的感受,主要体现在代码补全变得更快,以及编写样板代码这件事也更加省力。但在当前,相关变化已经越过了单点提效的阶段。模型开始对整个代码库进行读取,理解项目结构,甚至参与到 PR 以及审核流程当中。
软件开发正由“以人为主导、由AI提供辅助”,转向“由人设定目标、由AI执行流程”。
这也意味着其背后所对应的行业竞争逻辑,正在发生变化。
早期AI编程产品所比拼的,主要是模型能力以及交互体验,即谁能够生成得更准确、响应得更迅速。但随着任务复杂度的持续提升,真正的护城河会逐步转向上下文管理、缓存效率以及成本控制等方面。
换句话说,AI 编程已不再只是“更聪明的代码编辑器”,而是正在逼近一套全新的软件生产基础设施。
此外,与普遍共识并不一致的是,AI并不会天然地把开发者之间的差距抹平。恰恰相反,它更有可能优先放大高水平开发者原本所具备的优势。
具备架构能力、能够拆解任务、也能判断模型输出质量的开发者,会把AI真正转化为杠杆;而如果只是把AI当作问答工具来使用,那么最终能够获得的提升往往会相对有限。
Cursor 作为一家在 AI Coding 行业历经起伏的公司,其发布的开发者习惯报告呈现了 AI Coding 真实的趋势变化。这并不是另一篇围绕 AI 编程概念展开的文章,而是借助真实的产品数据,对这场变化进行了记录。
以下内容整理自 Cursor 发布的《2026 年春季 Cursor 开发者习惯报告》编译稿。(原文链接:https://cursor.com/insights)
一场深刻的变革
软件开发正在经历一场显著的变革。这份首期开发者习惯报告,依托 Cursor 的真实数据,从五个角度对这一切进行了记录:
开发者正在持续提速:代码编写效率同比实现翻倍增长,单次提交所包含的代码规模更大、变更层次也更深,而由AI生成并在通过审核后最终被保留下来的代码占比,同样达到了历史最高水平。
智能化的经济账:对7个模型系列进行对比后,可以看到每行代码所对应的成本以及每次提交所产生的费用,并发现不同模型之间在性价比方面存在很大的差异。
顶尖用户的领先优势:AI的确让所有人的效率都有所提升,但提升幅度最为显著的,仍然是处在最顶尖1%层级的开发者。
上下文能力的崛起:模型所读取的信息量正在急剧增加,而“缓存读取”的占比也同步上升,这使得AI得以处理更复杂的任务,并生成质量更高的代码。
迈向自动化:AI 编程正从“辅助单个开发者”的工具,逐步演变为一套覆盖端到端软件开发流程的完整自动化系统。
本报告借助数据对一个关键问题进行了清晰呈现:AI 编程在今天究竟处于什么位置,以及下一步可能会走向哪里。
1
开发者加速
开发者的工作节奏正在持续加快,产出的代码规模也在不断扩大,但这一变化并不只是“量”的增长。AI 同样在重塑工作的“形态”:每次提交所包含的代码量更大,AI 对话所经历的轮次更深,而由 AI 生成的代码在代码库当中保留的时间也更长。
1.1 代码产出速度加快
开发者每周新增的代码量正在持续增长,而且自 2026 年初以来,这一增长速度还在进一步加快。尽管代码行数并不是一个完美的衡量标准,但它依然为理解开发者的工作方式究竟正在发生何种变化,提供了一个具有方向性参考价值的参照。
1.2 每次提交的代码量在增长
每次拉取请求(PR)当中新增的代码行数,同比大约增长了 2.5 倍,而且这一增速仍在持续加快。

1.3 开发者在处理更大的任务单元
“超大型提交”即改动至少1,000行代码的提交,正在变得愈发常见,因为开发者开始借助AI在单次提交中完成规模更大的任务。值得注意的是,2026年1月这类超大型提交出现了跃升,当时许多开发者正在试用最新的AI编程能力以及模型OpenClaw。

1.4 AI 对话的轮次在加深
最近两个月里,每次 AI 对话平均所调用的工具次数增加了约 30%。这意味着,AI 编程助手正在承担复杂度更高的任务,并且会更频繁地进行文件读取与编辑、代码搜索、命令行运行以及网页浏览。

1.5 AI 生成的代码存活更久了
自 2026 年初以来,AI 所建议的代码在被接受之后 60 分钟仍然保留于代码库当中的比例,已经从大约 76% 上升到了 81%。

2
智能经济学

随着模型能力持续增强、所调用的上下文不断增多、所承担的任务逐步加深,成本在产品整体体验当中所占据的比重也在持续上升。
为了更清晰地理解“成本”与“智能”之间所存在的权衡关系,我们从三个角度对模型的经济性进行了分析:请求成本、有效代码产出效率,以及成本与跑分表现之间的关系。
2.1 不同模型的请求成本差异巨大
不同模型系列在单次请求上的成本相差接近 9 倍,这表明即便面对同样的工作流,背后所选用的模型一旦不同,整体成本也会出现显著差异。
2.2 代码接纳率缩小了模型价格差距

便宜模型与贵模型在单次请求上的价格差距最高可达 9 倍,但如果把衡量标准放在“最终被保留下来的代码”之上,二者之间的最大差距则只有 7 倍,因为贵模型在一次请求当中往往能够生成更多真正可用的代码,因此其实际成本并不像表面所呈现的那样高。
2.3 "成本-质量"前沿在移动

下图展示了各模型在 Cursor 内部评测 CursorBench 当中的表现,以及其平均任务成本之间所对应的关系,由此呈现出各模型在“成本—质量”维度上的位置。
3

超级用户差距
AI 正在对整体生产力进行全面提升,但这种提升在用户分布最顶端的人群当中体现得最为集中。处在前 1% 层级的用户所获得的收益明显高于其他人,而且随着 AI 总体使用量的持续增长,这种差距在绝对数值层面也还在进一步扩大。
3.1 超级用户占据了 AI 活动的大头
AI 的使用呈现出高度集中的特征:仅有一小部分开发者,便贡献了绝大多数由 AI 生成的代码行数、与 AI 相关的支出以及 Token 的消耗量。洛伦兹曲线对这种集中程度进行了呈现,而这三个指标所对应的基尼系数分别达到 0.77、0.75 和 0.72;在 0 到 1 的区间之内,分数越高,也就意味着相关活动越集中于少数人手中。
3.2 产出差距正在扩大

前 90% 开发者与中位数开发者之间的绝对代码产出差距正在持续扩大,而 P99 用户所保持的领先幅度则更加显著。
3.3 尾部的差距更悬殊

这也从另一个角度说明,超级用户之间的能力差距,正在分布尾部进一步被拉大。
从另一个角度来看,顶尖用户之间所呈现出的差距程度同样十分显著:P99(前 99%)开发者所产出的代码行数,是活跃中位用户的 46 倍,而其完成合并的提交次数,则是中位提交者的 15 倍。相比之下,P90 用户虽然同样保持着明显领先,但其差距则要小得多。
4

上下文的崛起
随着模型开始承担复杂度更高的任务,它们在生成输出之前,会先读取更多的上下文信息,以便对代码库、用户意图以及 surrounding 工作流形成更充分的理解。
这种转变在成本方面是有利的,因为输入 Token 的成本远低于输出 Token,而缓存读取所对应的 Token 则更为便宜。
上下文能力的持续提升,会使模型得以生成更为精准的代码,这一点与“开发者加速”章节当中所呈现出的代码留存率上升趋势保持一致。
4.1 模型在写代码之前,读得更多了
输入与输出 Token 之间的比例正在迅速上升,这说明模型每生成一个 Token,所需要消耗的上下文信息也在变得更多。这表明,模型在生成代码之前,已经进行了更多的“前期工作”。
4.2 输入 Token 已占非缓存 Token 的大头

同样的趋势也体现在 Token 的构成变化之中。如今,输入 Token 在输入与输出总量当中的占比已经超过 90%,这意味着上下文已成为非缓存模型使用过程中的主要组成部分。
4.3 输入上下文正逐步成为 Token 成本的主要来源

输入 Token 的消耗规模虽然较大,但由于其单位价格相对较低,因此对整体成本所产生的影响被部分抵消。即便如此,输入 Token 在“等价价格”所对应的 Token 成本当中,已经占据了多数,且自年初以来已从约一半上升至接近 70%。
4.4 缓存读取主导了 Token

如果把缓存因素也纳入考量,那么“上下文”的边界就会进一步扩大。缓存读取 Token 在 Token 活动总量当中占据了绝大部分,这说明当下的 AI 工作正越来越依赖对既有上下文的重复利用,而不再是在每一次执行时都从头读取全部内容。
5

迈向自动化
AI 编程工具在最初所指向的目标,是对单个开发者的工作流程进行加速。在报告前文的章节之中,这种影响实际上已经得到了呈现:编码速度更快,单次提交的规模更大,AI 对话所经历的轮次更深,以及由 AI 生成的更多代码最终进入了提交记录。
现在,AI 软件开发正在步入一个新的阶段,AI 正在演变为基础设施,并逐步推动软件开发全生命周期端到端自动化的实现。
5.1 更多 AI 修改正在被自动接受
自 2026 年初以来,那些未经人工逐行审核、便被直接自动接受并进入代码提交环节的 AI 修改,其规模已增长至 5 倍以上。这一变化表明,开发者对于 AI 的信任正在持续增强,并且更愿意让其独立承担提交流程当中的更多工作。
5.2 自动化正在向各类工作流扩散

尽管目前仍然处于早期阶段,但首批自动化模式已经开始逐步显现。Cursor 自动化功能的采用速度正在迅速提升,其中安全审核正在成为一个极具代表性的自动化应用场景。最新数据显示,SDK 运行功能也已展现出初步需求,这意味着开发者希望把 Cursor 的 AI 基础设施进一步转化为一个能够按需定制的可编程平台。
调研方式

本报告以 Cursor 产品与工程数据的汇总统计为基础,其中涵盖 AI 使用量、Token 消耗、被接受的 AI 代码改动以及已合并的提交活动。大多数时间序列图表均运用 7 天、28 天或 30 天滚动平均值,以减少短期波动所带来的噪音,并使趋势方向更容易被看清。所有指标均以汇总形式进行报告,旨在展示开发者借助 AI 来构建软件时所呈现出的广泛模式。本报告不包含处于隐私模式用户的退出数据,其中也包括与模型提供方签订零数据保留协议的用户数据。
本文来自微信公众号“硅星GenAI”,作者为董道力
来源:Cursor扒了自己18个月数据,还原出最真实的Vibe Coding现状-36氪 | 36氪