AI新概念

谷歌资深工程师断言：代码审查已死！当AI产出翻4倍，程序员如何保住饭碗？

在这篇文章中，我不想再重复那些 AI 炒作的陈词滥调。我们来聊点实在的：代码审查在 AI 时代到底颠覆了什么、继承了什么？作为一线开发者，我们该如何在这个"写代码比读代码快"的新世界中生存，并建立自己的护城河？

为什么叫QQ？

17 6月 2026 • 11 min read

过去五十年里，自从 Fagan 在 1976 年正式提出代码检查以来，让另一位人类工程师在代码合并前进行阅读和评论，一直是所有规模软件团队的基石实践。但现在，我们正站在一个历史性的十字路口。最近，我翻阅了 KTH 皇家理工学院 Martin Monperrus 的最新论文《The End of Code Review: Coding Agents Supersede Human Inspection》，同时结合了 Google 资深工程师 Addy Osmani 在 2026 年 6 月发表的硬核博客《Agentic Code Review》。这两份文献共同揭示了一个让许多老兵感到不适，却又不得不面对的现实：传统的代码审查黄金时代已经结束。在这篇文章中，我不想再重复那些 AI 炒作的陈词滥调。我们来聊点实在的：代码审查在 AI 时代到底颠覆了什么、继承了什么？作为一线开发者，我们该如何在这个"写代码比读代码快"的新世界中生存，并建立自己的护城河？

速度的错位：为什么审查系统正在崩溃？

过去几十年，代码审查之所以行之有效，完全是因为一个偶然的速度差：资深工程师看代码的速度，远快于菜鸟写代码的速度。在这个前提下，审查机制自然而然地保持了节奏。团队通过阅读彼此的差异（diffs）吸收了系统的整体架构，顺便完成了隐性的知识转移。这一切都源于一个基本事实：写代码又慢又贵，而读代码既便宜又快。但到了 2026 年，这个基本事实已经被彻底打破。现在的 AI 编码代理（如 Claude Code、Codex 和 GitHub Copilot）可以在你读完这段话的时间里，甩出一千行格式整齐、看似无懈可击的代码。而人类的阅读速度呢？自从我们开始盯着屏幕工作以来，几乎原地踏步。结果就是，软件工程中最让人头疼的部分，已经从"怎么写出这段代码"变成了"我到底该不该信任这段代码" 。

代码审查范式的演变

看看这张图，这就是我们正在经历的转变：

冰冷的数据：当机器速度撞上人类瓶颈

如果你觉得我是在贩卖焦虑，那就看看 2026 年第一季度的真实工业界数据。Faros AI 追踪了 4,000 个团队中 22,000 名开发者：

指标	采用 AI 后的变化	潜台词
代码变动率 (Code Churn)	飙升 861%	机器在疯狂倒代码
审查耗时中位数	暴涨 441.5%	审查者被海量代码淹没
开发者缺陷率	从 9% 蹿到 54%	质量门控正在失效
事故与 PR 比例	上升 242.7%	更多 bug 被放行到了生产环境
零审查合并的 PR	增加 31.3%	审查系统崩溃，代码没看就直接合了

下图直观展示了这场灾难是如何发生的：

最让我感到意外的是最后一项数据：31.3% 的零审查合并。不是大家商量好不看了，而是根本看不过来。当代码像泥石流一样涌来，超过了任何流程的吸收能力时，"闭着眼睛点 Merge"就成了新的常态。GitClear 创始人 Bill Harding 算过一笔账：虽然 AI 用户每天产出的原始代码量是不使用 AI 者的 4 倍，但他们交付的实际价值仅增加了约 12% 。你拿 4 倍的代码量换来了 10% 的价值增长，而倒霉的人类依然需要逐行审查这 4 倍的代码。这就是当前审查危机的核心。

理论与现实的碰撞：AI 真的能替代人工审查吗？

学院派的 Martin Monperrus 教授提出了一个极其激进的观点：编码代理的能力已经越过了一条红线，传统的人工代码审查已经完全多余，该让机器自己查自己了。他的论据很扎实：1.在 SWE-bench（基于真实 Python 库 GitHub 问题的基准测试）上，最先进的代理端到端解决任务的比例已经超过了 80%。2.代理生成的内联缺陷注释（inline defect comments）质量，已经能和受过训练的人类审查者掰掰手腕。3.代理能揪出人类审查者盯着的所有缺陷：逻辑错误、安全漏洞、性能瓶颈，甚至代码风格不统一。论文甚至直言不讳地指出，那种"AI 写代码，人类做强制审查"的中间模式是一条死胡同。它既不能保证质量，也扛不住 AI 的高吞吐量。但在工程第一线，现实往往比实验室里的一地鸡毛还要复杂。Addy Osmani 一针见血地指出，AI 代码之所以难审查，是因为意图和推理过程的丢失。人类写代码时，意图是自带的。脑子里权衡过、放弃过的方案，都会在 Review 时讨论。现代代理确实也会推理，它们会生成思考轨迹（thinking traces），解释自己为什么要这么干。但要命的是：这些推理在生成 diff 的那一刻就被无情丢弃了。审查者面对的只有冷冰冰的代码，必须像侦探一样逆向推导出代理的意图。你不是在检查摆在面前的推理，而是在脑补一段从未被记录下来的内心戏。这正是审查时间暴增 441% 的罪魁祸首。

场景分化：别拿大厂的剑斩初创的官

如果你在网上看到有人喊"AI 写的代码根本不需要看，跑通测试就上线"，或者有人死磕"每一行 AI 生成的代码都必须拉两个程序员逐字审查"，别急着站队。他们都没错，只是不在同一个频道上。代码审查的策略必须跟着三个核心变量走：爆炸半径（搞砸了会死人吗？）、代码寿命（一次性脚本还是传家宝？）以及团队规模（只有你懂还是全村人都得懂？）。

场景一：单人游击队（无用户，快迭代）

如果你一个人在肝一个下周可能就推翻重写的原型，审查的第二个目的——团队知识共享——对你来说就是个伪命题。实战策略：放心地把审查工作交给自动化测试。别在代码风格和微优化上死磕。但是，不审查不代表不验证。如果你的测试覆盖率跟纸糊的一样，跳过审查就是在给自己挖坑。

场景二：成长型团队（有用户，需协作）

这是最容易翻车的中间地带。代码开始影响真实用户，团队也需要共享知识。实战策略：引入分层审查（Layered Review）。把静态分析、安全扫描丢给 CI/CD；让 CodeRabbit 或 Claude Code 顶在前面做初步的逻辑审查；程序员只盯核心业务逻辑、架构影响和知识传递。别让程序员去抠 AI 写的循环效不高效，让他们去想这个循环到底该不该存在。

场景三：企业级重型系统（高风险，长维护）

如果你的代码管着钱、人命，或者是个有十年历史的屎山，上面那些激进玩法会让你死得很惨。实战策略：实施证据驱动的审查（Evidence-based Review）。坚决拒收只有代码的 AI PR。逼着 Agent（或者用 Agent 的那个人）交出决策日志。就像 Addy Osmani 说的，你的工作不是写代码，而是交付你已经证明有效的代码。

工程师的新武器：如何构建 Agentic Code Review 流程

在 AI 时代，与其抱怨代码像海啸，不如用魔法打败魔法。这里有几招经过工业界毒打的最佳实践，帮你把代码质量的控制权抢回来。

分层审查架构

看看这套现代 Agentic Code Review 的完整流程：

1. 逼 AI 交出思考过程

别让代理光拉屎不擦屁股。如果你用 Claude Code 这种工具，在 Prompt 里死死按住它，必须生成 DECISION_LOG.md。实战技巧：在团队规范里加一条铁律："任何 AI 辅助生成的 PR，必须附带 AI 为什么这么干的推理轨迹，以及它毙掉了哪些备选方案。" 这一招能帮你省下 80% 的逆向工程时间。

2. 用 AI 审查 AI（Loop Engineering）

既然看代码成了瓶颈，那就让机器先看一遍。在 CI 流程里塞个专门的审查代理。实战技巧：配个审查代理，在活人看到 PR 之前，让它先跑一圈。给它定死规矩，比如："查查这段代码有没有搞出我们在 architecture.md 里严禁的循环依赖"。这能挡掉一大半"看着像模像样其实全是废话"（plausible but hollow）的 AI 垃圾代码。

3. 把审查变成"验证"

Martin Monperrus 在论文里说得明白，审查的终极目标是找 bug 和传授知识。既然 AI 找 bug 已经够溜了，程序员就该去干点高级的活儿。实战技巧：别再盯着屏幕问"这段代码写得对不对"，改问"这段代码解决的问题对不对？"、"它有没有把系统带偏？" 摸透系统的整体架构，成为能给代码拍胸脯担保的最后一道防线。

结语：从"挑错工"到"信任的守护者"

代码审查的终结，不代表没人管质量了，它标志着程序员角色的彻底洗牌。我们把写代码的成本打到了地板价，但"搞懂这个系统"的成本依然高得吓人。未来几年，最牛逼的团队绝不是那个能产出最多代码的团队，而是那个建起了一套他们真正敢闭眼信任的审查系统的团队。他们永远不会把"绿灯全亮了"和"有人懂这堆代码在干嘛"混为一谈。AI 砸碎了敲键盘的机械饭碗，但它把软件工程的灵魂放大了：理解复杂系统、吃透业务意图、对最终结果负责。

作为程序员，你不再是个无情的代码输出机器。你正在进化成系统的定海神针、AI 代理的包工头，以及最重要的——信任的守护者。摸透一个系统，然后有底气指着它说"我担保这玩意儿能跑"，这是目前软件行业里最硬核、也最有意思的技能。而现在，正是把这项技能练到满级的最好时机。

参考文献

[1] Monperrus, M. (2026 ). The End of Code Review: Coding Agents Supersede Human Inspection. arXiv preprint arXiv:2606.13175.

[2] Osmani, A. (2026 ). Agentic Code Review. Addy Osmani Personal Blog.