AI新概念

【译文】AI 对劳动力市场的影响：一种新的测量方法与早期证据

我们提出了一种新的 AI 替代风险测量指标——观测暴露度（Observed Exposure），该指标综合了 LLM 的理论能力与真实使用数据，并对自动化（而非辅助性）及工作相关的使用场景赋予更高权重。

为什么叫QQ？

08 3月 2026 • 29 min read

发布日期： 2026 年 3 月 5 日　　作者： Maxim Massenkoff 与 Peter McCrory

致谢

Ruth Appel、Tim Belonax、Keir Bradwell、Andy Braden、Dexter Callender III、Miriam Chaum、Madison Clark、Jake Eaton、Deep Ganguli、Kunal Handa、Ryan Heller、Lara Karadogan、Jennifer Martinez、Jared Mueller、Sarah Pollack、David Saunders、Carl De Torres、Kim Withee 与 Jack Clark。

另感谢 Martha Gimbel、Anders Humlum、Evan Rose 与 Nathan Wilmers 对本报告早期版本提供的反馈意见。

核心发现

我们提出了一种新的 AI 替代风险测量指标——观测暴露度（Observed Exposure），该指标综合了 LLM 的理论能力与真实使用数据，并对自动化（而非辅助性）及工作相关的使用场景赋予更高权重。

AI 距离实现其理论能力仍相去甚远：实际覆盖率仅为理论可行范围的一小部分。

美国劳工统计局（BLS）的数据显示，观测暴露度较高的职业，其预测就业增长率相对较弱，预计至 2034 年增长更少。

在暴露度最高职业中工作的劳动者，更有可能是年龄较大、女性、受教育程度较高且薪酬较高的群体。

自 2022 年底以来，我们未发现高暴露度劳动者的失业率存在系统性上升，但有初步迹象表明，暴露度较高职业中年轻劳动者的招聘有所放缓。

我们方法与主要结果概览

上图从左至右分别展示：（一）按职业类别划分的理论 AI 覆盖（蓝色）与观测 AI 覆盖（红色）雷达图；（二）BLS 预测就业增长与 AI 暴露度的散点图；（三）高暴露度与低暴露度劳动者失业率趋势折线图。详见下文对任务覆盖率测量方法及 AI 对失业率影响的说明

引言

AI 的快速扩散正在催生大量研究，致力于测量和预测其对劳动力市场的影响。然而，过往方法的历史记录提醒我们保持审慎。

举例而言，一项衡量工作可离岸化程度的著名研究认定约四分之一的美国工作岗位面临风险，但十年后，这些岗位中的大多数仍保持了健康的就业增长。政府自身的职业增长预测虽在方向上大体正确，但其预测价值几乎不超过对历史趋势的简单线性外推。即便事后回顾，重大经济冲击对劳动力市场的影响往往也难以厘清。关于工业机器人对就业影响的研究得出了截然相反的结论，而中国贸易冲击所造成的工作岗位损失规模至今仍存争议。^[1]

在本文中，我们提出了一套理解 AI 劳动力市场影响的新框架，并以早期数据加以检验，发现 AI 迄今为止对就业影响的证据十分有限。我们的目标是建立一套衡量 AI 如何影响就业的方法，并定期更新分析。这一方法无法捕捉 AI 重塑劳动力市场的所有渠道，但通过在有意义的影响显现之前奠定这一基础，我们希望未来的发现能比事后分析更可靠地识别经济冲击。

AI 的影响或许终将无可忽视。这一框架在效应尚不明朗时最为有用——它有助于在岗位替代变得显而易见之前，提前识别最脆弱的工作岗位。

反事实分析

当效应显著且突然时，因果推断相对容易。新冠疫情及其伴随的政策措施造成的经济冲击极为剧烈，以至于许多问题无需复杂的统计方法即可作答。例如，疫情初期数周内失业率急剧攀升，几乎没有其他解释的空间。

然而，AI 的影响或许不像新冠疫情，而更像互联网普及或对华贸易。其效应可能无法从总体失业数据中直接读出；贸易政策和经济周期等因素可能会模糊趋势线的解读。

一种常见方法是比较 AI 暴露程度不同的劳动者、企业或行业之间的结果差异，以便从混杂因素中剥离出 AI 的影响。^[2] 暴露度通常在任务层面加以界定：例如，AI 可以批改作业，但无法管理课堂，因此教师被认为比那些整个工作都能远程完成的劳动者暴露度更低。

我们的研究遵循这一基于任务的方法，在汇总至职业层面之前，综合纳入了 AI 理论能力与真实使用情况的测量指标。^[3]

测量暴露度

我们的方法融合了来自三个来源的数据：

O*NET 数据库，该数据库列举了美国约 800 种独特职业所关联的任务。
我们自身的使用数据（通过 Anthropic 经济指数加以衡量）。
Eloundou 等人（2023）的任务级暴露度估计，衡量 LLM 是否在理论上能够将某项任务的完成速度至少提升一倍。

Eloundou 等人的指标 β 以简单的尺度对任务进行评分：若某项任务仅凭 LLM 即可将速度提升一倍，则评为 1；若需要借助基于 LLM 构建的额外工具或软件，则评为 0.5；否则评为 0。^[4]

为何实际使用可能低于理论能力？一些理论上可行的任务可能因模型局限性而未在实际使用中出现。另一些任务的扩散可能因法律约束、特定软件要求、人工核验步骤或其他障碍而受阻。例如，Eloundou 等人将"授权药品续配并向药房提供处方信息"标记为完全暴露（β=1）。我们尚未观察到 Claude 执行这一任务，尽管该评估看似正确——从理论上讲，LLM 确实可以加速这一任务的完成。

尽管如此，理论能力与实际使用这两项指标之间的相关性极高。如图 1 所示，在过去四期经济指数报告中观察到的任务里，97% 落入了 Eloundou 等人评定为理论上可行的类别（β=0.5 或 β=1.0）。

图 1：按 Eloundou 等人任务暴露度评级划分的 Claude 使用份额

本图展示了 Claude 使用量在按理论 AI 暴露度分组的 O*NET 任务中的分布。评级为 β=1（仅凭 LLM 即完全可行）的任务占 Claude 观测使用量的 68%，评级为 β=0.5（借助工具可行）的任务占 29%，而评级为 β=0（不可行）的任务仅占 3%。Claude 使用数据来源于过去四期经济指数报告。

职业暴露度的新测量指标

我们的新指标——观测暴露度（Observed Exposure）——旨在量化：在 LLM 理论上能够加速的那些任务中，哪些任务正在专业场景中实际产生自动化使用？理论能力涵盖的任务范围要宽泛得多。通过追踪这一差距如何缩小，观测暴露度能够在经济变化涌现之际提供洞察。

我们的指标从定性角度捕捉了 AI 使用的若干方面，我们认为这些方面对工作影响具有预测意义。一个职业的暴露度越高，意味着：

其任务在理论上可借助 AI 完成
其任务在 Anthropic 经济指数中呈现出显著的使用量^[5]
其任务在工作相关情境中被执行
其自动化使用模式或 API 实施的比例相对较高
受 AI 影响的任务在整体职责中占据更大比重^[6]

数学细节详见附录。^[7] 我们将理论上 LLM 可处理、且在 Claude 流量中已有充分工作相关使用的任务计为"已覆盖"。随后，我们根据任务的执行方式进行调整：完全自动化的实施获得完整权重，而辅助性使用则获得一半权重。最后，任务级覆盖率指标按每项任务所占时间比例加权平均，汇总至职业层面。

图 2 展示了观测暴露度（红色）与 Eloundou 等人的 β（蓝色）的对比，按宽泛的职业类别分组，揭示了理论能力与我们平台实际使用之间的差距。我们的计算方法是：先按时间占比加权平均至职业层面，再按总就业人数加权平均至职业类别层面。例如，β 指标显示，计算机与数学（94%）及办公与行政（90%）职业中的大多数任务均有 LLM 渗透的空间。

图 2：按职业类别划分的理论能力与观测使用情况

本图展示了 LLM 理论上可执行的工作任务比例（蓝色区域）与基于使用数据的工作覆盖率指标（红色区域）。

红色区域呈现了 Anthropic 经济指数中 LLM 的使用情况，反映了人们在专业场景中使用 Claude 的方式。覆盖率数据表明，AI 距离实现其理论能力仍相去甚远。例如，Claude 目前仅覆盖计算机与数学类别中全部任务的 33%。

随着能力的提升、采用的扩展和部署的深化，红色区域将逐步覆盖蓝色区域。当然，也存在大量尚未覆盖的领域——许多任务仍超出 AI 的能力范围，从修剪树木、操作农业机械等体力农业劳动，到在法庭上代理客户等法律任务，皆是如此。

图 3 展示了在该指标下暴露度最高的十种职业。与其他数据显示 Claude 被广泛用于编程的情况相符，计算机程序员位居榜首，覆盖率达 74.5%；其次是客服代表（70.1%），其主要任务在第一方 API 流量中日益频繁地出现；数据录入员（67.1%）的主要任务——读取源文件并录入数据——已实现大量自动化。

图 3：暴露度最高的职业

职业	观测暴露度	主要自动化任务
计算机程序员	74.5%	编写、更新和维护软件程序
客户服务代表	70.1%	与客户沟通以提供信息、接受订单、处理投诉
数据录入员	67.1%	读取源文件并将数据录入系统
病历专员	66.7%	汇编、摘录和编码患者数据
市场调研分析师及营销专员	64.8%	撰写调查结果报告，以图表形式呈现数据，并将复杂结论转化为书面文字
批发及制造业销售代表（技术及科学产品除外）	62.8%	联系客户以展示产品并招揽订单
金融与投资分析师	57.2%	通过分析财务信息为投资决策提供依据，预测商业、行业或经济状况
软件质量保证分析师及测试员	51.9%	修改软件以纠正错误或改善性能
信息安全分析师	48.6%	开展风险评估并测试数据处理安全性
计算机用户支持专员	46.8%	解答用户关于计算机软件或硬件操作的问题

本图展示了基于任务覆盖率指标的暴露度最高的十种职业。

在另一端，30% 的劳动者覆盖率为零，因为其任务在我们的数据中出现频率过低，未能达到最低阈值。这一群体包括厨师、摩托车修理工、救生员、调酒师、洗碗工和更衣室服务员等。

暴露度与预测就业增长及劳动者特征的关联

美国劳工统计局（BLS）定期发布就业预测，最新一期于 2025 年发布，涵盖 2024 年至 2034 年每种职业的预测就业变化。在图 4 中，我们将职业层面的覆盖率指标与其预测结果进行了比较。

以当前就业人数为权重、在职业层面进行的回归分析发现，观测暴露度较高的职业，其增长预测相对较弱。覆盖率每提高 10 个百分点，BLS 的增长预测便下降 0.6 个百分点（斜率 = -6.07，标准误 = 1.32，R² = 0.027）。这在一定程度上验证了我们的指标——它与劳动力市场分析师独立得出的估计相吻合，尽管两者的关联程度尚浅。值得注意的是，单独使用 Eloundou 等人的指标时，并不存在这种相关性。

图 4：2024—2034 年 BLS 预测就业增长与观测暴露度的关系

分箱散点图，共 25 个等大小的分箱。每个实心点代表一个分箱中平均观测暴露度与预测就业变化的组合。虚线为以当前就业水平为权重的简单线性回归拟合线。小方块标记了若干具体职业示例，仅供参考（包括：电工、注册护士、律师、会计师、软件开发人员、收银员、客户服务代表）。

图 5 展示了在 ChatGPT 发布前三个月（2022 年 8 月至 10 月），暴露度最高四分位数劳动者与覆盖率为零的 30% 劳动者的特征差异，数据来源于当期人口调查（CPS）。^[8] 两组群体差异显著。暴露度较高的群体中，女性比例高出 16 个百分点，白人比例高出 11 个百分点，亚裔比例几乎是前者的两倍。他们的平均收入高出 47%，受教育程度也更高。例如，拥有研究生学位的人在未暴露群体中占 4.5%，而在暴露度最高群体中占 17.4%，相差近四倍。

图 5：高暴露度与低暴露度劳动者的差异（当期人口调查）

类别	指标	无暴露	最高四分位	差异
暴露度	AI 覆盖率（%）	0.0%	38.8%	+38.8 pp
人口统计	年龄	41.0	42.9	+1.9
	女性	38.8%	54.4%	+15.5 pp
	西班牙裔	24.8%	13.8%	-11.0 pp
	白人（非西班牙裔）	54.5%	65.1%	+10.6 pp
	黑人（非西班牙裔）	13.2%	9.7%	-3.5 pp
	亚裔（非西班牙裔）	4.7%	9.1%	+4.4 pp
	已婚	44.6%	54.9%	+10.4 pp
教育程度	高中以下	13.2%	2.3%	-10.9 pp
	高中文凭	38.9%	17.7%	-21.2 pp
	部分大学 / 专科	30.0%	25.5%	-4.6 pp
	学士学位	13.3%	37.1%	+23.8 pp
	研究生学位	4.5%	17.4%	+12.8 pp
劳动力市场	每周工时	37.5	38.7	+1.2
	时薪（美元）	$22.23	$32.69	+$10.45
	工会成员	11.7%	5.3%	-6.4 pp
	观测样本数	42,546	32,301

本表展示了暴露度、人口统计、教育程度和劳动力市场结果的差异。

结果指标的优先选择

掌握了这些暴露度指标之后，问题在于应当关注什么。研究者们采取了不同的方法。例如，Gimbel 等人（2025）利用当期人口调查追踪职业结构的变化，认为 AI 对经济的任何重要重构都会体现为工作岗位分布的变化（他们发现，迄今为止的变化并不显著）。Brynjolfsson 等人（2025）利用薪资处理公司 ADP 的数据，按年龄组分析就业水平；Acemoglu 等人（2022）和 Hampole 等人（2025）则分别使用来自 Burning Glass（现为 Lightcast）和 Revelio 的职位发布数据。

我们将失业率作为优先关注的结果指标，因为它最直接地反映了潜在的经济伤害——失业劳动者有就业意愿却尚未找到工作。在这一框架下，职位发布数量和就业水平并不必然预示需要政策干预；高暴露度职业的职位发布减少，可能被相关职业中新增岗位所抵消。AI 对劳动力市场造成的大多数有害影响，可以说都应包含一段失业率上升的时期，因为被替代的劳动者需要时间寻找替代选择。当期人口调查非常适合追踪这一指标，因为失业受访者会报告其此前的工作和行业。

初步结果

我们接下来研究失业率的趋势，将职业层面的指标与当期人口调查的受访者数据相匹配。^[8-1]

解读覆盖率指标的一个关键问题是：哪些劳动者应被视为"受处理组"？仅有 10% 的任务覆盖率是否足以产生就业效应？Gans 和 Goldfarb（2025）指出，若 O 形圈模型最能描述工作的性质，则只有当所有任务都具有一定程度的 AI 渗透时，才可能观察到就业效应。Hampole 等人（2025）认为，平均暴露度会降低劳动需求，但暴露度仅集中于某些特定任务则可能抵消这一效应。Autor 和 Thompson（2025）则强调了剩余任务所需的专业程度。

出于简洁考虑，并考虑到我们最关注的是大规模影响，我们的分析以均值暴露度最高的群体最先感受到影响这一假设为核心。我们将暴露度最高四分位数的劳动者与最低四分位数的劳动者进行比较。如果 AI 能力快速提升，较低百分位数的覆盖率可能也会变高，此时绝对阈值或许更为有用。但我们假设影响应首先波及暴露度最高的劳动者，并呈现了不同处理组界定阈值下的结果。

图 6 上半部分展示了 2016 年以来，暴露度最高四分位数劳动者与未暴露群体失业率的原始趋势。新冠疫情期间，AI 暴露度较低的劳动者——他们更有可能从事需要现场工作的岗位——失业率出现了大幅上升。此后，两组群体的趋势大体相似。图 6 下半部分在双重差分框架下衡量了两组之间差距的大小，与原始数据的发现相互印证。ChatGPT 发布以来，差距的汇总估计值为 +0.0020（标准误 0.0019），变化幅度较小且不显著，这表明暴露度较高群体的失业率略有上升，但效应与零无异。^[9]

图 6：暴露度最高四分位数劳动者与无 AI 暴露劳动者失业率趋势（当期人口调查）

上半部分展示暴露度最高四分位数劳动者（红线）与覆盖率为零的 30% 劳动者（蓝线）的失业率。下半部分在双重差分框架下衡量两组之间的差距。

这一框架能够识别哪类情景？根据汇总估计的置信区间，约 1 个百分点的失业率差异性上升是可检测的（随着新数据的加入，这一数值将有所变化，因此仅为粗略估计）。若最高 10% 的劳动者全部被裁员，最高四分位数群体的失业率将从 3% 跃升至 43%，总体失业率将从 4% 上升至 13%。

一个规模较小但仍令人担忧的情景，是"白领劳动者的大衰退"。2007—2009 年大衰退期间，美国失业率从 5% 翻倍至 10%。若最高四分位数暴露群体的失业率也翻倍，将从 3% 升至 6%，这在我们的分析中应当是可见的。需要注意的是，我们的核心估计基于暴露组相对于低暴露组失业率的差异性变化。若所有劳动者的失业率同步上升，我们不会将其归因于仍有大量任务未受影响的 AI 进展。

一个尤为值得关注的群体是年轻劳动者。Brynjolfsson 等人报告称，在暴露职业中，22 至 25 岁劳动者的就业人数下降了 6%—16%。他们将这一下降主要归因于招聘放缓，而非离职增加。^[10]

我们发现，暴露职业中年轻劳动者的失业率持平（见附录）。但招聘放缓不一定会表现为失业率上升，因为许多年轻劳动者是初次进入劳动力市场者，在 CPS 数据中没有列出职业，他们可能选择退出劳动力市场，而不是以失业者身份出现。为直接衡量招聘情况，我们利用 CPS 的面板维度，统计了年轻劳动者（22—25 岁）随时间推移进入高暴露度与低暴露度职业的比例。图 7 展示了年轻劳动者的月度求职成功率（即劳动者报告了其上月未有的新工作），按进入高暴露度与低暴露度职业分组。

图 7：22—25 岁劳动者在高观测暴露度与无 AI 暴露职业中的新工作开始情况（当期人口调查）

上半部分展示进入高暴露度（蓝线，最多暴露）与无暴露度（红线，无暴露）职业的年轻劳动者新工作开始比例。下半部分在双重差分框架下衡量两组之间的差距。汇总后估计值为 -14.3（标准误 7.2）。

除 2020—2021 年出现大幅波动外，这两组序列在视觉上于 2024 年出现分化，年轻劳动者进入暴露度较高职业的可能性相对降低。低暴露度职业的求职成功率稳定维持在每月 2%，而进入暴露度最高职业的比例则下降了约 0.5 个百分点。ChatGPT 发布后时期的平均估计值为，与 2022 年相比，暴露职业的求职成功率下降了 14%，尽管这一结果仅勉强达到统计显著性水平。（25 岁以上劳动者中未见类似下降。）

这或许提供了 AI 对就业产生早期影响的某种信号，与 Brynjolfsson 等人的发现相呼应。但也存在若干替代性解释：未被录用的年轻劳动者可能留在了原有岗位、转向了其他工作，或重返校园。此外，还有一个与数据相关的注意事项：在调查中，工作转换可能更容易出现测量误差。^[11]

讨论

本报告提出了一种理解 AI 劳动力市场效应的新测量方法，并研究了其对失业率和招聘的影响。一个职业受 AI 影响的程度越高，意味着其任务在理论上可由 LLM 完成，且在我们平台上的自动化、工作相关使用场景中有所观察。我们发现，计算机程序员、客服代表和金融分析师属于暴露度最高的职业之列。利用美国调查数据，我们未发现暴露度最高职业的劳动者失业率受到影响，但有初步证据表明，22—25 岁劳动者进入这些职业的招聘速度略有放缓。

我们的工作是记录 AI 对劳动力市场影响的第一步。我们希望本报告中采用的分析步骤——尤其是关于覆盖率和反事实分析的部分——能够随着就业和 AI 使用新数据的出现而便于更新。一套成熟的方法有助于未来的观察者从噪音中识别信号。

现有工作尚有若干改进空间。我们的使用数据将在未来更新中纳入，形成经济中任务和职业覆盖情况的动态图景。Eloundou 等人的指标也可以更新，因为它与 2023 年初的 LLM 能力相关联。此外，鉴于围绕年轻劳动者和劳动力市场新进入者的初步结果，一个关键的后续步骤可能是研究拥有暴露领域教育背景的应届毕业生如何应对当前的劳动力市场。

数据可用性

任务和职业层面的观测覆盖率数据可在以下地址获取：https://huggingface.co/datasets/Anthropic/EconomicIndex

引用格式

@online{massenkoffmccrory2026labor,
  author = {Maxim Massenkoff and Peter McCrory},
  title  = {Labor market impacts of AI: A new measure and early evidence},
  date   = {2026-03-05},
  year   = {2026},
  url    = {https://www.anthropic.com/research/labor-market-impacts},
}

参考文献

Acemoglu, Daron 与 Pascual Restrepo，"Robots and Jobs: Evidence from US Labor Markets"，Journal of Political Economy，2020，128(6)，2188–2244。

Acemoglu, Daron、David Autor、Jonathon Hazell 与 Pascual Restrepo，"Artificial intelligence and jobs: Evidence from online vacancies"，Journal of Labor Economics，2022，40(S1)，S293–S340。

Appel, Ruth、Maxim Massenkoff、Peter McCrory、Miles McCain、Ryan Heller、Tyler Neylon 与 Alex Tamkin，"Anthropic Economic Index report: economic primitives"，2026。

Autor, David H、David Dorn 与 Gordon H Hanson，"The China syndrome: Local labor market effects of import competition in the United States"，American Economic Review，2013，103(6)，2121–2168。

Autor, David H 与 N. Thompson，"Expertise"，NBER Working Paper，(w33941)，2025。

Blinder, Alan S 等，"How many US jobs might be offshorable?"，World Economics，2009，10(2)，41。

Borusyak, Kirill、Peter Hull 与 Xavier Jaravel，"Quasi-experimental shift-share research designs"，The Review of Economic Studies，2022，89(1)，181–213。

Brynjolfsson, Erik、Bharat Chandar 与 Ruyu Chen，"Canaries in the coal mine? Six facts about the recent employment effects of artificial intelligence"，Digital Economy，2025。

Eckhardt, Sarah 与 Nathan Goldschlag，"AI and Jobs: The Final Word (Until the Next One)"，Economic Innovation Group (EIG)，2025 年 8 月。网址：https://eig.org/ai-and-jobs-the-final-word/

Eloundou, Tyna、Sam Manning、Pamela Mishkin 与 Daniel Rock，"GPTs are GPTs: An early look at the labor market impact potential of large language models"，arXiv preprint arXiv:2303.10130，2023。

Fujita, S.、Moscarini, G. 与 Postel-Vinay, F.，"Measuring employer-to-employer reallocation"，American Economic Journal: Macroeconomics，16(3)，1–51，2024。

Gans, Joshua S. 与 Goldfarb, Avi，"O-Ring Automation"，NBER Working Paper No. 34639，2025 年 12 月。网址：https://ssrn.com/abstract=5962594

Gimbel, Martha、Molly Kinder、Joshua Kendall 与 Maddie Lee，"Evaluating the Impact of AI on the Labor Market: Current State of Affairs"，Research Report，The Budget Lab at Yale，2025 年 10 月。网址：https://budgetlab.yale.edu

Graetz, Georg 与 Guy Michaels，"Robots at Work"，Review of Economics and Statistics，2018，100(5)，753–768。

Hampole, Menaka、Dimitris Papanikolaou、Lawrence DW Schmidt 与 Bryan Seegmiller，"Artificial intelligence and the labor market"，National Bureau of Economic Research，2025。

Handa, Kunal、Alex Tamkin、Miles McCain、Saffron Huang、Esin Durmus、Sarah Heck、Jared Mueller、Jerry Hong、Stuart Ritchie、Tim Belonax、Kevin K. Troy、Dario Amodei、Jared Kaplan、Jack Clark 与 Deep Ganguli，"Which Economic Tasks are Performed with AI? Evidence from Millions of Claude Conversations"，2025。

Hui, Xiang、Oren Reshef 与 Luofeng Zhou，"The short-term effects of generative artificial intelligence on employment: Evidence from an online labor market"，Organization Science，2024，35(6)，1977–1989。

Johnston, Andrew 与 Christos Makridis，"The labor market effects of generative AI: A difference-in-differences analysis of AI exposure"，Available at SSRN 5375017，2025。

Massenkoff, Maxim，"How predictable is job destruction? Evidence from the Occupational Outlook"，Working Paper，2025。

Ozimek, Adam，"Overboard on Offshore Fears"，2019。网址：https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3777307

Tamkin, Alex 与 Peter McCrory，"Estimating AI productivity gains from Claude conversations"，2025。

Tomlinson, K.、Jaffe, S.、Wang, W.、Counts, S. 与 Suri, S.，"Working with AI: measuring the applicability of generative AI to occupations"，arXiv preprint arXiv:2507.07935，2025。

脚注

工作可离岸化：Blinder 等人（2009）与 Ozimek（2019）；政府增长预测：Massenkoff（2025）；机器人：Graetz 和 Michaels（2018）与 Acemoglu 和 Restrepo（2020）；中国冲击：Autor 等人（2013）与 Borusyak 等人（2022）。↩︎
Brynjolfsson 等人（2025）利用 Eloundou 等人（2023）的任务暴露度指标和 ADP 的薪资数据，比较了暴露度较高与较低职业劳动者的就业趋势。Johnston 和 Makridis（2025）使用美国行政数据进行了类似的基于任务的分析，但将处理变量汇总至行业层面。Hui 等人（2024）研究了 Upwork 上的自由职业岗位如何响应 ChatGPT 及先进图像生成工具的发布，通过比较直接受影响类别与未受影响类别的劳动者，在每种工具发布日期前后进行对比。Hampole 等人（2025）利用历史大学招聘网络为企业层面的 AI 采用率构建工具变量：历史上从毕业生后来进入 AI 相关岗位的大学招聘的企业，面临更低的采用成本。↩︎
我们的任务级和职业级暴露度指标可以方便地纳入其他使用数据，并推广至不同国家。我们计划随时间推移将这一方法应用于新的场景。↩︎
在他们的框架中，"直接暴露"任务是指借助 LLM（输入限制 2,000 词，无法获取近期事实）可在一半时间内完成的任务。"借助工具暴露"的任务是指借助可访问信息检索、图像处理等软件的 LLM 可实现同等加速的任务。未暴露任务则是指使用 LLM 无法将完成时间缩短 50% 或以上的任务。↩︎
我们使用过去两期 Anthropic 经济指数数据集，涵盖 2025 年 8 月和 11 月的使用情况。对于语义高度相似的 O*NET 任务，我们将计数拆分分配。↩︎
每个步骤都涉及判断性选择：Eloundou 等人（2023）的指标应以 {0, 0.5, 1} 还是其他方式纳入？"显著"使用量如何界定？对于与高使用量任务非常相似、但在经济指数抽样中因过于罕见而未被单独捕捉的任务，应如何处理？自动化工作流相比辅助性使用应赋予多大权重？附录中扩展讨论了一个令人宽慰的发现：在上述问题的多种解决方案下，职业暴露度的 Spearman（秩-秩）相关性极高。↩︎
附录详见此处。↩︎
为将 O*NET-SOC 代码与 CPS 中的 occ1990 代码进行匹配，我们使用了 Eckhart 和 Goldschlag（2025）提供的交叉对照表。↩︎↩︎
我们在附录中通过三种方式对此进行了进一步探讨：首先，我们检验了用于界定处理组的百分位数截断值是否重要，将其从中位数变化至第 95 百分位数——在所有情况下，影响均持平或为负值（即暴露组的失业率有所下降）；其次，我们专门关注年轻劳动者，即与 Brynjolfsson 等人（2025）相同的 22—25 岁群体；最后，我们使用劳工部的失业保险申领数据来衡量失业率，而非 CPS 调查回答。在所有扩展分析中，我们均未发现对暴露职业的明确影响。↩︎
这一区间较宽，因为作者针对多个反事实情景提供了估计值。6 个百分点的下降是相对于就业增长持平的反事实情景而言的；16 个百分点的估计来自于对同一企业内不同职业的相似劳动者进行比较的设计。↩︎
参见 Fujita 等人（2024）。↩︎