AI如何重塑工作方式？Anthropic内部调查揭示工程师的真实体验

AI究竟如何改变我们的工作方式？我们此前关于AI经济影响的研究着眼于整个劳动力市场，涵盖了各种不同的工作岗位。但如果我们更详细地研究一些最早采用AI技术的群体——比如我们自己呢？

2025年8月，我们将目光转向内部，调查了132名Anthropic的工程师和研究人员，进行了53次深入的定性访谈，并研究了内部Claude Code的使用数据，以了解AI的使用如何在Anthropic内部引发变革。

我们发现，AI的使用正在从根本上改变软件开发人员的工作性质，既带来了希望，也引发了担忧。

研究背景与方法

我们的研究揭示了一个面临重大变革的工作场所：工程师们的工作效率大幅提升，变得更加“全栈”（能够完成超出其专业范围的任务），学习和迭代速度加快，并开始处理以前被忽视的任务。

这种工作广度的扩展也引发了人们对权衡的思考——有些人担心这可能意味着失去更深层次的技术能力，或者变得不那么能够有效监督Claude的输出；而另一些人则欣然接受这个机会，以更广阔的视野和更高的层次进行思考。

我们认识到，在一家构建AI的公司研究AI的影响意味着代表了一种特权地位——我们的工程师能够早期接触尖端工具，在一个相对稳定的领域工作，并且他们自己正在推动影响其他行业的AI转型。

尽管如此，我们认为研究和发布这些发现总体上是有用的，因为Anthropic内部工程师正在经历的变化，可能仍然是更广泛社会变革的一个有启发性的先兆。

主要发现

调查数据

Anthropic的工程师和研究人员最常使用Claude来修复代码错误和了解代码库。调试和代码理解是最常见的用途（图1）。
员工报告Claude使用率增加和生产力提升。员工自我报告称，他们在60%的工作中使用Claude，并实现了50%的生产力提升，较去年同期增长了2-3倍。这种生产力提升表现为每个任务类别花费的时间略有减少，但产出量大幅增加（图2）。
27%的Claude辅助工作由原本不会完成的任务组成，例如扩展项目、制作锦上添花的工具（如交互式数据仪表板），以及如果手动完成则成本效益不高的探索性工作。
大多数员工频繁使用Claude，但报告称他们只能将0-20%的工作“完全委托”给AI。Claude是一个持续的协作者，但使用它通常需要积极的监督和验证，尤其是在高风险工作中——而不是完全无需验证地移交任务。

定性访谈

员工正在培养AI委托的直觉。工程师倾向于委托那些易于验证、风险低（例如“一次性的调试或研究代码”）或枯燥的任务（“我对任务越兴奋，就越可能不使用Claude”）。许多人描述了信任的递进过程，从简单任务开始，逐渐委托更复杂的工作。虽然他们目前仍保留大多数设计或“品味”任务，但随着模型的改进，这个界限正在被重新协商。
技能组合正在扩展到更多领域，但某些技能实践减少。Claude使人们能够将技能扩展到更多软件工程领域，但一些员工也矛盾地担心，编写和批判代码所需的更深层次技能会退化——“当产出如此容易和快速时，实际上花时间学习东西变得越来越难。”
与编码技艺的关系正在改变。一些工程师欣然接受AI辅助，并专注于结果；另一些人则表示“当然，我确实怀念[编写代码]的某些部分。”
职场社交动态可能正在改变。Claude现在是以前会问同事的问题的首选——一些人报告说，因此导师指导和协作机会减少了。
职业演变与不确定性。工程师报告称，他们正转向管理AI系统的更高层次工作，并报告了显著的生产力提升。然而，这些变化也引发了关于软件工程作为职业的长期轨迹的问题。一些人对未来表达了矛盾的感觉：“我短期感到乐观，但长期来看，我认为AI最终会做所有事情，让我和许多其他人变得无关紧要。”其他人则强调真正的不确定性，只说“很难说”几年后他们的角色会是什么样子。

Claude Code使用趋势

Claude正在更自主地处理日益复杂的任务。六个月前，Claude Code在需要人工输入之前大约能独立完成10个操作。现在，它通常能处理大约20个操作，需要更少的人工引导来完成更复杂的工作流程（图3）。工程师越来越多地使用Claude处理复杂任务，如代码设计/规划（使用率从1%升至10%）和实现新功能（14%至37%）（图4）。
Claude修复了许多“小问题”。8.6%的Claude Code任务涉及修复提高生活质量的小问题，例如为提高可维护性而重构代码（即“修复小问题”），人们说这些通常会被降低优先级。这些小修复可以累积成更大的生产力和效率收益。
每个人都在变得更加“全栈”。不同的团队以不同的方式使用Claude，通常是为了增强他们的核心专业知识——安全团队用它来分析不熟悉的代码，对齐与安全团队用它来构建数据的前端可视化等等（图5）。

调查数据详情

我们调查了来自组织各部分的132名Anthropic工程师和研究人员，以更好地了解他们日常究竟如何使用Claude。

人们使用Claude处理哪些编码任务？

我们要求受访的工程师和研究人员评估他们使用Claude处理各种编码任务的频率，例如“调试”（使用Claude帮助修复代码错误）、“代码理解”（让Claude解释现有代码以帮助用户理解代码库）、“重构”（使用Claude帮助重组现有代码）和“数据科学”（例如让Claude分析数据集并制作条形图）。

下图显示了最常见的日常任务。大多数员工（55%）每天使用Claude进行调试。42%的人每天使用Claude进行代码理解，37%的人每天使用Claude实现新功能。使用频率较低的任务是高层设计/规划（可能是因为这些任务人们倾向于保留在人类手中），以及数据科学和前端开发（可能是因为它们总体上是不太常见的任务）。这与“Claude Code使用趋势”部分报告的使用数据分布大致一致。

图1：各种编码任务（y轴）的日常用户比例（x轴）。

使用率与生产力

员工自我报告称，12个月前，他们在28%的日常工作中使用Claude，并从中获得了+20%的生产力提升；而现在，他们在59%的工作中使用Claude，平均实现了+50%的生产力提升。

年度对比相当显著——这表明两项指标在一年内增长了超过2倍。使用率和生产力也密切相关，在分布的极端情况下，14%的受访者通过使用Claude将生产力提高了100%以上——这些是我们内部的“高级用户”。

需要说明的是，生产力很难精确衡量。AI研究非营利组织METR最近的研究表明，在高度熟悉的代码库上与AI合作的经验丰富的开发人员高估了AI带来的生产力提升。尽管如此，METR确定的导致生产力低于预期的因素（例如AI在大型、复杂环境中表现较差，或者需要大量隐性知识/上下文的情况）与我们的员工表示他们不委托给Claude的任务类型密切相关。我们员工自我报告的跨任务生产力提升，可能反映了员工正在培养战略性的AI委托技能——这是METR研究中未考虑的因素。

当询问员工，在他们当前使用Claude的任务类别中，AI如何影响他们在该类别中的总体时间花费和工作产出量时，出现了一个有趣的生产力模式。在几乎所有任务类别中，我们看到时间花费净减少，产出量净增加幅度更大：

图2：按任务（y轴）对时间花费（左图）和产出量（右图）的影响。每个图的x轴对应于自我报告的减少…

更多 AI 前沿技术与设计灵感，欢迎关注「设计小站」公众号（ID：sjxz00），一起探索科技与设计的融合创新。

AI如何重塑工作方式？Anthropic内部调查揭示工程师的真实体验

AI如何重塑工作方式？Anthropic内部调查揭示工程师的真实体验

研究背景与方法

主要发现

调查数据

定性访谈

Claude Code使用趋势

调查数据详情

人们使用Claude处理哪些编码任务？

使用率与生产力

标签