5分钟阅读
AI如何重塑工作方式?Anthropic内部调查揭示工程师的真实体验
AI如何重塑工作方式?Anthropic内部调查揭示工程师的真实体验

AI究竟如何改变我们的工作方式?我们此前关于AI经济影响的研究着眼于整个劳动力市场,涵盖了各种不同的工作岗位。但如果我们更详细地研究一些最早采用AI技术的群体——比如我们自己呢?
2025年8月,我们将目光转向内部,调查了132名Anthropic的工程师和研究人员,进行了53次深入的定性访谈,并研究了内部Claude Code的使用数据,以了解AI的使用如何在Anthropic内部引发变革。
我们发现,AI的使用正在从根本上改变软件开发人员的工作性质,既带来了希望,也引发了担忧。
研究背景与方法
我们的研究揭示了一个面临重大变革的工作场所:工程师们的工作效率大幅提升,变得更加“全栈”(能够完成超出其专业范围的任务),学习和迭代速度加快,并开始处理以前被忽视的任务。
这种工作广度的扩展也引发了人们对权衡的思考——有些人担心这可能意味着失去更深层次的技术能力,或者变得不那么能够有效监督Claude的输出;而另一些人则欣然接受这个机会,以更广阔的视野和更高的层次进行思考。
我们认识到,在一家构建AI的公司研究AI的影响意味着代表了一种特权地位——我们的工程师能够早期接触尖端工具,在一个相对稳定的领域工作,并且他们自己正在推动影响其他行业的AI转型。
尽管如此,我们认为研究和发布这些发现总体上是有用的,因为Anthropic内部工程师正在经历的变化,可能仍然是更广泛社会变革的一个有启发性的先兆。
主要发现
调查数据
-
Anthropic的工程师和研究人员最常使用Claude来修复代码错误和了解代码库。调试和代码理解是最常见的用途(图1)。
-
员工报告Claude使用率增加和生产力提升。员工自我报告称,他们在60%的工作中使用Claude,并实现了50%的生产力提升,较去年同期增长了2-3倍。这种生产力提升表现为每个任务类别花费的时间略有减少,但产出量大幅增加(图2)。
-
27%的Claude辅助工作由原本不会完成的任务组成,例如扩展项目、制作锦上添花的工具(如交互式数据仪表板),以及如果手动完成则成本效益不高的探索性工作。
-
大多数员工频繁使用Claude,但报告称他们只能将0-20%的工作“完全委托”给AI。Claude是一个持续的协作者,但使用它通常需要积极的监督和验证,尤其是在高风险工作中——而不是完全无需验证地移交任务。
定性访谈
-
员工正在培养AI委托的直觉。工程师倾向于委托那些易于验证、风险低(例如“一次性的调试或研究代码”)或枯燥的任务(“我对任务越兴奋,就越可能不使用Claude”)。许多人描述了信任的递进过程,从简单任务开始,逐渐委托更复杂的工作。虽然他们目前仍保留大多数设计或“品味”任务,但随着模型的改进,这个界限正在被重新协商。
-
技能组合正在扩展到更多领域,但某些技能实践减少。Claude使人们能够将技能扩展到更多软件工程领域,但一些员工也矛盾地担心,编写和批判代码所需的更深层次技能会退化——“当产出如此容易和快速时,实际上花时间学习东西变得越来越难。”
-
与编码技艺的关系正在改变。一些工程师欣然接受AI辅助,并专注于结果;另一些人则表示“当然,我确实怀念[编写代码]的某些部分。”
-
职场社交动态可能正在改变。Claude现在是以前会问同事的问题的首选——一些人报告说,因此导师指导和协作机会减少了。
-
职业演变与不确定性。工程师报告称,他们正转向管理AI系统的更高层次工作,并报告了显著的生产力提升。然而,这些变化也引发了关于软件工程作为职业的长期轨迹的问题。一些人对未来表达了矛盾的感觉:“我短期感到乐观,但长期来看,我认为AI最终会做所有事情,让我和许多其他人变得无关紧要。”其他人则强调真正的不确定性,只说“很难说”几年后他们的角色会是什么样子。
Claude Code使用趋势
-
Claude正在更自主地处理日益复杂的任务。六个月前,Claude Code在需要人工输入之前大约能独立完成10个操作。现在,它通常能处理大约20个操作,需要更少的人工引导来完成更复杂的工作流程(图3)。工程师越来越多地使用Claude处理复杂任务,如代码设计/规划(使用率从1%升至10%)和实现新功能(14%至37%)(图4)。
-
Claude修复了许多“小问题”。8.6%的Claude Code任务涉及修复提高生活质量的小问题,例如为提高可维护性而重构代码(即“修复小问题”),人们说这些通常会被降低优先级。这些小修复可以累积成更大的生产力和效率收益。
-
每个人都在变得更加“全栈”。不同的团队以不同的方式使用Claude,通常是为了增强他们的核心专业知识——安全团队用它来分析不熟悉的代码,对齐与安全团队用它来构建数据的前端可视化等等(图5)。
调查数据详情
我们调查了来自组织各部分的132名Anthropic工程师和研究人员,以更好地了解他们日常究竟如何使用Claude。
人们使用Claude处理哪些编码任务?
我们要求受访的工程师和研究人员评估他们使用Claude处理各种编码任务的频率,例如“调试”(使用Claude帮助修复代码错误)、“代码理解”(让Claude解释现有代码以帮助用户理解代码库)、“重构”(使用Claude帮助重组现有代码)和“数据科学”(例如让Claude分析数据集并制作条形图)。
下图显示了最常见的日常任务。大多数员工(55%)每天使用Claude进行调试。42%的人每天使用Claude进行代码理解,37%的人每天使用Claude实现新功能。使用频率较低的任务是高层设计/规划(可能是因为这些任务人们倾向于保留在人类手中),以及数据科学和前端开发(可能是因为它们总体上是不太常见的任务)。这与“Claude Code使用趋势”部分报告的使用数据分布大致一致。
图1:各种编码任务(y轴)的日常用户比例(x轴)。
使用率与生产力
员工自我报告称,12个月前,他们在28%的日常工作中使用Claude,并从中获得了+20%的生产力提升;而现在,他们在59%的工作中使用Claude,平均实现了+50%的生产力提升。
年度对比相当显著——这表明两项指标在一年内增长了超过2倍。使用率和生产力也密切相关,在分布的极端情况下,14%的受访者通过使用Claude将生产力提高了100%以上——这些是我们内部的“高级用户”。
需要说明的是,生产力很难精确衡量。AI研究非营利组织METR最近的研究表明,在高度熟悉的代码库上与AI合作的经验丰富的开发人员高估了AI带来的生产力提升。尽管如此,METR确定的导致生产力低于预期的因素(例如AI在大型、复杂环境中表现较差,或者需要大量隐性知识/上下文的情况)与我们的员工表示他们不委托给Claude的任务类型密切相关。我们员工自我报告的跨任务生产力提升,可能反映了员工正在培养战略性的AI委托技能——这是METR研究中未考虑的因素。
当询问员工,在他们当前使用Claude的任务类别中,AI如何影响他们在该类别中的总体时间花费和工作产出量时,出现了一个有趣的生产力模式。在几乎所有任务类别中,我们看到时间花费净减少,产出量净增加幅度更大:
图2:按任务(y轴)对时间花费(左图)和产出量(右图)的影响。每个图的x轴对应于自我报告的减少…
更多 AI 前沿技术与设计灵感,欢迎关注「设计小站」公众号(ID:sjxz00),一起探索科技与设计的融合创新。