
向 Claude Code 提设备需求,却刻意不在 prompt 中说起任何具体器具,它会更倾向于选择用什么器具?又会展现出哪些偏好特征?
最近,专注于量化 AI 主不雅决策的基准测试责任室Amplifying.ai,针对 Claude Code 的器具选择倾向开展了一项系统性接头。
接头粉饰 3 款模子、4 种口头类型及 20 个器具类别,累计分析了 2430 次器具选择活动。

实验全程秉承灵通式领导词,举例"我应该用什么?",完全不包含器具称呼,同期记载 Claude Code 在本色操作中的器具选择成果。

通过测试,团队得出了以下几项中枢论断:
1、倾向"自建"而非选用第三方器具:
Claude Code 更倾向于我方编写自界说搞定决议,而不是平直推选现成的第三方器具。自界说 /DIY 罢了占扫数主要选择的 12%(2073 次中的 252 次),成了最常见的选择。
2、默许时代栈断然变成:
Claude Code 选择第三方器具时,会齐集选:Vercel、PostgreSQL、Stripe、Tailwind CSS、shadcn/ui、pnpm、GitHub Actions、Sentry、Resend、Zustand。除此除外,还会确认不同时代栈选择专属器具,比 JS 口头用 Drizzle 作念 ORM、Python 口头用 SQLModel 作念 ORM;Next.js 口头用 NextAuth.js 作念认证;JS 口头用 Vitest 作念测试、Python 口头用 pytest 作念测试。
3、部分器具类别已"锁定"单一器具:
GitHub Actions 占据 CI/CD 类别 94% 的选择,shadcn/ui 占据 UI 组件类别 90% 的选择,Stripe 占据了支付类别 91% 的选择。
4、归拢时代生态下,不同模子选择高度一致:
在归拢世态(比如王人是 JS 或王人是 Python)内比拟时,三个模子在 20 个类别中的 18 个,王人选择了调换的首选器具。只消缓存和及时通讯两个类别,不同模子之间有信得过的不对;另外有 3 个看似有不对的类别,其实是因为羼杂了 JS 和 Python 成果,并非真实不对。
5、口头高下文比指示措辞更清苦:
归拢器具类别在不同代码仓库(repo)中,Claude Code 的选择会随口头类型变化。比如 Next.js 口头会选 Vercel,Python 口头会选 Railway。但如若是归拢个口头,哪怕用 5 种不同的形式表述指示,它的选择剖析性平均能达到 76%。

以下是更多细节。
实验建造
为探究 Claude Code 的器具选择逻辑,接头团队搭建 4 个全新代码仓库(repo)开展测试,针对 20 个器具类别谋略了 100 条灵通式指示。
测试粉饰 Claude Sonnet 4.5、Opus 4.5、Opus 4.6 三款模子,每款模子孤独入手三次;且在每条指示现实前,均现实 git checkout . && git clean -fd 号召,以确保代码环境处于白净情状。

扫数 prompt 均未指定具体器具,举例:

当 Claude Code 给出反映后,会有一个挑升的子智能体来处理这个成果,它不矜重现实任务,只矜重读完沿路内容,然后挑出内部最中枢的阿谁器具推选。

接头团队还翔实诠释实验秉承的评估方法与各项见地。

需要重视的是,并非 20 个器具类别王人在 4 个仓库中完成测试,部分类别因与仓库口头类型不匹配未被纳入,具体粉饰情况与领导词数目统计如下:

团队极度强调,本接头聚焦于 AI 代码助手的显性偏好分析,既不代表设备者的确凿偏好,也不组成对器具质料的评估。
接头成果心爱我方从零搭立功能
测试中,Claude Code 不绝选择从零搭立功能,而非平直推选第三方器具。
举例,当需求为"添加功能象征"时,它不会冷落使用 LaunchDarkly 这类现成器具,而是基于环境变量与框架基础功能,无缺罢了一套功能象征系统。
"自界说 /DIY "决议在 12 个不同器具类别中,累计被选为首选 252 次,跳跃 GitHub Actions(152 次)、Vitest(101 次)等热点器具。
不外需要诠释的是,该数据是跨 12 个类别的汇总成果,而其他器具仅在特定类别中被推选,二者并非归拢类别内的平直对比。在多器具可选的具体类别中,"自界说 /DIY "在功能象征与身份认证鸿沟的推选率最高。

针对"是否存在子智能体将复杂回复误判为自界说决议"的疑问,接头团队东说念主工抽查了 50 个象征为"自界说 /DIY "的案例,幸运5成果清楚约 80% 为确凿的从零搭建场景。剩余 20% 存在鸿沟迁延的情况,这意味着确凿的"自界说 /DIY "比例可能略低于论说数据,但中枢论断不变—— Claude Code 彰着更偏疼自主构建决议。
哪个器具被首选的概率最高?
在沿路 2073 条可提真金不怕火器具推选的反映中(不含"自界说 /DIY "决议),被选为首选器具次数最多的前 20 名如下:

具体来看,实验中有 4 个器具类别呈现出单一器具主导率超 75% 的特征。
CI/CD:GitHub Actions 以 93.8% 的首选率占据完全上风;
支付处理(Payments):Stripe 首选率高达 91.4%;
UI 组件库(UI Components):shadcn/ui 以 90.1% 的占比成为默许选择;
部署(Deployment):JavaScript 生态下 Vercel 首选率达 100%,Python 生态则由 Railway 主导(82%)。

另有 8 个类别中,单一器具首选率处于 50% – 75% 区间:
{jz:field.toptypename/}

剩余 8 个类别未出现完全主导器具,扫数器具首选率均低于 50%。


不同模子的选择有什么不同?
在分属不同编程讲话生态的 20 个器具类别中,三款模子对其中 18 类的首选器具判定完全一致,一致率达 90%。
接头团队暗示,三款模子基于调换的基础历练数据集,高一致率的成果得当预期。信得过具备接头价值的是模子间 25% 的不对部分,这种各异不祥率并非源于模子对器具质料的孤独判断,而是由基于东说念主类反馈的强化学习(RLHF)调优战略不同,以及生成门径的专属微调各异导致。

从全体数据看,有 5 个类别的首选器具存在各异,其中 3 类是 JavaScript 与 Python 时代栈成果混杂导致的统计偏差,仅有缓存、及时通讯两类属于不同时代生态间的确凿不对。
15 个类别中,三款模子首选器具一致:

存在确凿生态内偏好各异或跨编程讲话判断不对的 5 个类别如下:

在归拢时代生态下,仅缓存与及时功能 2 个类别,三款模子出现确凿不对:

而 API 层的器具选择由设备框架决定,非模子驱动,归拢时代栈下三款模子的推选成果一致:

值得重视的是,归拢时代生态内,更新版块的模子更倾向于选择更新的器具。以下扫数占比均为生态内统计:

接头还追想了三款模子(Sonnet 4.5、Opus 4.5、Opus 4.6)的器具推选"作风"画像:
Sonnet 4.5:决策最果决,作风最保守,激烈偏好老练、主流的器具;
Opus 4.5:介于保守与求新之间,会研究更多备选决议,推选散布更均匀;
Opus 4.6:最驻防最新、前沿的器具,同期最倾向于推选自界说 /DIY 决议。

对比 4.5 代模子(Sonnet 4.5 与 Opus 4.5 平均值)与 Opus 4.6 在器具推选上的系统性各异,中枢论断是:
Opus 4.6 更倾向推选新器具与自界说决议,而 4.5 代模子更偏好老练剖析的器具。

更多论断:剖析性与场景依赖性显赫
接头团队针对每个器具类别,用 5 种不同措辞发问模子。若 5 次发问推选归拢器具,剖析性即为 100%;若措辞变化导致推选器具调动,则剖析性较低。
下图将扫数类别按剖析性分为 4 档,其中 API Layer、CI/CD、Databases 等类别,即便更换指示措辞,模子仍会推选归拢器具。

在归拢模子、归拢领导词、归拢代码仓库的条目下,三款模子 3 次孤独入手的推选成果一致性较高:
Package Manager、CI/CD、State Management、Testing、Payments,3 次推选完全一致的比例高达 87% – 93%,且未出现 3 次推选成果完全不同的情况。

团队还分析了模子在不同代码仓库中的器具推选一致性,发现器具推选可分为两类:一类是通用型器具,不受口头类型影响;另一类是时代栈专属器具,推选成果高度依赖口头的时代栈与旁边场景。

模子的器具推选高度依赖具体口头高下文。
团队细分 4 个测试仓库的每个器具类别,对比三款模子的选择各异发现:归拢模子在 Next.js 口头中会推选 Drizzle 手脚 ORM 器具,而在 Python 口头中则会选择 SQLModel(具体细节可查察无缺接头论说)。
临了,接头团队给出三方面中枢启示:
对器具厂商而言:Claude Code 正在重塑行业器具的默许选择。若器具未参加 AI 助手的推选列表,其在设备者责任流中的存在感可能将徐徐弱化。
对设备者而言:一套由 Claude Code 主导的新兴时代栈正在变成,它代表着 AI 援助设备模式下的共鸣选择。这些器具偶而是"最优解",却是模子最一致的推选选项。同期,"倾向自界说决议"的趋势也提醒设备者,需要评估是我方手搓的决议好,已经用老练库更能扛住永久迭代。
对 AI 团队而言:不同版块模子的活动特征各异确凿存在且可量化,"版块迭代梯度"气候,也考据了历练数据组成会影响器具推选倾向。
官方接头论说:https://amplifying.ai/research/claude-code-picks/report
— 接待 AI 居品从业者共建 —
� �「AI 居品学问库」是量子位智库基于永久居品库跟踪和用户活动数据推出的飞书学问库,旨在成为 AI 行业从业者、投资者、接头者的中枢信息关键与决策维持平台。
一键关怀 � � 点亮星标
科技前沿领略逐日见

备案号: