编译 | 傅宇琪、褚杏娟 开云(中国)kaiyun网页版登录入口
筹备 | Tina
近日,初创公司 Every 总司理 Kieran Klaassen 在 x 上默示我方用 Claude Code 编程时平均每天花 250 好意思元,也就是说一个月耗尽 6000 好意思元(约合 4.3 万东谈主民币)。他还晒出了详备的耗尽列表:
帖子发出后,网友们纷繁对 Klaassen 的耗尽默示不睬解:“你是买了 30 个 Max 套餐账户吗?照旧说你用的是 API 付费花式?我不懂。”“如果你花了这样多钱,还不如告成雇个开荒者呢!”
天然,也有开荒者认为 Klaassen 的作念法很有启发性,毕竟“6000 好意思元不算什么,只是高档工程师一周的薪资。”但月旦的声息照旧占了大多数。
随后,他在 x 上诠释称,“花了 6000 好意思金,多个 Agent 并走时行,一天提交了 10 个 PR,还完成重构并部署上线了。”他还默示:
张开剩余95%我知谈这让你不爽。又一个“望望我 AI 支出”的爆款帖子,齐是炒作,齐是杂音。
但你翻冷眼时,错过了关键点:这些智能体澈底改变了咱们的构建花式,不单是更快——而是十足不同。就像从统共乐器的演奏者酿成了交响乐团的率领。音乐变得更丰富,而你与创作的联系也十足改变了。
咱们唯独两个工程师。服务数千用户。曩昔需要数月的功能,当前几天就能上线。不是因为咱们写代码更快了,而是因为我学过音乐,学会了“率领” 😅。只是这次,率领的是智能体。
没错,账单看起来的确像是在博眼球。但后果呢?那些是实确切在的。当怀疑的东谈主还在争论这是否可连续时,咱们照旧在录用后果了。当他们在怨恨炒作时,咱们正在教育杰出咱们自身智力的系统。
软件开荒酿成了一场不同念念维花式头脑之间的合作艺术。
你可以链接无视这些账单截图,把一切齐作为炒作。但你每不雅望一天,领路它的东谈主和无法领路它的东谈主之间的差距就会更大一些。
在指摘区,他也说明了并非履行花掉了 6000 好意思元,而是产生了与其价值相配的资本。他也认为每个月花 6000 好意思元有点贵,但每月支付 2000 好意思元是可以秉承的。
Klaassen 推文中提到的后果也很显贵:他和 Nityesh Agarwal 照确切一周内录用了六项新功能、五个 Bug 竖立和三次基础设施更新。两东谈主履行上在短短三个月内,通过 AI 用具完成了 AI 邮箱经管用具 Cora 的开荒,并在发布后速即勾引了逾越 10,000 用户注册。
近期,Klaassen 和 Agarwa 两东谈主在 Dan Shipper 的播客节目上详备演示了其是怎样使用 Anthropic 的 Agentic 编程用具 Claude Code 责任并借此晋升工程遵循的。InfoQ 对这次访谈进行了翻译,并在不改变欢快上进行了增删,但愿能给全球带来一些启发。其中,部分中枢不雅点如下:
使用 AI 编程,不应仅限于写代码自身,还欺诈于调研和责任历程的构建,险些波及开荒过程中的每一个要害。
该团队默示照旧很久莫得使用 Cursor 或者其他 Agent 类编程用具了,因为 Claude Code 的体验远胜一筹,险些将复杂度镌汰了十倍。
Cora 团队当前的花式是尽量让 AI 完成履行责任,而东谈主类开荒者专注于经管这些 AI 用具。
一个点子能带来许多后续产出,这就是所谓的“复利效应”。团队有六七个任务是同期进行的,因为每当有了新想法,就坐窝出手扩充。
务必紧记在“价值最低”的阶段对 AI 的输出进行严格审核,确保尽早发现并修正问题。
使用 AI 编程,不应仅限于写代码自身,还欺诈于调研和责任历程的构建,险些波及开荒过程中的每一个要害。
该团队默示照旧很久莫得使用 Cursor 或者其他 Agent 类编程用具了,因为 Claude Code 的体验远胜一筹,险些将复杂度镌汰了十倍。
Cora 团队当前的花式是尽量让 AI 完成履行责任,而东谈主类开荒者专注于经管这些 AI 用具。
一个点子能带来许多后续产出,这就是所谓的“复利效应”。团队有六七个任务是同期进行的,因为每当有了新想法,就坐窝出手扩充。
务必紧记在“价值最低”的阶段对 AI 的输出进行严格审核,确保尽早发现并修正问题。
毁灭 Cursor,选拔 Claude Code
主理东谈主:固然 Cora 团队唯独两个东谈主,但通盘开荒节律和产出却像是一个 15 东谈主的团队。Kieran,你前几天说的一句话让我印象很深切:你们正在探索所谓“复利式工程(compounding engineering)”的可能性——每完成一个任务,齐会让后续任务变得更容易。我认为你们的教授值得被更多东谈主了解,因为咱们领有了新的用具,就需要建立新的原则和责任流。
Kieran:开荒 Cora 是一件特殊意思的事情,更意思的是能在 Enjoy 这样的环境中责任,这里不仅有先进的用具,还有丰富的念念想资源和全新的责任花式。这让咱们再行念念考“怎样构建家具”自身。咱们正在一边作念家具,一边尝试新纪律,这种探索自身就很勾引东谈主。
咱们常常会碰到多样新模子、新盘问用具,别东谈主问咱们何如看,咱们就在边用边学的过程中抵制尝试。最近几周,Nityesh 和我齐昭彰感受到一种转变正在发生:一场由新模子、念念维花式、MCP 等推动的系统性变革。
主理东谈主:具体改变了什么?你们当前渐渐成型的责任历程大致是什么样的?
Kieran:对我来说,最关键的转变是我意志到“AI 编程”不单是代码自身的生成。它应该贯串通盘历程,从前期的盘问到联想责任历程,再到具体扩充,每一步齐能借助 AI。如今的 Agent 照旧弥漫刚劲,能胜任险些统共要害,因此咱们需要澈底再行念念考通盘开荒花式。
以前咱们用 Cursor 或 Windsurf 之类的用具,属于更传统的“代码补全”阶段。而当前,咱们出手告成给 Agent 派遣任务就能完成。尽管最终的产出仍然需要东谈主工合作与指引,但咱们要学会更深入地拥抱这一花式。
Claude Code 就是一个特殊优秀的编码 Agent,能很好地领路和扩充复杂指示,尤其在与新模子蚁集之后,智力显贵晋升。倏得之间,我意志到:咱们照旧进入了阿谁“Agent 期间”。这不再是实验室里的宗旨,而是真确能用来构建真实家具的技能。咱们就是在用它作念欺诈,而况它真的在责任。
主理东谈主:你们何如使用 Claude Code?
Kieran:Claude Code 是 Anthropic 推出的一款编码 Agent,底层使用的是 Claude 模子,它以大叫行界面(CLI)的边幅运行在土产货末端中。关于不太懂技能的东谈主来说,大叫行可能看起来有些吓东谈主,但我照旧到手劝服一些非技能布景的一又友尝试使用 Claude Code,他们也认为很好用。
主理东谈主:掀开的末端是那种黑底白字的经典界面,看起来像 DOS 系统。Kieran 只输入了 “Claude”,屏幕上就出现了 “Welcome to Claude Code” 的接待信息,并有一个输入框可以键入大叫。
Kieran:Claude Code 和普通的 Claude 模子不同,它领有对土产货目次和蓄意机的探望权限,能浏览文献、运行土产货大叫、截取网页截图,致使进行网页搜索,内置的用具远比普通 Claude 丰富。这点很关键,因为作念工程开荒不单是是写代码。你需要知谈 GitHub 上的需乞降任务情状,了解 CI/CD 历程是否正常,测试是否通过等等。而领有这些功能的编码 Agent,才真确具备完成一个完满责任历程的智力。
我可以让它自动扩充我往常要作念的事。这恰是“复利式工程”产生作用的场所——Agent 不仅写代码,还参与了通盘开荒险阻游历程。大多数工程师的时刻并不主要花在编写代码上,而是花在搞涌现“下一步要作念什么”,怎样领路用户反馈并作出反应。这些事情,Claude Code 当前齐可以帮上忙。
主理东谈主:而况这些内容的组织花式很透露,既能让工程师读懂,也便捷非技能团队使用。
Kieran:咱们当前险些全力在股东“让 AI 作念事、咱们来经管 AI”的模式。比如,有东谈主来问我某个功能当前的情状或下周发布什么内容,我可以告成让 Claude 查 pipeline,看行将推出的内容。
全球应该照旧能感受到 Claude Code 的逻辑了:一朝你把统共信息系统接入它,使用起来就特殊顺畅。对我来说,Claude Code 是当前最天真的用具,不仅能解决编程问题,还能参与通盘工程历程。许多编码 Agent 只聚焦在写代码上,但我但愿它能成为通盘工程责任的援手系统。
Anthropic 的团队在联想这款用具时,昭着磋商到了这极少。它莫得被收尾在某个特定用例上,而是保持了高度的通用性,同期又能精确解决问题。它能领路险阻文、分析我方那儿作念错了并进行修正。这些智力蚁集起来,才真确让它具备了当前可以参预履行使用的水平。
主理东谈主:传统的“写代码”和当前的“Agent 合作编程”之间,最本色的诀别是什么?
Nityesh:相较于咱们熟谙的 Cursor 和 Windsurf 等用具,Agentic Coding 其实提供了肖似的智力,但 Claude Code 更进一步,把整件事简化了一个数目级。
Kieran:固然大叫行界濒临有些东谈主来说可能看起来很复杂,但其实它比像 Windsurf、Cursor 那样的图形界面更肤浅。Claude Code 的界面唯唯一个文本输入框,莫得快捷键、莫得界面按钮,唯独纯文本交互。因为底层 Claude 模子智力更强了,它可以连续责任、调用更多用具,是以反而变得更刚劲。固然它和 Cursor 背后齐是 Claude,但 Claude Code 简洁的界面带来了更大的天真性。
我今天早上就用它查了一下数据方针。那时我在想:“为什么这份用户反馈表单十足莫得任何回应?”
Nityesh:给全球补充点布景:咱们每周会发一份问卷,问用户如果弗成再用 Cora 会有多失望,用来判断家具的价值。咱们也每周开会看这些方针,但 Kieran 发现这周根本没东谈主填写这份表单。
Kieran:对,我嗅觉信赖是那儿出问题了,也许表单根底没发出去。我就问 Claude Code:“14 天前是不是出了什么问题?帮我查一下。”
Claude Code 的反应是列出一组待职业项,比如查抄 controller 的最近代码改革、搜索代码库等。它自动查到了在阿谁时刻点,咱们删掉了负责把用户加入表单的那段代码。Claude 还告诉我:“你只需要加回这段代码就行了。”我就说:“那你帮我加且归,并创建一个 Pull Request。”它就坐窝扩充了。我还补了一句:“趁机也生成个剧本,把之前漏掉的用户补转头。”它也作念到了。
通盘过程特等直快,我险些莫得费什么元气心灵。这就像我在 GitHub 上记一个任务备忘一样肤浅,只不外这次它告成帮我作念罢了。
用 Claude Code 研发的细节
主理东谈主:如果莫得 AI,这样的排查和竖立任务可能要花 30 分钟到几小时不等。而况关键不是时刻詈骂,而是你必须停驻手头的事,专心处理它。而当前,你可以把它作为“发个肯求”,然后再发一个、再发一个,有多个任务可以并行进行。具体说说你当前的责任历程是什么样的?比如你到底在干嘛?你我方还会写代码吗?
Kieran:或然可以先讲一下咱们最早拿到 Claude Code 的时候作念了什么,那时咱们齐特殊旺盛。
Nityesh:对,那是在 Claude 发布直播的前一天。咱们那时认为,从未来起编程花式就会被澈底改变,咱们将赢得一个智力更强的模子,就像领有一个“编程神灯精灵”。
于是咱们决定,最有出产力的作念法不是链接日常责任,而是开一个两小时的会议,靠拢列出统共但愿新模子能帮咱们解决的问题。咱们照实作念到了,列了大致 20 个 issue,包括 bug 竖立、功能开荒等,还为 Claude Code 的到来提前准备好了系统。
Kieran:那时挺专诚念念的,Nityesh 还用 ChatGPT 生成了一个 prompt,草率内容是:“未来咱们就有 AGI(通用东谈主工智能)了,帮咱们列出咱们需要它完成的一切。”然后咱们把这个 prompt 输入到 Anthropic 的 prompt 优化器中,再拿这个优化后的 prompt 去生成具体任务。
主理东谈主:你们那时在 GitHub 顶用的是那种肖似 Trello 的看板系统吗?每个 issue 齐是一个卡片,非论是新功能照旧 Bug,每个卡片齐有详备文档,包括问题描写、解决决策、技能条目,致使还有终了纪律和预估所需时刻。
Kieran:对,比如这张卡片里写的功能是“生成 AI 合成数据”,它的文档里从问题界说、解决念念路、技能条目,到实施纪律齐写得很涌现。
咱们用 Claude Code 配合一个自界说的 prompt(在 Claude Code 中叫 command)来生成这些任务文档。哪怕是用 ChatGPT 来生成也挺良友的,因为你得读许多代码,还得念念考、整合,这其实是个挺重的脑力活。是以咱们作念了一个 command,主义是把这个历程自动化。
主理东谈主:你说的 command 是 Claude Code 里的大叫,照旧 Cursor 里的?
Kieran:我是用 Cursor 裁剪代码,但运行的照旧 Claude Code。我还有个大叫,就是语音转翰墨(voice to text)告成启动。我和 Nityesh 往常一出手脑风暴:“如果咱们作念这个会何如样?听起来可以!”然后我就告成语音输入,它就出手跑。比如我刚刚说:“我想在 Cora 加一个无穷滚动功能,当我读完一个简报(brief)后,它应该自动加载下一个,直到统共未读的简报齐读完为止。”
主理东谈主:我想让全球了解一件事:Kieran 险些从不敲键盘。他基本上全程通过语音输入来操作,比如刚才他是告成用语音在末端中输入,通过 Claude Code 进行交互。我紧记他用的是一个当前还未考究发布的里面孵化边幅——叫 Monologue,他是该用具的第四大用户。固然这个用具还在守秘阶段,但咱们在这里算是提前预览了一下。
从我不雅察来看,它的责任花式是这样的:Kieran 说出任务内容后,这个系统会将语音转录成文本,并插入到任务说明中,然后自动扩充一系列操作。
Kieran:对,Monologue 会把我说的内容填入“功能描写”区域,接着扩充一整套纪律。起始,它会在代码库中查找有关终了,相配于先了解现存内容;然后它会上网搜索最好实践,包括开源边幅中的常见模式;临了它会生成一个筹划并让我审核。我很可爱这个“东谈主类审核要害”,固然偶尔它会搞错,但大多数时候齐能掷中重点。证据后,它就会创建 GitHub issue,并自动分拨到正确的责任流中。
主理东谈主:原来你们是在 GitHub 的看板里,把想要终了的功能告成用语音讲出来,然后 Claude Code 会自动完成统共调研,生成完满文档,临了转成 GitHub issue。
Kieran:对,这是个很关键的要害。它和 Cursor 编码花式很不同。在 Cursor 里你可能会跳过这一步,因为它主若是用来写代码的。固然你也可以在那里面写 Markdown,但它不是专为任务经管联想的。比拟之下,Claude Code 的联想更贴近 issue 追踪系统——这本来就是开荒者熟谙的用具,咱们可以告成把文档交给开荒者去终了。
主理东谈主:当咱们第一次看到 Claude Opus 4 的时候,咱们齐畏缩了,因为它能一直运行,无需东谈主工干预,最终还能给出很好的驱散。固然咱们以前也见过一些 Agent 模式,但 Claude 的这种自动化和完成度十足不一样。它像是在矫捷、高质料地一项项完成清单上的任务,这是其他 Agent 轮回很难作念到的。
Nityesh:我和 Kieran 之间还在玩一个小游戏,看谁能让 Claude Code 一语气运行更久,Kieran 当前是率先者。
Kieran:我这次运行了 25 分钟。
Nityesh:我当前只跑了 8 分钟。
主理东谈主:Kieran,你是何如作念到让它跑这样久的?
Kieran:我给了一个特等长的筹划,内容很复杂,还包括大齐测试任务。我让它运行统共测试并竖立全部失败项,这样通盘过程就会连续很久。
主理东谈主:你阿谁能自动生成调研文档的 prompt 是何如写出来的?你是靠嗅觉拼的,照旧也用了 Claude 的 prompt 改写器?
Kieran:这就波及咱们所说的“复利式工程”了。最早是 Nityesh 给我发了一个 prompt,他写得很戏剧化:“AGI 照旧终透露,咱们可以出手写软件了。”我那时认为这个 prompt 还行,但我也问了一句:“你知谈 Anthropic 的 prompt 改写器吗?”这个用具特殊好用。你只消粘贴一个 prompt,然后点击“生成”,它会帮你优化改写。看起来肤浅,但效果很可以。你致使不需要花许多时刻考证它好不好用——有时候试一试,不好就删掉,资本很低。
那天咱们要写 30 个调研任务,是以必须先有一个好用的 prompt。于是我就把刚刚阿谁 prompt 粘进去,生成一个版块,然后把它作为基础 prompt 用。之后,咱们只需更变参数,就能反复复用。
主理东谈主:本色上,你们作念的第一步是花时刻写了一个 prompt,这个 prompt 的作用是自动生成其他 prompt。而那些调研文档,其实本色上亦然给 Claude Code 的任务指示。
也就是说,你们不再需要每次齐手动写“先调研、再拆解需求、再贪图扩充细节”等等,而是只消讲出一个肤浅的功能需求,Claude 就能自动张开统共细节,写出一整份完满筹划。以前每次齐要手动说涌现的那些内容,当前齐可以自动生成了。
而况更意思的是——它当前就在咱们聊天的时候运行着,这十足改变了写代码的花式。咱们前几周在通话时测试过这个系统,我那时致使在通话中就上线了一个功能,这种边话语边构立功能的“外交式编程”在以前是不可想象的。
Kieran:刚才咱们在聊天的时候,其实 Claude 照旧完成了调研,并自动生成了一个 issue。而况咱们那会儿同期跑了六七个任务,因为咱们那时的情状就是“有新想法就坐窝扩充”。咱们一边翻看用户反馈、读邮件,把能找到的信息齐截理出来,一边抵制头脑风暴。
这种情状真的很意思——你只消一有想法就能坐窝启动一个 Agent,然后等霎时再靠拢审阅它们的驱散。这亦然我特殊得意的极少:在语音通话中合作是一种很棒的体验,因为这种碰撞中常常会有“魔法时刻”。
天然,当前仍然需要东谈主类来作念复审。咱们发现必须查抄输出是否合理、是否遗漏了什么,这就需要教授、判断力和直观。比如我之前竖立了一个邮件无法发送的 bug,Nityesh 也用 Claude Code 作念了肖似的事,但它给出的解决决策却错了。我在 prompt 里特等强调了“稽查历史记载”,这联结 Claude 朝正确标的念念考。而 Nityesh 莫得加那句话,它就说“看起来一切正常”。
是以,照实需要东谈主类的判断。这不是靠“神奇 prompt”暂劳永逸的问题,而是你是否知谈怎样正确地使用它,把它的所长施展出来。
“我每天认为我方什么齐不会”
主理东谈主:Nityesh,我很好奇你何如看待这一切。毕竟 Kieran 是一个特殊资深的开荒者,而你在编程上的教授可能还比较早期。你是何如适合这种全新的合作花式的?
Nityesh:对我来说,这通盘过程特殊颤动。我真确交往编程是从 ChatGPT 出现后才出手的,那时候我认为 AI 出现碰巧是契机,于是决定自学编程,构建我一直想作念的 SaaS 欺诈。自后转到 Cursor,接着又用上 Windsurf。我一直认为我方照旧站在最前沿了,我周围的一又友齐莫得这样用 AI 的。但直到我加入了 Every,出手和 Kieran 沿途责任,才发现他十足是另一个线索。他在会议中从不敲代码,基本上齐是对着电脑话语。而 Claude Code 发布后,Kieran 推动我去用它,当前它照旧成为咱们主要的编程花式了。
曩昔三周里,我和 Kieran 险些齐没再碰 Windsurf 或 Cursor,哪怕用了也只是因为咱们没装 VS Code。本色上,如果只是为了看代码内容,用哪个裁剪器齐无所谓了,因为统共中枢 AI 交互齐发生在 Claude Code 里。而况真的很神奇,通盘编程的花式每三个月就会发生一次剧变,让你抵制意志到“没东谈主真的站在最前边”。
主理东谈主:我真的有点珍重你们这些在 ChatGPT 期间出手学编程的东谈主,我是二十年前靠看书学的……
Kieran:《PHP for Dummies》。
主理东谈主:对对,还有什么《24 小时学会 Basic》那种……你刚才说以为我方照旧处在 AI 编程的前沿,驱散加入 Every 跟 Kieran 一比就发现十足不是,这让我猜测《星球大战前传》里有一幕。他们在水下被怪物遑急,看起来要没命了,驱散倏得有个更大的怪物出来把阿谁怪物吃掉。主角说了一句:“总有更大的鱼。”Kieran 就是阿谁更大的鱼。
Kieran:其实我我方也有相通的嗅觉。你刚才说我很蛮横,但我每天也认为我方什么齐不会,还在拚命追逐。有太多东西要作念,太多想法要终了。这就是当下 AI 编程的真实情状:总有更多的东西,但中枢照旧要锻真金不怕火。你必须每天齐锻真金不怕火使用 AI,连续推动我方,不然就会错过许多令东谈主旺盛的东西。
主理东谈主:像你们这种“险些不写代码、而是在更高详细线索操作”的花式,会带来新问题吗?你们是怎样应酬这些问题的?又发展出了哪些新的工程实践,以保证通盘过程的高效与矫捷?
Nityesh:对我来说,一个最巨大的知晓来自一册老书——《高产出经管》,是 Intel 的 CEO 在五十年前写的。它在第一章提到一个不雅点:统共问题齐应该在“价值最低的阶段”被解决。
今天,AI 尤其是 Claude Code 照旧能帮咱们完成许多任务,这让“前期阶段”的质料变得格外关键。比如,咱们会用 AI 生成一份特殊详备的 GitHub issue 文档,那很容易让东谈主想告成调用 Claude Code 去终了它。但如果 issue 自身的标的就偏了,Claude 就会在间隙的旅途上链接股东,驱散只会浪费时刻。
是以,咱们当前的作念法是:必须在东谈主类 review 阶段就尽早发现这些潜在偏差、提前修正,而不是比及 Claude 扩充罢了再回头返工。
主理东谈主:这让我猜测杠杆旨趣:你越靠拢杠杆末端,力量越大,但标的偏差带来的后果也越严重。哪怕一厘米的偏差,临了驱散也可能出入几千公里。就像辐射火箭时对准月球,开动角度偏极少,临了就十足偏离轨谈。我我方其实很容易跳过筹划阶段——对着一堆文档靠拢元气心灵很贫困。你们是何如处理这个问题的?
Kieran:敦朴说,大多数时候读这些文档照实挺没趣的。但咱们会想办法让它“更意思极少”。比如我会条目 Claude 给出更简洁的内容,但这样它又容易遗漏关键点。是以我更偏好让它聚焦在用户故事或问题清单上,比如:“一个优秀的家具司答理建议哪些问题?有哪些不同解法?”这种神志会更容易阅读,也更容易激发念念考。
总的来说,传统的 PRD(家具需求文档)太无趣了。但咱们可以加入更多例子或反问,把它“变形”为一个信息更丰富、也更易于东谈主领路的材料。这也恰是咱们东谈主类审查阶段要作念的事:查找潜在问题、补充罅漏——因为这一步能为后头省俭大齐时刻。
主理东谈主:这让我猜测咱们业务中另一个边幅。咱们在 Spiral 正在开荒一个“写稿 Agent”,有点像 Claude Code,但专为写稿任务联想。咱们也碰到肖似问题:写稿 Agent 如果只是“生成一堆内容”,那东谈主类照旧得花大齐时刻去筛选和修改。是以咱们当前尝试让 Agent 主动“进入访谈模式”,先了解用户是谁、想要什么,再输出内容,这样更准确,也省事。听你们这样说,我嗅觉 Coding 这边其实也存在肖似问题。也许 Claude Code 将来可以多问一些有启发性的问题,帮用户厘清念念路,而不是只吐出一大堆文本。
Kieran:是的,这照实是咱们应该自动化并连续优化的事情。Claude Code 的刚劲之处在于它可以探望你的通盘代码库,领路你的立场,这特殊有用。
除了在一出手就尽量作念好问题界说,我认为传统的测试花式和邮件奉告也特殊关键。不然你何如知谈我方改的东西真的能用呢?天然你可以掀开适度台手动点击测试,但十足没必要。咱们可以让 AI 写一个测试,比如最基本的 smoke test(冒烟测试),望望功能大致是否正常运行,这样 Claude 也可以把柄测试驱散自主竖立问题。
咱们还在尝试一项新责任历程。咱们会用 Claude Code 终了 Figma 联想,然后截取出动端页面截图,与联想图进行对比,考证回复度。固然咱们还没在出产环境大齐使用,但特殊期待它的效果。这种花式本色上就是把本来东谈主工扩充的考证历程“编进系统里”。不单是是代码测试,对 prompt 也可以作念 eval(评估),就像给代码写测试一样,给 prompt 写评估剧本。
上周我就让 Claude Code 运行一个邮件发送历程的 eval,让它跑 10 次,失败了 4 次,它告诉我失败原因是调用了间隙的用具。我稽查了一下教导词,不够具体,于是我让它链接尝试,抵制优化教导词,直到能每次齐通过测试。我半途还下楼喝了杯咖啡,转头一看,照旧措置了。
是以说,即就是最传统的测试历程,对 AI 编程相通巨大——测试能告诉你教导词是否可靠,就像传统单位测试告诉你代码是否责任一样。乍一看枯燥,但其实特殊有用。
给各编码类 Agent 打些许分?
主理东谈主:我想花五分钟时刻,让 Kieran 来给各样智能编码 Agent 作念一个从 S 级到 F 级的打分。我来报 Agent 的名字,你来给出评级。先从 Cursor 出手,拿最优设置的 Cursor 来看。
Kieran:就算是传统的、在最好的设定下的 Cursor,也不是最好的 Agent。我可爱某些 Agent 的原因就是它们明确告诉你,“这就是咱们最好的版块”。而 Cursor 有点让东谈主困惑。是以我会把它评为 A 级,它照实很可以,特等是在使用 Claude 的情况下。
主理东谈主:Windsurf?
Kieran:C 级。因为他们还不守旧 Claude 4,这让我很难领路。三周前我还会给它 A 级,但当前不行了。
主理东谈主:Devin?
Kieran:B 级。集成度不高,搭建过程也略微贫苦一些,代码质料也莫得 Cursor 或 Claude Code 那么全面。我不笃定它是不是用 Claude 4,但用起来莫得其他用具顺畅。
主理东谈主:Charlie?
Kieran:Charlie 主要用于代码审查,咱们当前基本只在这个场景下用它。作为代码 Reviewer,我会给它 A,但作为 Agent 我只可给 B。
主理东谈主:Friday?
Kieran:我会把 Friday 排在 Cursor 之上,介于 S 和 A 之间。固然它当前还没用 Claude 4,而是用的 3.7,但依然阐扬特殊优秀。Friday 的历程特殊有主见,能高效地把事情作念完。你给它一个 issue,它就能自动生成筹划、恭候你证据、然后扩充、提交 PR。我见过它到手一次性回复 Figma 联想,也完成过一些 Claude Code 作念不到的任务。让我真的有种“看见将来”的嗅觉,而况它背后的团队限度很小。
主理东谈主:Codeex?
Kieran:B 级。
主理东谈主:Copilot 呢?
Kieran:我没何如用过。三年前用过一次,半年前又试了一次,但不到一分钟就关了。如果一定要打分,我只可给 D。它那时还不具备 Agent 智力。天然,我得承认还没用过它的新版块,是以也许并不十足平允。
主理东谈主:Claude Code?
Kieran:天然是 S 级。
主理东谈主:Factory?
Kieran:Factory 在某些方面其实比其他用具齐好。但它不是我的立场,更符合那些偏企业级的开荒者,尤其是对代码质料条目极高的用户,比如作念多仓库开荒的。它用起来有些繁琐,因为是 Web 和土产货夹杂部署。我会给它 B,略低于 Codeex 和 Devin。
主理东谈主:AMP 呢?
Kieran:S 级,仅次于 Claude Code。它特殊擅长完成任务,使用体验也很好。你能感受到 AMP 背后的团队是真确宠爱 Agent 用具的开荒者,他们我方也在用。
我更倾向于把智能 Agent 看作招聘开荒者解决特定问题的过程。比如 Friday 特殊擅所长理界面责任,碰到这类任务我会用 Friday;需要作念调研时,我会选拔 Claude;如果是代码审查,我则用 Charlie。Agent 之间是可以协同责任的,无用局限于只用一个。
主理东谈主:Charlie 集成在 GitHub 上,你可以告成“@Charlie”,它就会对 Pull Request 进行代码审查。
Kieran:对,咱们用 GitHub、Pull Request 和老例的开荒历程,这样东谈主类开荒者也能介入。咱们能“聘请”专长于特定任务的 Agent 来审查代码,而闭环代码用具则扩充具体责任。这套体系是经过咱们几十年教授抵制优化的,特殊刚劲。也正因如斯,Copilot 也许能适合这套历程,因为它本来就集成在 GitHub 里。
主理东谈主:你们最近似乎引入了一位真确的内行,并通过 Agent 化的花式合作,既达到了预期,也收缩了对方的背负。
Kieran:是的。固然那时还莫得真确的“问题”要解决,但咱们但愿更透露地掌捏关键任务的录用进程。鉴于我我方对这方面并不十分擅长,咱们就邀请了内行参与。作念法是这样的:咱们开了一个两小时的电话会议,我把通盘对话录了音;会后,我把灌音内容输入到 Claude Code,并条目它把柄对话生成两个资源 issue。大致十分钟后,Claude Code 给出了初稿,我再请内行审核。他对驱散特殊诧异——他平时对 AI 生成的决策常常持怀疑立场,毕竟有些任务 AI 当前还没那么擅长。但这次他不仅招供了文档,还建议了特殊有价值的修订建议。于是咱们又围绕这些建议快速迭代。第二天,内行完成了东谈主工复审,我再用 Claude Code 终透露对应的代码,并沿途作念了 Code Review。通盘历程本来可能要两周时刻,当前几小时就措置了。
主理东谈主:还有什么想说的吗?
Nityesh:但务必紧记在“价值最低”的阶段对 AI 的输出进行严格审核,确保尽早发现并修正问题。
参考相接:
https://www.youtube.com/watch?v=Lh_X32t9_po开云(中国)kaiyun网页版登录入口
发布于:北京市