編輯評論

這篇文章揭示了軟體開發歷史上的重要轉折點。Boris Cherny 的工作流程展現了 AI 輔助開發從「自動完成工具」演進為「勞動力作業系統」的質變。當多數開發者仍將 AI 視為程式碼生成器時,Cherny 已將其提升為並行任務編排系統,這種思維差異將導致生產力呈指數級拉開。

從技術架構角度,Cherny 的方法論解決了 AI 開發的三個核心痛點:上下文記憶(CLAUDE.md 檔案)、品質驗證(自動化測試迴圈)、與任務編排(並行代理)。特別值得注意的反直覺洞察是:使用最慢但最聰明的 Opus 4.5 模型,實際上能減少人工修正時間,整體效率更高。這對企業技術領導者而言是重要啟示——瓶頸不在於生成速度,而在於人工修正成本。

市場層面,此工作流程的傳播可能加速 Anthropic 在企業開發工具市場的渗透。當 OpenAI 投入數兆美元建設資料中心,Anthropic 證明優秀的模型編排能力同樣能帶來生產力飛躍。這種「以少勝多」策略更符合當前企業降本增效的訴求。對開發者而言,能否快速從「打字員」思維轉向「指揮官」思維,將決定未來五年的職場競爭力。

結論摘要

  • Cherny 同時運行 5 個 Claude 實例進行並行開發,透過 iTerm2 系統通知管理任務,如同即時戰略遊戲指揮官
  • 專用 Anthropic 最慢但最聰明的 Opus 4.5 模型,因減少人工修正時間,整體效率反而更高
  • CLAUDE.md 檔案將每次 AI 錯誤轉化為永久規則,讓代碼庫成為自我修正的有機體
  • 斜線命令和子代理自動化重複性任務,如 /commit-push-pr 一鍵完成版本控制流程
  • 驗證迴圈是 Claude Code 的關鍵優勢,AI 自動測試自己生成的代碼,品質提升 2-3 倍

原文翻譯

Claude Code 創造者公開工作流程,開發者圈為之震驚

當全球最先進編碼代理的創造者發聲時,矽谷不只是在聆聽——他們在筆記。

過去一週,工程界熱烈討論 Anthropic Claude Code 負責人 Boris Cherny 在 X 平台上的一篇貼文。這原本只是個人終端機設置的隨意分享,卻演變成關於軟體開發未來的熱血宣言,業界內部人士稱其為這家新創公司的分水嶺時刻。

「如果你沒有直接從 Claude Code 創造者那裡閱讀最佳實踐,你作為程式設計師已經落後了,」開發者社群知名人士 Jeff Tang 寫道。另一位業界觀察家 Kyle McNease 更進一步宣稱,隨著 Cherny 的「顛覆性更新」,Anthropic「火力全開」,可能正迎來「他們的 ChatGPT 時刻」。

這股興奮源於一個悖論:Cherny 的工作流程出奇簡單,卻能讓單人具備小型工程部門的產出能力。正如一位用戶在 X 上實施 Cherny 設置後所言,這體驗「感覺更像星海爭霸」而非傳統編碼——從輸入語法轉向指揮自主單位。

以下直接來自這位架構師的分析,探討這個正在重塑軟體構建方式的工作流程。

同時運行五個 AI 代理如何將編碼變成即時戰略遊戲

Cherny 分享中最令人驚艦的揭露是,他並非以線性方式編碼。在傳統的軟體開發「內迴圈」中,程式設計師撰寫函數、測試,然後進入下一個。Cherny 則扮演艦隊指揮官的角色。

「我在終端機並行運行 5 個 Claude,」Cherny 寫道。「我將分頁標號 1-5,並使用系統通知來知道何時有 Claude 需要輸入。」

透過利用 iTerm2 系統通知,Cherny 有效管理五個同步工作流。當一個代理運行測試套件時,另一個重構舊模組,第三個起草文件。他還在瀏覽器的 claude.ai 上運行「5-10 個 Claude」,使用「傳送」命令在網頁和本地機器之間移交會話。

這驗證了 Anthropic 總裁 Daniela Amodei 本週早些時候提出的「以少做多」策略。當 OpenAI 等競爭對手追求兆美元級基礎設施建設時,Anthropic 證明優秀的現有模型編排能力能帶來指數級生產力提升。

選擇最慢最聰明模型的反直覺案例

在這個對延遲著迷的產業中,Cherny 出人意料地透露他專用 Anthropic 最重、最慢的模型:Opus 4.5。

「我對所有事情都使用帶思考功能的 Opus 4.5,」Cherny 解釋。「這是我用過最好的編碼模型,雖然它比 Sonnet 更大更慢,但你需要引導它的次數更少,而且它更善於使用工具,所以幾乎總是最後比使用更小的模型更快。」

對企業技術領導者而言,這是關鍵洞察。現代 AI 開發的瓶頸不是 token 的生成速度,而是花在修正 AI 錯誤的人工時間。Cherny 的工作流程表明,預先為更聰明的模型支付「運算稅」,可以消除後續的「修正稅」。

一個共享檔案將每次 AI 錯誤變成永久教訓

Cherny 還詳細說明他的團隊如何解決 AI 遺忘問題。標準大型語言模型不會從一個會話到下一個會話「記住」公司的特定編碼風格或架構決策。

為此,Cherny 的團隊在 git 儲存庫中維護一個名為 CLAUDE.md 的單一檔案。「每當我們看到 Claude 做錯什麼,我們就將其添加到 CLAUDE.md,這樣 Claude 下次就知道不要這樣做,」他寫道。

這個實踐將代碼庫轉化為自我修正的有機體。當人類開發者審查 pull request 並發現錯誤時,他們不只是修正代碼;他們標記 AI 更新自己的指令。「每個錯誤都變成規則,」分析該貼文的產品領袖 Aakash Gupta 指出。團隊合作時間越長,代理就變得越聰明。

斜線命令和子代理自動化開發中最乏味的部分

一位觀察者稱讚的「香草」工作流程,由嚴格的重複性任務自動化驅動。Cherny 使用斜線命令——簽入項目儲存庫的自訂捷徑——用單次擊鍵處理複雜操作。

他強調一個名為 /commit-push-pr 的命令,他每天調用數十次。代理自主處理版本控制的官僚程序,而非手動輸入 git 命令、撰寫提交訊息和開啟 pull request。

Cherny 還部署子代理——專業的 AI 角色——來處理開發生命週期的特定階段。他在主要工作完成後使用 code-simplifier 清理架構,並在發布任何東西前使用 verify-app 代理運行端對端測試。

為什麼驗證迴圈是 AI 生成代碼的真正解鎖

如果 Claude Code 據報如此快速達到 10 億美元年經常性收入有一個原因,那很可能就是驗證迴圈。AI 不只是文本生成器;它是測試人員。

「Claude 使用 Claude Chrome 擴展功能測試我部署到 claude.ai/code 的每一個變更,」Cherny 寫道。「它開啟瀏覽器,測試 UI,反覆迭代直到代碼工作且 UX 感覺良好。」

他認為,給 AI 一種驗證自己工作的方法——無論是透過瀏覽器自動化、運行 bash 命令或執行測試套件——會將最終結果的品質提高「2-3 倍」。代理不只是撰寫代碼;它證明代碼有效。

Cherny 的工作流程對軟體工程未來意味著什麼

對 Cherny 貼文的反應表明,開發者對其手藝的思維方式出現了關鍵轉變。多年來,「AI 編碼」意味著文本編輯器中的自動完成功能——一種更快的打字方式。Cherny 證明它現在可以作為勞動力本身的作業系統。

「如果你已經是工程師…閱讀這個…並想要更多力量,」Jeff Tang 在 X 上總結道。

將人類產出乘以五倍的工具已經在這裡。它們只需要一種意願,停止將 AI 視為助手,開始將其視為勞動力。率先進行這種思維躍遷的程式設計師不只是會更高效。他們將玩著完全不同的遊戲——而其他所有人都還在打字。