Skip to content

多模型多 Agent 編碼工作流(手動版)

來源: @wquguru (WquGuru) | 原文連結

日期: 2026-01-18

標籤: 多模型 Agent 編碼工作流 Claude Code Codex Gemini


總覽

階段主要工具目的
1. 規劃GPT Chat從手動計畫擴展為詳細方案
2. 各階段編碼準備Claude Code + Codex CLI + Gemini CLI各自獨立產出方案
3. 審核與整合Codex審核三份產出,生成最終方案
4. 實作Codex CLI 或 Claude Code執行最終方案
5. 驗證Claude Code / Codex / 人工確認成果正確

第一階段:規劃

流程

  1. 手動撰寫初步計畫:人類先寫出大方向與核心需求
  2. GPT Chat 擴展:將初步計畫交給 GPT Chat,讓它擴展為更詳細的實施方案
  3. 拆分為可驗證的階段:將大計畫拆分為多個小階段,每個階段都有明確的驗證標準
  4. 迭代修正:反覆調整直到計畫足夠清晰

重點

  • 計畫的品質決定後續所有步驟的效率
  • 每個階段必須是「可驗證的」—— 有明確的完成標準
  • 拆分粒度要適中,太粗會難以追蹤,太細會增加管理負擔

第二階段:各階段編碼準備

將同一份計畫同時交給三個不同的 AI 工具:

工具特點
Claude Code擅長理解上下文、程式碼品質高
Codex CLIOpenAI 的程式碼生成工具,推理能力強
Gemini CLIGoogle 的 AI 工具,不同的思考角度

三個工具各自獨立產出方案,互不參考。這樣做的好處是:

  • 獲得多元化的解決方案
  • 不同模型的盲點可以互相彌補
  • 增加發現最優解的機率

第三階段:審核與整合

這是整個流程的核心環節:

  1. 將三份方案(包含 Codex 自己的方案)全部交給 Codex 審核
  2. Codex 比較三份方案的優劣
  3. 從中取長補短,生成一份最終整合方案

為什麼用 Codex 做審核?

  • Codex 的推理與比較能力較強
  • 能客觀評估不同方案的 trade-off
  • 即使審核自己的產出也能保持批判性

第四階段:實作

使用 Codex CLIClaude Code 執行最終方案:

  • 按照整合後的方案逐步實作
  • 每完成一個步驟就進行驗證
  • 遇到問題即時修正

工具選擇取決於具體任務的性質與個人偏好。

第五階段:驗證

驗證方式可選:

  • Claude Code:讓它審核程式碼並執行測試
  • Codex:用不同模型交叉驗證
  • 人工驗證:手動檢查關鍵邏輯與功能

建議至少使用兩種以上的驗證方式,降低遺漏的風險。

痛點與限制

大量手動複製貼上

這是目前最大的問題:

  • 需要在多個工具之間手動搬運文字
  • 計畫、程式碼、審核結果都需要手動傳遞
  • 效率低、容易出錯

工具之間無法自動協作

  • Claude Code、Codex CLI、Gemini CLI 各自獨立
  • 沒有統一的 API 或協議來串接
  • 每次切換工具都需要人工介入

改善方向

  • 期待未來有工具能整合多模型的自動協作
  • MCP 協議可能是一個突破口
  • 自動化腳本可以減少部分手動操作

適用場景

這個工作流特別適合:

  • 關鍵功能開發(需要高品質保證)
  • 複雜系統架構設計
  • 對正確性要求極高的專案
  • 想要探索多種解決方案的情況

Curation Desk

這篇文章要放去哪一層?

AI Priority62
待審 預設狀態:待審 · 已寫入文章 metadata

階段 主要工具 目的 ------ ---------- ------ 1. 規劃 GPT Chat 從手動計畫擴展為詳細方案 2. 各階段編碼準備 Claude Code + Codex CLI + Gemini CLI 各自獨立產出方案 3. 審核與整合 Codex 審核三份產出,生成最終方案 4. 實作 Codex CLI 或 Claude Code 執行最終方案 5. 驗證 Claude Code / Codex / 人工 確認

先檢查外部連結是否值得保留,再決定是否轉入精選。