多模型多 Agent 編碼工作流(手動版)
來源: @wquguru (WquGuru) | 原文連結
日期: 2026-01-18
標籤:
多模型Agent編碼工作流Claude CodeCodexGemini
總覽
| 階段 | 主要工具 | 目的 |
|---|---|---|
| 1. 規劃 | GPT Chat | 從手動計畫擴展為詳細方案 |
| 2. 各階段編碼準備 | Claude Code + Codex CLI + Gemini CLI | 各自獨立產出方案 |
| 3. 審核與整合 | Codex | 審核三份產出,生成最終方案 |
| 4. 實作 | Codex CLI 或 Claude Code | 執行最終方案 |
| 5. 驗證 | Claude Code / Codex / 人工 | 確認成果正確 |
第一階段:規劃
流程
- 手動撰寫初步計畫:人類先寫出大方向與核心需求
- GPT Chat 擴展:將初步計畫交給 GPT Chat,讓它擴展為更詳細的實施方案
- 拆分為可驗證的階段:將大計畫拆分為多個小階段,每個階段都有明確的驗證標準
- 迭代修正:反覆調整直到計畫足夠清晰
重點
- 計畫的品質決定後續所有步驟的效率
- 每個階段必須是「可驗證的」—— 有明確的完成標準
- 拆分粒度要適中,太粗會難以追蹤,太細會增加管理負擔
第二階段:各階段編碼準備
將同一份計畫同時交給三個不同的 AI 工具:
| 工具 | 特點 |
|---|---|
| Claude Code | 擅長理解上下文、程式碼品質高 |
| Codex CLI | OpenAI 的程式碼生成工具,推理能力強 |
| Gemini CLI | Google 的 AI 工具,不同的思考角度 |
三個工具各自獨立產出方案,互不參考。這樣做的好處是:
- 獲得多元化的解決方案
- 不同模型的盲點可以互相彌補
- 增加發現最優解的機率
第三階段:審核與整合
這是整個流程的核心環節:
- 將三份方案(包含 Codex 自己的方案)全部交給 Codex 審核
- Codex 比較三份方案的優劣
- 從中取長補短,生成一份最終整合方案
為什麼用 Codex 做審核?
- Codex 的推理與比較能力較強
- 能客觀評估不同方案的 trade-off
- 即使審核自己的產出也能保持批判性
第四階段:實作
使用 Codex CLI 或 Claude Code 執行最終方案:
- 按照整合後的方案逐步實作
- 每完成一個步驟就進行驗證
- 遇到問題即時修正
工具選擇取決於具體任務的性質與個人偏好。
第五階段:驗證
驗證方式可選:
- Claude Code:讓它審核程式碼並執行測試
- Codex:用不同模型交叉驗證
- 人工驗證:手動檢查關鍵邏輯與功能
建議至少使用兩種以上的驗證方式,降低遺漏的風險。
痛點與限制
大量手動複製貼上
這是目前最大的問題:
- 需要在多個工具之間手動搬運文字
- 計畫、程式碼、審核結果都需要手動傳遞
- 效率低、容易出錯
工具之間無法自動協作
- Claude Code、Codex CLI、Gemini CLI 各自獨立
- 沒有統一的 API 或協議來串接
- 每次切換工具都需要人工介入
改善方向
- 期待未來有工具能整合多模型的自動協作
- MCP 協議可能是一個突破口
- 自動化腳本可以減少部分手動操作
適用場景
這個工作流特別適合:
- 關鍵功能開發(需要高品質保證)
- 複雜系統架構設計
- 對正確性要求極高的專案
- 想要探索多種解決方案的情況