OpenAI 近日正式透過 API 向開發者開放旗下目前最強大的程式設計模型 GPT-5.1-Codex-Max。這款模型主打長時間運作和代理式(Agentic)程式碼編寫任務,在多項權威基準測試中的成績明顯優於一般版 GPT-5.1-Codex。更吸引人的是,儘管效能顯著提升,新模型在 API 的定價策略上卻與 GPT-5 維持一致,被外界視為一次高效能不漲價的策略性升級。
報導指出,GPT-5.1-Codex-Max 採用名為壓縮(compaction)的技術進行訓練,能夠在超過一百萬 tokens 的超長上下文視窗中持續工作。內部測試顯示,該模型能夠穩定執行持續超過 24 小時的任務。在 SWE-Bench Verified、SWE-Lancer IC SWE 和 TerminalBench 2.0 等面向真實軟體工程場景的基準測試中,GPT-5.1-Codex-Max 的得分分別提升至 77.9%、79.9% 和 58.1%,相較於一般版 GPT-5.1-Codex 有明顯進步,凸顯其在複雜、多步驟開發任務中的優勢。
在商用層面,OpenAI 已將 GPT-5.1-Codex-Max 以與 GPT-5 相同的價格接入 API,輸入端約為每百萬 tokens 1.25 美元(約新台幣 41 元)、輸出端每百萬 tokens 10 美元(約新台幣 325 元),同時沿用 GPT-5 的速率限制策略。此前,這款模型僅向使用 Codex CLI、IDE 擴充功能、雲端服務和程式碼審查功能的高階訂閱用戶開放,如 ChatGPT Plus、Pro、Business、Edu 和 Enterprise 等用戶。如今隨著 API 普及化,OpenAI 也宣布將其設為 Codex 體系中的預設程式碼模型。
值得注意的是,與以往偏向 Unix 環境優化的 Codex 系列不同,GPT-5.1-Codex-Max 在訓練階段特別針對 Windows 環境進行了適配。這對於大量使用 Windows 作為主要開發平台的工程師來說,具有更直接的吸引力。由於新模型在速度和 tokens 利用效率方面均優於一般版 GPT-5.1-Codex,報導認為,Windows 開發者若無特殊需求,轉向使用這款模型幾乎是無痛升級的首選。
藉由這次 API 開放,GPT-5.1-Codex-Max 已迅速進入多款熱門開發工具生態,包括 Cursor、GitHub Copilot、Linear 等在內的程式碼編寫助理產品。在 GitHub Copilot 體系中,該模型將向 Pro、Pro+、Business 和 Enterprise 訂閱用戶開放,並出現在多個使用場景的模型選擇器中,例如 Visual Studio Code 的聊天、提問、編輯和 Agent 模式,以及 GitHub 網頁端和行動端的 Copilot Chat 與 Copilot CLI 等入口。
在市場競爭方面,OpenAI 此舉顯然是針對對手 Anthropic 的強勢擴張所做出的回應。Anthropic 近年將精力集中在面向企業和開發者的程式碼模型上,旗下的 Claude Code 工具已成為最快達到十億美元營收里程碑的 SaaS 產品之一。報導援引行業預期稱,Anthropic 今年僅依靠面向開發與企業的程式碼模型業務,就有望實現 80 至 100 億美元(約新台幣 2,600 億至 3,250 億元)的營收,這也促使 OpenAI 在 8 月推出 GPT-5-Codex,並在短時間內帶動 Codex 使用量成長超過 10 倍、每週服務的 tokens 規模達到兆級。
在此背景下,GPT-5.1-Codex-Max 被視為 OpenAI 在開發者市場上的又一重要加碼,旨在強化其在企業級程式碼編寫工具領域與 Anthropic 的正面競爭力。不過目前尚難判斷這款新模型的上線及其與 GitHub Copilot 的深度整合,是否足以顯著減緩 Anthropic 在企業程式碼編寫市場上的迅猛增勢,未來一段時間內兩家在該領域的角力仍將持續升溫。
- 延伸閱讀:OpenAI 開發「懺悔機制」:訓練 AI 模型誠實自白,偵測並改善「幻覺」與違規行為
- 延伸閱讀:Google 逆襲!OpenAI 面臨 ChatGPT 問世以來最大壓力:Gemini 3 表現超預期,市值戰火重燃
- 延伸閱讀:OpenAI 攜手北美防空司令部,為聖誕老人追蹤計畫導入 ChatGPT 節日互動小工具



