ChatGPT 4 系列的比較

 GPT-4 系列大致可分為三條支線:

  1. 4 o 系(4 o → 4 o-mini → 4 o-mini-high):同樣承襲 128 k 長上下文,但靠「縮小參數+提速」壓低成本;mini-high 進一步把上下文推到 ≈200 k,卻被部分開發者批評推理與程式碼品質下降。

  2. 4 .5:2025 年初短暫提供的過渡版,強調創意寫作與程式碼完整性,仍維持 128 k 上下文,在 ChatGPT 端多被限制在 32 k。

  3. 4 .1 系(4 .1 → 4 .1-mini):2025 / 4 發表,官方 API 支援 1 M 超長上下文,是目前公開最長;mini 版用較小參數換取速度、費用與免費額度,並已取代 4 o-mini 成為 ChatGPT 免費預設模型。


綜合比較表

模型發表時間官方上下文窗 (Input + Output)單次輸出上限支援模態速度∕費用 (相對 GPT-4o)主要優勢常見劣勢‍/限制
GPT-4 o2024-05-13128 000 Tokens≈4 000 Tok文字、圖像、語音-多模態、推理佳、最完整工具鏈ChatGPT 端僅 32 k;API 輸出預設 4 k
GPT-4 o-mini2024-11128 00016 384 Tok文字+圖像;音訊即將支援≈3 × 快、費用約 1 ∕ 5成本最低仍保留 4 o 推理水準論述深度與程式碼一致性略降
GPT-4 o-mini-high2025-04-16≈200 000†社群回報 32 k–100 k同 mini速度略慢於 mini,仍遠快於 4 o更長上下文、輸出字數倍增程式碼品質與「偷懶」現象被批評
GPT-4 .5 Preview2025-02128 00032 768文字、圖像與 4 o 相近更像人類的寫作風格、程式碼完整性佳僅預覽;7-2025 起陸續下架
GPT-4 .12025-04-141 000 00032 k(ChatGPT),API 未公布硬上限文字、圖像,強化文件/程式長上下文與 4 o 類似;官方宣稱成本-26 %超長上下文、長文搜尋定位精度佳長上下文僅 API 全開;ChatGPT 仍 32 k
GPT-4 .1-mini2025-051 000 000(API)32 k(ChatGPT)同 4 .1≈2 × 4 o-mini 速度,免費可用免費層就能用 1 .1 系列、效能超過 4 o-mini極端長上下文在前端受限;細膩推理略遜完整 4 .1

OpenAI 尚未於文件正式列出;數值可能隨時調整。


模型能力與特性比較

推理與程式碼能力

  • 4 o 與 4 o-mini 延續 GPT-4 水平,在數學、連貫寫作、程式碼解 Bug 上表現穩定。

  • 4 o-mini-high 理論上比 mini 更多參數,但多位使用者回報「產生程式碼遺漏或偷懶」現象,偏向長文摘要而非複雜編碼。

  • 4 .5 在 RLHF 微調後對創作與長篇敘事有更高一致性,同時維持 4 o 價格點。

  • 4 .1 針對長上下文優化注意力稀疏化,能在百萬 token 內仍定位精準段落並保持較低幻覺率;mini 版沿用架構,推理水準約略高於 4 o-mini。

多模態與工具鏈

  • 4 o 起,系列皆支援文字+圖像輸入與 OpenAI 工具(Web、Python、影像生成、Canvas 等);4 o-mini-high 亦保留相同工具鏈。

  • 4 .1 在 API 端支援相同工具,並開啟「文件樹解析」及「多檔案同時上傳」能力,對長代碼庫友善。

成本與速率

模型官方 API 速率上限(TPM|TPD 範例)相對單 token 價格*
4 o10 K ∕ 100 K1.0× baseline
4 o-mini200 K ∕ 2 M †0.2×
4 o-mini-high200 K ∕ 2 M0.25×
4 .520 K ∕ 200 K0.8×
4 .120 K ∕ 200 K0.74×
4 .1-mini200 K ∕ 2 M0.18×

*以 GPT-4 o 為基準;實際數字依區域與帳戶折扣波動。
†API 配額來自社群測試與官方說明混合,見參考文獻。

典型選擇建議

使用場景建議模型理由
免費日常聊天/中短篇文稿4 .1-mini免費、速度快、推理水平高於 4 o-mini。
需要語音、Vision 多模態互動4 o官方語音、圖像功能最完整。
成本優先、批次文檔/圖片摘要4 o-mini128 k + 16 k 輸出、費用為 4 o 1/5。
超長法規、程式碼庫分析 (>128 k)4 .1 (API)百萬 token 長上下文。
高速、長輸出(>32 k)報表4 o-mini-high200 k† 窗口+高輸出上限;注意推理品質。
創意寫作或全端應用 PoC4 .5 (仍可用時)人類化寫作+程式碼完整性;但存活期有限。

注意事項

  • ChatGPT 與 API 上限不同:即使官方聲稱 4 .1 支援 1 M tokens,ChatGPT 介面仍只允許約 32 k。

  • 社群數據 vs 官方文件:4 o-mini-high、4 .5 等版本多半透過使用者測試與論壇披露,OpenAI 文件未必同步更新,隨時可能調整限制。

  • 輸出上限 ≠ 建議長度:即便模型允許 16 k+ 輸出,超長回覆更易斷話或費用暴增,務必在 max_tokens 與分段策略上做限制。



留言

這個網誌中的熱門文章

windows server 「虛擬化型保護的程式碼完整性」(Virtualization Based Protection of Code Integrity,VBS) 功能說明與設定

linux server - 檢查nvidia driver 異常並自動重新開機

Docker 應用: 再以建置好container狀況下 如何透過json設定檔設定 在修改 Working Directory 和 Restart Policy 設定