ChatGPT 4 系列的比較

ChatGPT 4 系列的比較

GPT-4 系列大致可分為三條支線：

4 o 系（4 o → 4 o-mini → 4 o-mini-high）：同樣承襲 128 k 長上下文，但靠「縮小參數＋提速」壓低成本；mini-high 進一步把上下文推到 ≈200 k，卻被部分開發者批評推理與程式碼品質下降。
4 .5：2025 年初短暫提供的過渡版，強調創意寫作與程式碼完整性，仍維持 128 k 上下文，在 ChatGPT 端多被限制在 32 k。
4 .1 系（4 .1 → 4 .1-mini）：2025 / 4 發表，官方 API 支援 1 M 超長上下文，是目前公開最長；mini 版用較小參數換取速度、費用與免費額度，並已取代 4 o-mini 成為 ChatGPT 免費預設模型。

綜合比較表

模型	發表時間	官方上下文窗 (Input + Output)	單次輸出上限	支援模態	速度∕費用 (相對 GPT-4o)	主要優勢	常見劣勢‍／限制
GPT-4 o	2024-05-13	128 000 Tokens	≈4 000 Tok	文字、圖像、語音	-	多模態、推理佳、最完整工具鏈	ChatGPT 端僅 32 k；API 輸出預設 4 k
GPT-4 o-mini	2024-11	128 000	16 384 Tok	文字＋圖像；音訊即將支援	≈3 × 快、費用約 1 ∕ 5	成本最低仍保留 4 o 推理水準	論述深度與程式碼一致性略降
GPT-4 o-mini-high	2025-04-16	≈200 000†	社群回報 32 k–100 k	同 mini	速度略慢於 mini，仍遠快於 4 o	更長上下文、輸出字數倍增	程式碼品質與「偷懶」現象被批評
GPT-4 .5 Preview	2025-02	128 000	32 768	文字、圖像	與 4 o 相近	更像人類的寫作風格、程式碼完整性佳	僅預覽；7-2025 起陸續下架
GPT-4 .1	2025-04-14	1 000 000	32 k（ChatGPT），API 未公布硬上限	文字、圖像，強化文件／程式長上下文	與 4 o 類似；官方宣稱成本-26 %	超長上下文、長文搜尋定位精度佳	長上下文僅 API 全開；ChatGPT 仍 32 k
GPT-4 .1-mini	2025-05	1 000 000（API）	32 k（ChatGPT）	同 4 .1	≈2 × 4 o-mini 速度，免費可用	免費層就能用 1 .1 系列、效能超過 4 o-mini	極端長上下文在前端受限；細膩推理略遜完整 4 .1

OpenAI 尚未於文件正式列出；數值可能隨時調整。

模型能力與特性比較

推理與程式碼能力

4 o 與 4 o-mini 延續 GPT-4 水平，在數學、連貫寫作、程式碼解 Bug 上表現穩定。
4 o-mini-high 理論上比 mini 更多參數，但多位使用者回報「產生程式碼遺漏或偷懶」現象，偏向長文摘要而非複雜編碼。
4 .5 在 RLHF 微調後對創作與長篇敘事有更高一致性，同時維持 4 o 價格點。
4 .1 針對長上下文優化注意力稀疏化，能在百萬 token 內仍定位精準段落並保持較低幻覺率；mini 版沿用架構，推理水準約略高於 4 o-mini。

多模態與工具鏈

從 4 o 起，系列皆支援文字＋圖像輸入與 OpenAI 工具（Web、Python、影像生成、Canvas 等）；4 o-mini-high 亦保留相同工具鏈。
4 .1 在 API 端支援相同工具，並開啟「文件樹解析」及「多檔案同時上傳」能力，對長代碼庫友善。

成本與速率

模型	官方 API 速率上限（TPM｜TPD 範例）	相對單 token 價格*
4 o	10 K ∕ 100 K	1.0× baseline
4 o-mini	200 K ∕ 2 M †	0.2×
4 o-mini-high	200 K ∕ 2 M	0.25×
4 .5	20 K ∕ 200 K	0.8×
4 .1	20 K ∕ 200 K	0.74×
4 .1-mini	200 K ∕ 2 M	0.18×

*以 GPT-4 o 為基準；實際數字依區域與帳戶折扣波動。
†API 配額來自社群測試與官方說明混合，見參考文獻。

典型選擇建議

使用場景	建議模型	理由
免費日常聊天／中短篇文稿	4 .1-mini	免費、速度快、推理水平高於 4 o-mini。
需要語音、Vision 多模態互動	4 o	官方語音、圖像功能最完整。
成本優先、批次文檔／圖片摘要	4 o-mini	128 k + 16 k 輸出、費用為 4 o 1/5。
超長法規、程式碼庫分析 (＞128 k)	4 .1 (API)	百萬 token 長上下文。
高速、長輸出（>32 k）報表	4 o-mini-high	200 k† 窗口＋高輸出上限；注意推理品質。
創意寫作或全端應用 PoC	4 .5 (仍可用時)	人類化寫作＋程式碼完整性；但存活期有限。

注意事項

ChatGPT 與 API 上限不同：即使官方聲稱 4 .1 支援 1 M tokens，ChatGPT 介面仍只允許約 32 k。
社群數據 vs 官方文件：4 o-mini-high、4 .5 等版本多半透過使用者測試與論壇披露，OpenAI 文件未必同步更新，隨時可能調整限制。
輸出上限 ≠ 建議長度：即便模型允許 16 k+ 輸出，超長回覆更易斷話或費用暴增，務必在 max_tokens 與分段策略上做限制。

留言