AI 的胃口變了——CPU 成為下一個戰場

SemiAnalysis 最新報告揭示:當 AI 從「打字員」變成「打工仔」,真正被搶爆的不是 GPU,是 CPU。

AI 的胃口變了——CPU 成為下一個戰場

一句話講完

全世界砸了幾千億美金搶 GPU,結果現在被卡住的竟然是 CPU。

半導體分析機構 SemiAnalysis 的 Dylan Patel 在 4/8 的深度訪談中丟出了一個反直覺的結論:過去六個月,雲端市場上所有 CPU 已被完全耗盡。不是因為大家突然開始挖礦,而是 AI 的工作型態正在發生根本性轉變。

這件事跟每一個用 AI 工作的人都有關係。往下看。

到底發生了什麼事?

1️⃣ AI 從「打字」進化到「打工」

兩年前的 AI 是什麼樣子?你丟一個 prompt,它回你一段文字。就這樣。CPU 幾乎沒事做,所有壓力都在 GPU 上。

現在呢?Agent 時代來了。

  • Claude Code 能連續自主工作 6-8 小時,自己查資料、自己跑 code、自己驗證結果
  • 這些 Agent 不只呼叫 GPU 做推理,還需要大量 CPU 做資料庫查詢、環境模擬、狀態管理
  • Code Agent 市場收入在半年內從數十億暴增到超過 1000 億美元

簡單講:以前一個 request 跑 0.5 秒就結束,現在一個 Agent task 跑好幾個小時,而且中間每一步都需要 CPU 介入。

2️⃣ 強化學習的訓練迴圈把 CPU 推到極限

未來的 AI 不只解數學題,還要在物理模擬器裡跑。這代表 RL 訓練時,模型生成的每一步都需要在 CPU 叢集上高頻驗證。

Dylan Patel 的原話:「這個迴圈在過去幾年越來越緊,過去六個月我們看到雲端上所有 CPU 都被跑滿了。」

3️⃣ Microsoft 的 CPU 直接賣到缺貨

市場需求暴增的後果?雲端算力被榨乾。據報,Microsoft 的 CPU 庫存已經售罄,甚至影響到 GitHub 的服務穩定性。

你沒看錯——一家全球最大的雲端廠商,CPU 不夠用了。

供應鏈的連鎖反應

這不只是「雲端 CPU 不夠」這麼簡單。SemiAnalysis 在 3 月的另一份報告「The Great AI Silicon Shortage」裡描繪了一個更完整的圖景:

瓶頸具體狀況
TSMC N3 晶圓2026 年所有 AI 晶片(NVIDIA Rubin、AMD MI350X、Google TPU v7、AWS Trainium3)同時轉進 3nm,AI 需求將吃掉 N3 近 60% 產能
記憶體HBM 需求暴增,產能跟不上,DRAM 價格壓力沿供應鏈蔓延
矽晶圓重新分配的算術把智慧手機 N3 晶圓的 5% 轉給 AI → 多產 10 萬顆 Rubin GPU 或 30 萬顆 TPU v7
資本支出暴增Google 2026 capex 預期翻倍;但受限於矽晶圓產能,想花更多錢也花不出去

另一個值得關注的數字:Anthropic 光 2 月一個月就新增 60 億美元 ARR,主要靠 Claude Code 的 agent 編程 adoption。SemiAnalysis 的說法是:「如果有更多算力,他們還能賣更多。」

這件事對我們意味著什麼?

作為一個在 IoT 產業工作、同時重度使用 AI 工具的人,我看到三個影響:

1️⃣ 雲端 AI 工具的訂閱費只會更貴

CPU 被搶爆 → 雲端廠商成本上升 → 這些成本最終會轉嫁到用戶身上。如果你覺得 ChatGPT Pro 或 Claude Max 已經夠貴了,做好心理準備——算力稀缺的時代才剛開始。

2️⃣ 本地部署和 Edge Computing 的戰略價值被重新放大

這也是為什麼我一直關注本地 AI 方案的原因。當雲端 CPU 都不夠用了,靠雲端的解決方案成本結構只會越來越糟。

在工業場景尤其如此——你不會想讓工廠的預測性維護系統跟全世界的 AI Agent 搶同一個雲端 CPU 池。本地推理、Edge AI 不是「省錢的替代方案」,而是「在雲端算力稀缺時代的理性選擇」。

3️⃣ 這不只是硬體問題,是 AI 工作方式的根本轉變

以前我們用 AI 的方式是「問問題 → 拿答案」,CPU 確實不重要。但 Agent 時代的 AI 是「自主執行任務 → 持續交互 → 多步驟驗證」,每一步都吃 CPU。

這代表 AI 基礎設施的規劃不能再只盯著 GPU 了。CPU、記憶體、網路頻寬、儲存 I/O——整個 stack 都需要重新評估。

結語

SemiAnalysis 這份報告最值得玩味的地方在於:它揭示了一個所有 AI 從業者都需要面對的現實——AI 的進步速度已經超過了基礎設施的供給能力

我們花了三年拼命造 GPU,結果發現瓶頸跑到了 CPU 上。我們拼命擴張雲端產能,結果發現 TSMC 的晶圓不夠分。

這不是短期波動,是結構性轉變。

而對我們這些日常重度使用 AI 工作的人來說,最實際的建議是:認真考慮本地化部署方案,不要再把所有雞蛋放在雲端的籃子裡。

資料來源:SemiAnalysis「CPUs are Back: The Datacenter CPU Landscape in 2026」(2026/4/8)、「The Great AI Silicon Shortage」(2026/3/12)


探索更多來自 大衛的觀察日記 的內容

訂閱即可透過電子郵件收到最新文章。

發表迴響