SemiAnalysis 最新報告揭示:當 AI 從「打字員」變成「打工仔」,真正被搶爆的不是 GPU,是 CPU。

一句話講完
全世界砸了幾千億美金搶 GPU,結果現在被卡住的竟然是 CPU。
半導體分析機構 SemiAnalysis 的 Dylan Patel 在 4/8 的深度訪談中丟出了一個反直覺的結論:過去六個月,雲端市場上所有 CPU 已被完全耗盡。不是因為大家突然開始挖礦,而是 AI 的工作型態正在發生根本性轉變。
這件事跟每一個用 AI 工作的人都有關係。往下看。
到底發生了什麼事?
1️⃣ AI 從「打字」進化到「打工」
兩年前的 AI 是什麼樣子?你丟一個 prompt,它回你一段文字。就這樣。CPU 幾乎沒事做,所有壓力都在 GPU 上。
現在呢?Agent 時代來了。
- Claude Code 能連續自主工作 6-8 小時,自己查資料、自己跑 code、自己驗證結果
- 這些 Agent 不只呼叫 GPU 做推理,還需要大量 CPU 做資料庫查詢、環境模擬、狀態管理
- Code Agent 市場收入在半年內從數十億暴增到超過 1000 億美元
簡單講:以前一個 request 跑 0.5 秒就結束,現在一個 Agent task 跑好幾個小時,而且中間每一步都需要 CPU 介入。
2️⃣ 強化學習的訓練迴圈把 CPU 推到極限
未來的 AI 不只解數學題,還要在物理模擬器裡跑。這代表 RL 訓練時,模型生成的每一步都需要在 CPU 叢集上高頻驗證。
Dylan Patel 的原話:「這個迴圈在過去幾年越來越緊,過去六個月我們看到雲端上所有 CPU 都被跑滿了。」
3️⃣ Microsoft 的 CPU 直接賣到缺貨
市場需求暴增的後果?雲端算力被榨乾。據報,Microsoft 的 CPU 庫存已經售罄,甚至影響到 GitHub 的服務穩定性。
你沒看錯——一家全球最大的雲端廠商,CPU 不夠用了。
供應鏈的連鎖反應
這不只是「雲端 CPU 不夠」這麼簡單。SemiAnalysis 在 3 月的另一份報告「The Great AI Silicon Shortage」裡描繪了一個更完整的圖景:
| 瓶頸 | 具體狀況 |
|---|---|
| TSMC N3 晶圓 | 2026 年所有 AI 晶片(NVIDIA Rubin、AMD MI350X、Google TPU v7、AWS Trainium3)同時轉進 3nm,AI 需求將吃掉 N3 近 60% 產能 |
| 記憶體 | HBM 需求暴增,產能跟不上,DRAM 價格壓力沿供應鏈蔓延 |
| 矽晶圓重新分配的算術 | 把智慧手機 N3 晶圓的 5% 轉給 AI → 多產 10 萬顆 Rubin GPU 或 30 萬顆 TPU v7 |
| 資本支出暴增 | Google 2026 capex 預期翻倍;但受限於矽晶圓產能,想花更多錢也花不出去 |
另一個值得關注的數字:Anthropic 光 2 月一個月就新增 60 億美元 ARR,主要靠 Claude Code 的 agent 編程 adoption。SemiAnalysis 的說法是:「如果有更多算力,他們還能賣更多。」
這件事對我們意味著什麼?
作為一個在 IoT 產業工作、同時重度使用 AI 工具的人,我看到三個影響:
1️⃣ 雲端 AI 工具的訂閱費只會更貴
CPU 被搶爆 → 雲端廠商成本上升 → 這些成本最終會轉嫁到用戶身上。如果你覺得 ChatGPT Pro 或 Claude Max 已經夠貴了,做好心理準備——算力稀缺的時代才剛開始。
2️⃣ 本地部署和 Edge Computing 的戰略價值被重新放大
這也是為什麼我一直關注本地 AI 方案的原因。當雲端 CPU 都不夠用了,靠雲端的解決方案成本結構只會越來越糟。
在工業場景尤其如此——你不會想讓工廠的預測性維護系統跟全世界的 AI Agent 搶同一個雲端 CPU 池。本地推理、Edge AI 不是「省錢的替代方案」,而是「在雲端算力稀缺時代的理性選擇」。
3️⃣ 這不只是硬體問題,是 AI 工作方式的根本轉變
以前我們用 AI 的方式是「問問題 → 拿答案」,CPU 確實不重要。但 Agent 時代的 AI 是「自主執行任務 → 持續交互 → 多步驟驗證」,每一步都吃 CPU。
這代表 AI 基礎設施的規劃不能再只盯著 GPU 了。CPU、記憶體、網路頻寬、儲存 I/O——整個 stack 都需要重新評估。
結語
SemiAnalysis 這份報告最值得玩味的地方在於:它揭示了一個所有 AI 從業者都需要面對的現實——AI 的進步速度已經超過了基礎設施的供給能力。
我們花了三年拼命造 GPU,結果發現瓶頸跑到了 CPU 上。我們拼命擴張雲端產能,結果發現 TSMC 的晶圓不夠分。
這不是短期波動,是結構性轉變。
而對我們這些日常重度使用 AI 工作的人來說,最實際的建議是:認真考慮本地化部署方案,不要再把所有雞蛋放在雲端的籃子裡。
資料來源:SemiAnalysis「CPUs are Back: The Datacenter CPU Landscape in 2026」(2026/4/8)、「The Great AI Silicon Shortage」(2026/3/12)
探索更多來自 大衛的觀察日記 的內容
訂閱即可透過電子郵件收到最新文章。
