H200晶片

中國繞道採購
NVIDIA H200 的系統工程與 TCO 煉獄

中國繞道採購
NVIDIA H200 的系統工程與 TCO 煉獄

中國繞道採購
NVIDIA H200 的系統工程與 TCO 煉獄

作者:

製造新觀點

更新日期:

2025 年 12 月 11 日

圖片來源:Available for hire

圖片來源:Available for hire

圖片來源:Available for hire

近日,各家媒體報導阿里巴巴(Alibaba)、字節跳動等這些中國科技巨頭,正積極尋求大量採購 NVIDIA 最新的 AI 晶片 H200 時,許多人可能只看到一個資訊,那就是禁令似乎被突破了。 畢竟,NVIDIA 為了規避設計美國的出口管制,讓 H200 以「專供版」的形式,表面上符合了運算性能限制。

這場晶片戰爭的真正戰場,已經不在「買不買得到」,而在於「用不用得起」。

從小編觀點來看,「降規替代」策略的代價,遠比晶片本身的高昂價格更可怕。這是一種系統工程的噩夢,它逼迫中國企業付出巨大的總體擁有成本(TCO)、面對複雜無比的系統工程複雜性,以及無法挽回的運算效率折損。

我們希望帶著大家一起看看中國 AI 企業為了維持算力,正在支付哪些隱形帳單,而最終將決定他們與全球 AI 創新的距離。

地緣政治的雙重鎖鏈

H200 是「形式」合規?還是技術「規避」?

很多人可能還不認識 H200,NVIDIA 的 H200 在設計上,展現了極高的商業智慧與技術彈性。他們透過調整晶片的關鍵參數,例如記憶體頻寬、互聯速度(NVLink)…等,讓其「形式上」的運算性能低於美國政府的運算性能限制門檻,而這會不會是為了與美國技術脫鉤的戰略意圖?

美國希望透過出口管制來拖慢中國 AI 發展速度,但 NVIDIA 作為商業公司,必須平衡股東利益與法規遵循。因此,他們推出了專供版晶片,在法律上站得住腳,但在戰略上卻是與美國政府「形式合規,實質違規」的擦邊球,這種設計雖然讓晶片流入中國成為可能,但卻為下游的系統工程埋下了巨大的隱患。

有錢也買不到專供版?

即使 H200 已經在技術上「規避」了美國限制,阿里巴巴(Alibaba)、字節跳動等這些數據中心巨頭的大額採購案,仍面臨另一道門檻,那就是必須等北京政府的批准(參考網站 1)。

這就是小編說的「雙重鎖鏈」,一邊來自美國鎖鏈,限制了晶片的性能上限。一邊則來自中國鎖鏈, 限制了晶片的採購總量。

中國政府透過審批權,將AI 晶片採購納入國家嚴格管控範疇。這樣做的目的很明顯,他們需要平衡對外採購與國產晶片的扶植需求。如果中國巨頭可以無限制地採購 NVIDIA 晶片,誰還願意投入資源去發展和使用本土替代品?

灰色地帶的風險

其實你仔細去看這件事,就會發現 H200 晶片已經透過各種灰色地帶或變通方式流入了中國市場。然而,這種非正規管道的流入,帶來極高的供應鏈不穩定性和合規性風險。

中國企業採購到的晶片,很可能是批次不一、性能不均的 H800 或 H100,甚至混雜著本土替代品。這種複雜的異構運算集群,對後續的系統工程複雜性簡直是個災難。

降規替代的真實效率折損

現在,我們來算算這筆帳,為了維持 AI 訓練算力,中國企業被迫執行「降規替代」策略,而這背後付出的成本,是無法挽回的。

試著想想 H200 的核心價值在哪裡?在於它的高記憶體頻寬和光學互聯(NVLink)帶來的高速通訊能力。在訓練大模型時,數百顆晶片必須以極快的速度交換數據。降規版的 H200/H800 在運算性能上的限制,特別是互聯速度上的降速,將造成嚴重的效率折損。

換來的真的有比較好嗎?在處理數萬億參數的大模型訓練時,數據通訊瓶頸將嚴重拖累整個集群的運作。而且數百顆降規晶片之間頻繁的數據交換延遲,會讓模型收斂速度顯著變慢,這直接影響中國 AI 企業的創新速度和模型優化進度。你省下了採購頂規晶片的錢,卻賠上了最寶貴的時間。

數據中心的技術挑戰

為了達到與單顆 H200 頂規晶片相同的運算力,阿里巴巴等企業可能需要採購 N 顆降規晶片,如果說 1.5 顆降規晶片的性能,才能替代 1 顆頂規晶片,那便會讓系統工程的複雜性提高,要怎麼將數千顆性能不均、批次不一的降規晶片,整合成一個高效、穩定的AI 訓練集群?

這需要耗費巨大的軟體工程師資源,去優化和調整底層軟體,讓它能夠適配這種異構運算集群,並將運算延遲降到最低。中國數據中心的技術能力固然強大,但這種系統工程複雜性,正在成為巨大的資源消耗黑洞。

而且更重要的是!儘管有了 H200 的消息,H100 在中國的需求仍然極高。這是因為 H100 畢竟仍是成熟且性能穩定的解決方案。在 H200 的政策和供應仍充滿變數時,中國企業傾向於將H100 作為過渡期主力,甚至將其與國產晶片混用,以等待政策進一步明朗。這種混亂的過渡期,進一步加劇了系統工程的難度。

電力成本與空間的隱形支出

當我們只計算晶片的採購成本時,我們忽略了總體擁有成本(TCO)這個隱形帳單。

電力成本與散熱的隱形帳單

為了彌補降規晶片在性能上的不足,你需要採購更多的數量。更多的晶片,意味著更多的伺服器機櫃,以及隨之而來的電力消耗與散熱系統成本。從量化的角度來看,為了達到相同的運算力,如果需要多 50% 的降規晶片,那麼電力成本、數據中心的冷卻成本也會隨之大幅增加。而從空間的角度來看, 額外的機櫃也擠佔了寶貴的數據中心空間,增加了租賃成本。

小編的結論是,這種因降規替代而暴增的電力成本、散熱成本與空間成本,很可能已經抵銷了,甚至超越了,採購頂規 H200 晶片所帶來的溢價。 這是技術脫鉤策略下,美國對中國企業施加的間接成本懲罰。

CUDA 生態系的鴻溝

TCO 的最終且最難量化的成本是時間。NVIDIA 的 CUDA 生態系是 AI 晶片界的護城河。中國本土替代品在運算性能上追趕的同時,必須投入巨大資源建立自己的軟體生態。在時間窗口的壓力下, NVIDIA 透過不斷推出如 H200 這樣的「規避設計」晶片,同時加速其技術迭代,不斷壓縮國產晶片的發展時間窗口。中國政府對阿里巴巴的審批權,正反映了其對國產晶片生態系能否及時建構的深度焦慮。

如果中國企業將大量資源浪費在管理混亂的降規替代集群上,他們投入到本土替代品和生態系建構上的資源與時間就會被稀釋。

中國的長期選擇

H200 晶片的流向與阿里巴巴的採購案,清晰地揭示了美中晶片戰爭已從單純的「性能限制」轉移到了「成本效益」與「系統管理」的拉鋸戰。

小編的觀點是,AI 發展速度明顯被有效拖慢,降規替代策略帶來的運算效率折損和TCO 煉獄,將有效拖慢中國 AI 企業大模型訓練的進度,從而影響其在 AI 領域的創新速度。且在美國的出口管制下,正在催生全球 AI 領域形成雙重技術標準,一套是 NVIDIA 頂規晶片定義的最高標準,另一套是中國數據中心被迫接受的異構組裝標準。

中國的長期選擇將是艱難的,他們必須在電力成本高漲、系統工程複雜的「降規替代」和全力投入華為昇騰等本土替代品的「生態系建構」之間,做出決定。而在我看來,唯有將資源集中於建立自主可控的本土生態系,並解決 AI 晶片最核心的系統工程複雜性,才是中國 AI 領域唯一的長期生存之道。

唯一可以為您的企業
提供準確服務的平台

唯一可以為您的企業
提供準確服務的平台

唯一可以為您的企業提供
精準服務的平台

唯一可以為您的企業
提供準確服務的平台

聯繫我們

Icon Image
Icon Image
Icon Image
Icon Image
Icon Image
Icon Image
Icon Image
Icon Image
Icon Image
Icon Image
Icon Image
Icon Image

關於我們

隱私條款

使用條款

常見問題

© 2025 製造新觀點 All Rights Reserved.