隨著最新的AI芯片Blackwell GB200的訂單量攀升,英偉達股價也水漲船高。但這場AI盛宴的背后,AI算力市場卻呈現(xiàn)出“冰火兩重天”的景象。
自英偉達在今年3月發(fā)布Blackwell架構(gòu)GB200芯片以來,這款產(chǎn)品一直備受外界矚目。最近,天風(fēng)證券分析師郭明錤在研究報告中表示,英偉達GB200芯片訂單量激增,微軟是這款芯片最大的客戶,其第四季度的訂單量增長3-4倍,超過其他所有云服務(wù)商的總和.
在新一代AI芯片需求爆發(fā)的同時,曾經(jīng)炙手可熱的H100芯片卻有些遇冷,在算力租賃市場的價格已由巔峰時期的8美元/小時降至2—3美元/小時。證券時報記者向業(yè)內(nèi)人士了解到,從今年上半年開始,國內(nèi)算力的價格就呈現(xiàn)下降趨勢,在大模型訓(xùn)練需求有所下滑及早期“囤卡”導(dǎo)致供給相對過剩的背景下,一些規(guī)模較小的算力供應(yīng)商或?qū)⒚媾R虧損,正加速被市場“洗”出去。
值得注意的是,在AI大模型的浪潮下,多家A股上市公司此前已布局算力服務(wù),其中不乏跨界玩家。在風(fēng)起云涌的AI浪潮中,算力供給及市場需求情況瞬息萬變,相關(guān)投資是否能夠取得理想的回報,正成為一個越來越不確定的問號。
GB200芯片訂單,未來一年已排滿
最近,摩根士丹利的分析師與英偉達首席執(zhí)行官黃仁勛、首席財務(wù)官及管理團隊的其他成員舉行了一場會議。根據(jù)會議中得知的消息,分析師Joseph Moore表示,英偉達下一代GPU芯片Blackwell的生產(chǎn)正在“按計劃進行”,且未來12個月左右的供應(yīng)已經(jīng)售罄。
天風(fēng)國際證券分析師郭明錤在最新發(fā)布的英偉達Blackwell GB200芯片產(chǎn)業(yè)鏈訂單信息也顯示,Blackwell芯片的產(chǎn)能擴張預(yù)計在2024年第四季度初啟動,預(yù)計2024年第四季度的出貨量將在15萬到20萬塊之間,2025年第一季度出貨量將顯著增長200%到250%,達到50萬到55萬塊。郭明錤還指出,目前微軟是英偉達Blackwell GB200芯片的全球最大客戶,今年第四季訂單量將激增3至4倍,其訂單量將超過其他所有云端服務(wù)商的總和。
作為英偉達新一代的AI旗艦芯片,Blackwell GB200芯片包含了2080億個晶體管,采用臺積電N4P制程,為雙芯片架構(gòu),AI算力達20petaFLOPS(FP4),是Hopper的5倍。據(jù)國海證券研報,與上一代AI旗艦芯片H100相比,英偉達主打的GB200NVL72服務(wù)器可將AI大模型訓(xùn)練速度(如1.8T參數(shù)GPT-MoE)提高30倍。
手握高性能的AI芯片,來自各大客戶的訂單也紛至沓來。黃仁勛曾在CNBC的欄目訪談中提到,微軟、OpenAI、Meta等科技公司對Blackwell芯片的需求十分強烈,“每個人都希望擁有最多,也希望成為第一”。
“Blackwell GB200芯片需求爆發(fā),不僅預(yù)示著英偉達在AI硬件領(lǐng)域的領(lǐng)先地位進一步鞏固,也表明全球AI發(fā)展正在加速進入以更高效、更強大計算能力為支撐的新階段?!碧焓雇顿Y人、資深人工智能專家郭濤在接受證券時報記者采訪時表示,GB200若成功量產(chǎn)出貨,將對全球AI生態(tài)系統(tǒng)產(chǎn)生深遠影響,促進復(fù)雜模型訓(xùn)練與推理效率的提升,推動人工智能在多個行業(yè)的深度應(yīng)用,加速AI技術(shù)的普及和創(chuàng)新步伐。
H100芯片遇冷,租賃價格較高峰期跌超50%
與GB200芯片需求爆發(fā)相比,曾經(jīng)一度炙手可熱的上一代旗艦芯片H100在算力租賃市場上卻已從“一卡難求”轉(zhuǎn)為“供過于求”。
時間回溯至2023年3月,英偉達推出了H100系列GPU。與再上一代的芯片A100相比,H100基于Hopper架構(gòu),擁有18432個CUDA核心,支持更先進的內(nèi)存技術(shù)和更高的帶寬,性能提升3倍,尤其在AI訓(xùn)練和推理任務(wù)上表現(xiàn)出色,這也使H100一躍成為近兩年來最強大、最搶手的GPU產(chǎn)品。
在大模型的狂潮下,GPU的性能很大程度決定了模型訓(xùn)練的效果,因此各大公司都投入了巨額資金搶購H100。證券時報記者從一名做算力資源池的業(yè)內(nèi)人士處了解到,搭載H100的服務(wù)器一般是以8卡的形式出售或出租,去年8卡整機的出售價格一般都在300萬元以上,如今價格已降至230萬元—240萬元左右,“一周一個價”。而英偉達對華特供的H20芯片,8卡整機的價格也從之前的140萬元左右降至110萬元以內(nèi)。
在算力租賃市場,價格下降的幅度更加明顯。據(jù)了解,H100芯片最初的租賃價格為4.7美元/小時,在需求巔峰時期一度被爆炒至每小時8美元以上。記者查詢算力租賃網(wǎng)站發(fā)現(xiàn),如今1個H100NVL的租賃價格在每小時2—3美元之間,價格比巔峰時期已跌超50%。
“現(xiàn)在算力價格下降得比較厲害,我們也都在觀望之中?!痹摌I(yè)內(nèi)人士向記者表示,算力價格下降并非Blackwell GB200芯片推出后才有的現(xiàn)象,他從今年上半年開始就感覺市場的水溫在轉(zhuǎn)涼,此前訓(xùn)練大模型的需求很旺盛,加上市面上可用的算力不多,所以大家都在囤貨,從而進一步推高了價格。
該業(yè)內(nèi)人士觀察認(rèn)為,如今算力價格趨于下行主要有兩方面的原因。一是需求減少,在經(jīng)歷了前期的瘋狂投入以后,AI的收益曲線似乎沒有人們想象中的那么陡峭,很多公司開始重新審視對AI的投入,投資趨緩;二是算力供給提升,尤其在國產(chǎn)化提速、模型開源的背景下,企業(yè)從尋找大規(guī)模、高性能的算力,逐漸轉(zhuǎn)向更具性價比、可滿足小集群訓(xùn)練或推理任務(wù)的芯片。
在價格下行的趨勢下,一些業(yè)內(nèi)人士表達了對GPU泡沫破裂的擔(dān)憂。不過,也有不少從業(yè)者認(rèn)為,這一趨勢是技術(shù)迭代和市場自我調(diào)節(jié)的正常表現(xiàn)。郭濤向記者表示,所謂的“GPU泡沫破滅”可能過于悲觀,“當(dāng)前AI算力市場正處于動態(tài)平衡中,雖然個別產(chǎn)品價格波動,但整體需求依然強勁?!?/span>
上百家上市公司入局算力租賃,盈利問題仍迷霧重重
自生成式AI引爆算力需求后,許多的上市公司進軍算力市場,其中算力租賃作為一種更為靈活、更具成本優(yōu)勢的方式,更是成為各路玩家布局的重點賽道。同花順數(shù)據(jù)顯示,截至10月26日,已有107家上市公司涉及到算力租賃業(yè)務(wù),其中既有云服務(wù)、數(shù)據(jù)服務(wù)等領(lǐng)域的公司,也不乏地產(chǎn)、建筑材料、紡織服裝、印花染料等領(lǐng)域的跨界入局者。
在算力租賃價格下行的背景下,前期在算力方面的資本投入能否取得理想的回報,成為彌漫在所有玩家前方的迷霧。英偉達曾預(yù)測,GPU每小時租賃價格將在4年內(nèi)保持4美元/小時左右的價格,然而如今H100在一年半的時間內(nèi),租賃價格就已降至每小時2-3美元,這對于早期大量囤卡的算力租賃商而言,意味著利潤的急遽下滑。
根據(jù)外媒latent.space作者Eugene Cheah在最近一篇文章中的測算結(jié)果,當(dāng)GPU租賃價格跌破1.65美元/小時,算力提供商就面臨嚴(yán)重的虧損風(fēng)險。Eugene Cheah直言,投資購買新的H100已不再具有收益。事實上,不僅是H100,英偉達另一款熱門的消費級芯片4090在今年3月時,租賃價格還普遍在每月1.3萬元左右,如今已跌至每月七八千元,相關(guān)投資的收回周期將被拉長。
一方面,算力租賃價格具有高度的不確定性;另一方面,算力租賃市場需求也面臨較大的波動。在經(jīng)歷了2023年的“百模大戰(zhàn)”以后,如今硝煙似乎已淡化,許多公司逐漸放棄預(yù)訓(xùn)練模型,縮減預(yù)訓(xùn)練投入,更多地從模型訓(xùn)練轉(zhuǎn)向應(yīng)用,對高性能預(yù)訓(xùn)練芯片的需求也逐漸減少??紤]到絕大多數(shù)公司近兩年才入局算力租賃業(yè)務(wù),還處于早期投資階段,成本還未收回。以上的這些因素,將對算力租賃業(yè)務(wù)的盈利構(gòu)成較大的挑戰(zhàn)。
另外,由于國際關(guān)系等復(fù)雜的外部原因,國內(nèi)廠商能否如期獲得高性能算力卡也是一個問題。例如,去年“味精大王”蓮花控股宣布入局算力業(yè)務(wù)。最近,蓮花控股發(fā)布公告,對轉(zhuǎn)型算力業(yè)務(wù)相關(guān)情況進展進行說明。其中提到,公司全資子公司蓮花科創(chuàng)在去年9月與新華三信息簽訂330臺GPU系列服務(wù)器采購合同,合同金額為6.93億元。然而,目前新華三信息除去年11月交付了12臺以外,剩余318臺尚未交付。公告還提示,剩余318臺GPU系列服務(wù)器的交付存在不確定性的風(fēng)險,交付期限存在不明確的風(fēng)險。
“一方面,算力價格下降壓縮了服務(wù)提供商的利潤空間,增加了運營壓力;另一方面,也為更多企業(yè)提供了低成本獲取高性能算力的機會,促進了AI技術(shù)的廣泛應(yīng)用?!惫鶟硎?,技術(shù)更新?lián)Q代的速度加快會帶來投資貶值的問題,對于進入算力業(yè)務(wù)的公司而言,需要密切關(guān)注市場動態(tài),合理規(guī)劃投資,避免盲目跟風(fēng),同時加強技術(shù)創(chuàng)新和服務(wù)優(yōu)化,以應(yīng)對潛在的市場波動和不確定性。