8月17日消息,當下,幾乎所有軟件巨頭們都在大力投入AI推理業務。近日,大摩(摩根士丹利)的一份重磅報道顯示,AI推理原來是一門利潤驚人的生意。而選擇不同的AI GPU芯片,利潤率也差距非常大。
但總體來看,一座標準的“AI推理工廠”,無論采用哪家巨頭的芯片,其平均利潤率普遍超過50%。
據悉,摩根士丹利首創了一套標準化分析框架,即“100MW AI工廠模型”,將不同技術路徑的AI解決方案,置于同一商業維度下進行量化評估。
毫無懸念,NVIDIA的GB200 NVL72以近78%的利潤率遙遙領先。據悉,這主要得益于其領先的計算性能以及CUDA軟件生態的深厚壁壘,展現出了絕對的市場一哥的統治力。
谷歌自研的TPU v6e pod以74.9%的利潤率排名第二,AWS(亞馬遜云)的Trn2 UltraServer取得了62.5%的利潤率,而華為的昇騰CloudMatrix 384平臺也取得了47.9%的利潤率。
AMD的MI300X和MI355X意外遭遇滑鐵盧,利潤率竟然為負,分別為-28.2%和-64%。
報告指出,雖然AMD前期投入很大,但其token產出效率所能創造的收入,遠不足以覆蓋其高昂的成本。
本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。