NVIDIA 於 CUDA 13.1 推出 CUDA Tile,導入 tile-based 編程模型。此舉或將簡化程式碼移植至非 CUDA 硬體,引發對其生態「護城河」的討論。然而,NVIDIA 的專屬硬體最佳化仍是關鍵差異。NVIDIA 於 CUDA 13.1 推出 CUDA Tile,導入 tile-based 編程模型。此舉或將簡化程式碼移植至非 CUDA 硬體,引發對其生態「護城河」的討論。然而,NVIDIA 的專屬硬體最佳化仍是關鍵差異。

知名晶片架構師Jim Keller質疑CUDA Tile將使CUDA護城河失靈 因為將降低CUDA移植到其它平台門檻

2025/12/09 16:26

NVIDIA於NVIDIA CUDA 13.1推出全新NVIDIA CUDA Tile,透過基於tile的平行編程虛擬指令集,為CUDA增添新方式,然而知名晶片架構師Jim Keller對此感到不解,表示NVIDIA Tile的方式將簡化既有支援CUDA的程式碼移植到非CUDA GPU,進而使CUDA護城河失靈。

對於開發者而言,相較過往基於SIMT的CUDA給予程式設計師具備更大自主權但需要手動最佳化,CUDA Tile導入基於Tile的程式設計模型與名為Tile IR的底層虛擬機器,透過把GPU偽裝成採用Tile運算的「類TPU」,使AI開發者可專注在結構化矩陣運算、捲積等技術。

然而CUDA Tile與傳統的SMMIT並非二擇一,開發者仍可依據運算需求彈性選擇使用哪種方式,為透過CUDA GPU開發提供新的選項,不過相較原生為Tile開發的TPU,CUDA Tile的效率仍會相對差一些,但前提是兩者性能是在對等的前提之下。

Jim Keller的論點是建立在Tile是目前AI業界普遍使用的方法,當CUDA導入CUDA Tile,意味著能夠把像是支援Tile的Triton框架作為中介,先把CUDA程式碼轉移到Triton、進而移植到非CUDA的GPU,未來開發者不再需要撰寫支援特定架構的CUDA程式碼,理論上在CUDA開發的結果有望更不被CUDA制約。

▲Jim Keller認為CUDA Tile降低把CUDA應用程式移植到其它非CUDA硬體門檻,可能自毀CUDA護城河

雖然Jim Keller的說法並非毫無根據,然而CUDA畢竟是CUDA,即便對外採取更為開放的架構,但NVIDIA對自家硬體的最佳化仍非其它競爭者能在短時間內迎頭趕上,移植歸移植,要使非CUDA硬體能夠獲得最佳化的效果恐怕仍需繁瑣的微調,使用CUDA GPU仍可事倍功半。

值得一提的是Jim Keller目前正任職AI晶片新創Tenstorrent並擔任總裁及技術長,旨在提供較NVIDIA GPU更具經濟效益的AI晶片解決方案,並鎖定NVIDIA GPU無法涵蓋的特定AI市場。

免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 [email protected] 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡