AI大模型的實現(xiàn),需要海量數(shù)據(jù)和強大算力來支撐訓(xùn)練和推理過程,華為預(yù)估2030年相比2020年,AI爆發(fā)帶來的算力需求將增長500倍。
AI服務(wù)器作為算力基礎(chǔ)設(shè)施單元服務(wù)器的一種類型,由于由于普遍采用CPU(中央處理器)、GPU等組合的異構(gòu)式架構(gòu),相較通用服務(wù)器具備圖形渲染和海量數(shù)據(jù)的并行運算等優(yōu)勢,能夠快速準(zhǔn)確地處理大量數(shù)據(jù),可以滿足大模型所需強大的算力需求,廣泛應(yīng)用于深度學(xué)習(xí)、高性能計算、搜索引擎、游戲等行業(yè),其價值逐漸凸顯。
受AI(人工智能)大模型發(fā)展熱潮影響,市場算力需求大增,AI服務(wù)器作為算力基礎(chǔ)設(shè)施之一,由于具備圖形渲染和海量數(shù)據(jù)的并行運算等優(yōu)勢,能夠快速準(zhǔn)確地處理大量數(shù)據(jù),市場價值逐漸凸顯,近來市場需求大增,外加AI服務(wù)器核心零部件GPU(圖像處理器、加速芯片)芯片持續(xù)緊缺、GPU價格不斷上漲等,近期AI服務(wù)器價格大漲。
有企業(yè)透露,其去年6月購買的AI服務(wù)器不足一年價格漲了近20倍。同期,GPU價格也不斷上漲,例如A100GPU市場單價已達15萬,兩個月前為10萬元,漲幅50%,而A800價格漲幅相對更小,目前價格在9.5萬元左右,上月價格為8.9萬元左右。
AI服務(wù)器價格這幾年一直變化較大,主要因其配置在不斷提升,同時其核心零部件GPU全球主要廠家英偉達、AMD在GPU方面的產(chǎn)能有限,市場GPU供應(yīng)持續(xù)緊缺,預(yù)計未來AI服務(wù)器價格仍將保持上漲趨勢。
值得一提的是,上游高端GPU芯片持續(xù)缺貨等,一定程度上還影響了企業(yè)AI服務(wù)器出貨量,進而影響到相關(guān)服務(wù)器上市公司短期業(yè)績。不過,長遠來看,AI服務(wù)器獲業(yè)界一致看好,相關(guān)上市公司也正加碼布局。
據(jù)了解,ChatGPT火熱后,全球各大科技企業(yè)都在積極擁抱AIGC(生成式AI),紛紛發(fā)力AI大模型。據(jù)不完全統(tǒng)計,自3月16日百度率先公布“文心一言”以來,國內(nèi)已有超過30項大模型產(chǎn)品亮相。
然而,AI大模型的實現(xiàn),需要海量數(shù)據(jù)和強大算力來支撐訓(xùn)練和推理過程,華為預(yù)估2030年相比2020年,AI爆發(fā)帶來的算力需求將增長500倍。
AI 服務(wù)器用于處理深度學(xué)習(xí)工作負載的海量數(shù)據(jù),包括需要大內(nèi)存容量、高帶寬和整體系統(tǒng)內(nèi)緩存一致性的訓(xùn)練和推斷。相較于普通服務(wù)器,AI 服務(wù)器新增多張高性能加速器(絕大部分為 GPU),擁有更高的計算能力、更快的處理速度和更大的存儲空間。
AI 模型從最早 2012 年(AlexNet)問世以來,深度和廣度一直在逐級擴升。作為目前最大的語言模型之一,2020 年發(fā)布的 GPT-3 使用了 1750 億個參數(shù),是其前代的 100 多倍,微軟和英偉達共同開發(fā)的 Megatron-Turing-NLG 模型參數(shù)量則達 5300 億。
據(jù)中國信通院撰寫的《中國算力發(fā)展指數(shù)白皮書》,過去 10 年用于 AI 訓(xùn)練模型的計算資源激增,AI 訓(xùn)練的計算復(fù)雜度每年猛增 10 倍,人工智能計算已成為主流的計算形態(tài),全球智能算力規(guī)模(換算為 FP32)將由 2021 年 232EFlops 快速增長至 2030 年的 52.5ZFlops,期間 CAGR 超過 80%。
TrendForce 預(yù)計 2026 年全球 AI 服務(wù)器出貨量約 20 萬臺。
TrendForce 表示,在 AIGC、自動駕駛、AloT、邊緣計算等新興應(yīng)用帶動下,諸多大型云廠商加大AI 相關(guān)基礎(chǔ)設(shè)施建設(shè),預(yù)計搭載 GPGPU(General Purpose GPU)的 AI 服務(wù)器 2022 年出貨量僅占整體服務(wù)器市場的 1%,并有望在 2026 年增長至 20 萬臺,2022-2026 年 CAGR 為 10.8%。
據(jù) TrendForce 統(tǒng)計,2022 年 AI 服務(wù)器采購占比以北美四大云廠商為主,微軟、Google、Meta、AWS 合計貢獻 66.2%,國內(nèi)則以字節(jié)跳動投入最為積極,占比 6.2%。
不同類型的服務(wù)器成本結(jié)構(gòu)存在差異,芯片成本占比隨服務(wù)器性能提升而升高。
服務(wù)器本質(zhì)是計算機,核心硬件包括 CPU、以 GPU 為代表的加速卡、內(nèi)存、硬盤、網(wǎng)卡、電源、主板等。其中以 CPU 和 GPU 為代表的算力芯片是服務(wù)器主要成本項,占比隨著服務(wù)器性能的提高而逐漸上升。
綜合華經(jīng)情報網(wǎng)和 ARK數(shù)據(jù),芯片成本在普通服務(wù)器中約占總成本的 32%,而用于機器學(xué)習(xí)的服務(wù)器因通常搭載多卡高性能 GPU 導(dǎo)致芯片成本占比迅速提升至 83%。
AI 服務(wù)器和普通服務(wù)器之間的區(qū)別在于其硬件配置和使用方式。
AI 服務(wù)器用于處理深度學(xué)習(xí)工作負載的海量數(shù)據(jù),包括需要大內(nèi)存容量、高帶寬和整體系統(tǒng)內(nèi)緩存一致性的訓(xùn)練和推斷。相較于普通服務(wù)器,AI 服務(wù)器新增多張高性能加速器(絕大部分為 GPU),擁有更高的計算能力、更快的處理速度和更大的存儲空間,以支持高負載和復(fù)雜的計算任務(wù)。
隨著 GPU 向 A100 向 H100 升級迭代,AI 服務(wù)器有望迎來量價齊升。
根據(jù)英偉達官網(wǎng),相較于前代 A100,H100 綜合計算性能提高 6 倍,得益于:1)采用第四代 Tensor Core 和具有 FP8 精度的 Transformer 引擎,持續(xù)優(yōu)化大模型訓(xùn)練和推理表現(xiàn);2)升級第四代 NVLink,提供高達 900 GB/s 的 GPU 與 GPU之間互連;3)更高的顯存帶寬。
該行認為,隨著價格更高的 H100 在今年陸續(xù)出貨,AI 服務(wù)器市場將在今年迎來持續(xù)量價齊升。
根據(jù)中研普華研究院《2023-2028年中國IA服務(wù)器行業(yè)發(fā)展分析與投資前景預(yù)測報告》顯示:
隨著ChatGPT、百度文心一言等一系列大模型密集上線,AI大模型當(dāng)下已經(jīng)遍地開花。谷歌本周四發(fā)布AI語言模型PaLM 2與OpenAI旗下GPT-4等系統(tǒng)展開競爭,國內(nèi)云從科技、引力傳媒等多家A股上市公司亦宣布AI大模型產(chǎn)品最新進展。在“AI百模大戰(zhàn)”背后,隨之帶動的算力需求開始呈“爆炸式”增長,一場“算力儲備戰(zhàn)”已暗潮洶涌,全球算力市場持續(xù)火熱。
據(jù)悉,AI由數(shù)據(jù)、算法(即模型)和算力驅(qū)動,其中任意一方的發(fā)展會推動其他方面需求的增長。有分析認為,當(dāng)下行業(yè)內(nèi)雖然擁有更多的數(shù)據(jù)以及做了更多的AI模型研究,但算力的擴展速度卻沒有跟上。今年4月,OpenAI就因需求量過大而停止了ChatGPT Plus的銷售。對此,東方證券研報認為,主要系計算資源供不應(yīng)求。
根據(jù)數(shù)據(jù)預(yù)測,AI時代算力的增長已遠遠超過了摩爾定律每18個月翻番的速率,預(yù)計到2030年全球超算算力將達到0.2ZFLOPS,平均年增速超過34%。華為更是預(yù)測,未來10年人工智能算力需求將會增長500倍以上。那么,身處“智能革命”起點的當(dāng)下,什么才是AI算力的最優(yōu)解?國內(nèi)“算力軍備競賽”又走到哪一步了?
眾所周知,芯片能力直接影響著高算力訓(xùn)練效果和速度,相較于基于CPU芯片的通用算力,AI所需的智能算力則主要基于GPU、GPGPU及AISC等AI芯片所提供算力,用于人工智能的訓(xùn)練和推理。其中,GPU是一種專門用于處理圖形、視頻、游戲等高性能計算的硬件設(shè)備,憑借相較于其他硬件在算力方面的較大優(yōu)勢脫穎而出,同時隨著英偉達A100、H100等型號產(chǎn)品的發(fā)布,前款產(chǎn)品在AI推理時吞吐量是CPU的249倍。GPU已成為當(dāng)前AI算力的核心硬件。
中金公司研報表示,多GPU互聯(lián)能力加強可以提高并行計算能力,因而算力提升對GPU數(shù)量的要求日益提高。隨著單GPU的計算能力越來越難以應(yīng)對深度學(xué)習(xí)對算力的需求,英偉達已經(jīng)開始用多個GPU去解決問題。對此,業(yè)內(nèi)分析認為,高端GPU的數(shù)量基本決定了一個廠商能夠練多大的模型,后期將成為業(yè)內(nèi)判斷企業(yè)大模型能力的重要指標(biāo)。
據(jù)TrendForce數(shù)據(jù)顯示,如果以英偉達 A100 顯卡的處理能力計算,GPT-3.5大模型需要2萬塊GPU來處理訓(xùn)練數(shù)據(jù)。亦有業(yè)內(nèi)公認看法,做好AI大模型的算力門檻是1萬枚A100芯片。
目前,全球GPU市場主要由英偉達、英特爾和AMD三家巨頭壟斷,去年Q4獨立GPU份額分別為85%、6%、9%。其中,人工智能、云端計算和獨立GPU主要為英偉達主導(dǎo),A100和H100最高浮點算力分別實現(xiàn)19.5 TFLOPS 和67 TFLOPS。
相較于此,我國國產(chǎn)GPU尚處萌芽期,與國際廠商差距更大。但隨著高端GPU的出口限令,針對中國市場推出的特供版A800也已漲10萬元的高價,國內(nèi)GPU市場需求緊迫。在此情形下國產(chǎn)化迫在眉睫,國產(chǎn)GPU廠商近幾年也不斷涌現(xiàn),目前國內(nèi)自研GPU的領(lǐng)軍企業(yè)主要是寒武紀(jì)、景嘉微、華為昇騰等。其中,景嘉微是國內(nèi)首家成功研制國產(chǎn)GPU芯片并實現(xiàn)大規(guī)模工程應(yīng)用的企業(yè)。行業(yè)內(nèi)專家稱,主打產(chǎn)品JH920的性能與英偉達2016年發(fā)布的GTX 1050相仿,在中高端領(lǐng)域及硬核的算力需求仍存在較長的追趕道路。
對于整個算力市場,業(yè)內(nèi)人士認為,目前燒GPU是最為現(xiàn)實的方案,尤其從國內(nèi)GPU廠商的角度來看,國產(chǎn)GPU高端化薄弱,只有使更多低端的GPU去追趕和堆疊,通過優(yōu)化和協(xié)調(diào)來協(xié)同作用,再去組合模擬優(yōu)化的路徑。
《2023-2028年中國IA服務(wù)器行業(yè)發(fā)展分析與投資前景預(yù)測報告》由中研普華研究院撰寫,本報告對該行業(yè)的供需狀況、發(fā)展現(xiàn)狀、行業(yè)發(fā)展變化等進行了分析,重點分析了行業(yè)的發(fā)展現(xiàn)狀、如何面對行業(yè)的發(fā)展挑戰(zhàn)、行業(yè)的發(fā)展建議、行業(yè)競爭力,以及行業(yè)的投資分析和趨勢預(yù)測等等。報告還綜合了行業(yè)的整體發(fā)展動態(tài),對行業(yè)在產(chǎn)品方面提供了參考建議和具體解決辦法。
關(guān)注公眾號
免費獲取更多報告節(jié)選
免費咨詢行業(yè)專家
2023-2028年中國IA服務(wù)器行業(yè)發(fā)展分析與投資前景預(yù)測報告
IA服務(wù)器行業(yè)研究報告主要分析了IA服務(wù)器行業(yè)的市場規(guī)模、IA服務(wù)器市場供需求狀況、IA服務(wù)器市場競爭狀況和IA服務(wù)器主要企業(yè)經(jīng)營情況,同時對IA服務(wù)器行業(yè)的未來發(fā)展做出科學(xué)的預(yù)測。中研普華憑...
查看詳情
產(chǎn)業(yè)規(guī)劃 特色小鎮(zhèn) 產(chǎn)業(yè)園區(qū)規(guī)劃 產(chǎn)業(yè)地產(chǎn) 可研報告 商業(yè)計劃書 細分市場研究 IPO上市咨詢
網(wǎng)絡(luò)安全,通常指計算機網(wǎng)絡(luò)的安全,實際上也可以指計算機通信網(wǎng)絡(luò)的安全。中國網(wǎng)絡(luò)安全行業(yè)發(fā)展規(guī)劃 中國網(wǎng)絡(luò)安全行...
外骨骼機器人,通俗來說就是“套在人體外面”的機器人,它是基于仿生學(xué)和人體工程學(xué)的設(shè)計,也稱“可穿戴機器人”,外...
無人零售商店指商店內(nèi)所有或部分經(jīng)營流程,通過技術(shù)手段進行智能化自動化處理,且降低或不存在人工干預(yù)。中國無人零售...
刷卡機簡稱POS終端,終端通過電話線撥號的方式將信息首先發(fā)送到銀聯(lián)的平臺,銀聯(lián)平臺識別相關(guān)信息之后會將扣款信息發(fā)P...
兩部門:加快實現(xiàn)適宜使用新能源汽車的地區(qū)充電站“縣縣全覆蓋”、充電樁“鄉(xiāng)鄉(xiāng)全覆蓋”國家發(fā)展改革委、國家能源局發(fā)...
教育玩具,顧名思義就是以教育為目的而具有娛樂趣向的玩具,早期以益智玩具為主,近年來,隨著社會經(jīng)濟等各方面的發(fā)展...
中研普華集團聯(lián)系方式廣告服務(wù)版權(quán)聲明誠聘英才企業(yè)客戶意見反饋報告索引網(wǎng)站地圖 Copyright ? 1998-2022 ChinaIRN.COM All Rights Reserved. 版權(quán)所有 中國行業(yè)研究網(wǎng)(簡稱“中研網(wǎng)”) 粵ICP備05036522號
微信掃一掃