BEV全稱Bird'sEyeView,即鳥瞰圖,該算法旨在將多傳感器收集的圖像信息投射至統(tǒng)一3D空間,再輸入至單一大模型進(jìn)行整體推理。相較于傳統(tǒng)的攝像頭圖像,BEV提供了一個(gè)更貼近實(shí)際物理世界的統(tǒng)一空間,為后續(xù)的多傳感器融合以及規(guī)劃控制模塊開發(fā)提供了更大的便利和更多的可B
大模型是當(dāng)前AI領(lǐng)域最為火熱的前沿趨勢之一,可賦能自動駕駛領(lǐng)域的感知、標(biāo)注、仿真訓(xùn)練等多個(gè)核心環(huán)節(jié)。在感知層,以特斯拉為首,"BEV+Transformer"范式已開始在自動駕駛領(lǐng)域得到廣泛使用,可有效提升感知精確度,利于后續(xù)規(guī)劃控制算法的實(shí)施,促進(jìn)端到端自動駕駛框架的發(fā)展。 BEV全稱Bird'sEyeView,即鳥瞰圖,該算法旨在將多傳感器收集的圖像信息投射至統(tǒng)一3D空間,再輸入至單一大模型進(jìn)行整體推理。相較于傳統(tǒng)的攝像頭圖像,BEV提供了一個(gè)更貼近實(shí)際物理世界的統(tǒng)一空間,為后續(xù)的多傳感器融合以及規(guī)劃控制模塊開發(fā)提供了更大的便利和更多的可能。具體來說,BEV感知的優(yōu)勢在于:1)統(tǒng)一了多模態(tài)數(shù)據(jù)處理維度,將多個(gè)攝像頭或雷達(dá)數(shù)據(jù)轉(zhuǎn)換至3D視角,再做目標(biāo)檢測與分割等任務(wù),從而降低感知誤差,并為下游預(yù)測和規(guī)劃控制模塊提供更豐富的輸出;2)實(shí)現(xiàn)時(shí)序信息融合,BEV下的3D視角相較于2D信息可有效減少尺度和遮擋問題,甚至可通過先驗(yàn)知識"腦補(bǔ)"被遮擋的物體,有效提高自動駕駛安全性;3)感知和預(yù)測可在統(tǒng)一3D空間中實(shí)施,通過神經(jīng)網(wǎng)絡(luò)直接完成端到端優(yōu)化,可有效降低傳統(tǒng)感知任務(wù)中感知與預(yù)測串行的誤差累積。 Transformer的注意力(Attention)機(jī)制可幫助實(shí)現(xiàn)2D圖像數(shù)據(jù)至3DBEV空間的轉(zhuǎn)化。Transformer是GoogleBrian團(tuán)隊(duì)在2017年提出的神經(jīng)網(wǎng)絡(luò)模型,起初用于機(jī)器翻譯,隨著技術(shù)的發(fā)展開始進(jìn)軍圖像視覺領(lǐng)域,目前已成功涉足分類、檢測和分割三大圖像問題。據(jù)汽車之心微信公眾號介紹,傳統(tǒng)CNN模型的原理是通過卷積層構(gòu)造廣義過濾器,從而對圖像中的元素進(jìn)行不斷地篩選壓縮,因此其感受域一定程度上取決于過濾器的大小和卷積層的數(shù)量。隨著訓(xùn)練數(shù)據(jù)量的增長,CNN模型的收益會呈現(xiàn)過飽和趨勢。而Transformer的網(wǎng)絡(luò)結(jié)構(gòu)在嫁接2D圖像和3D空間時(shí)借鑒了人腦的注意力(Attention)機(jī)制,在處理大量信息時(shí)能夠只選擇處理關(guān)鍵信息,以提升神經(jīng)網(wǎng)絡(luò)的效率,因此Transformer的飽和區(qū)間很大,更適宜于大規(guī)模數(shù)據(jù)訓(xùn)練的需求。在自動駕駛領(lǐng)域,Transformer相比于傳統(tǒng)CNN,具備更強(qiáng)的序列建模能力和全局信息感知能力,目前已廣泛用于視覺2D圖像數(shù)據(jù)至3D空間的轉(zhuǎn)化。 除感知層外,大模型還有望顯著提升后端訓(xùn)練中數(shù)據(jù)清洗標(biāo)注的效率,并助力生成新場景以賦能仿真訓(xùn)練。訓(xùn)練模型在收集到傳感器傳送回的圖像數(shù)據(jù)后,需先對數(shù)據(jù)進(jìn)行清洗,再對其中的車輛、行人、道路標(biāo)識、車道線等元素進(jìn)行標(biāo)注。相較于此前的人工標(biāo)注,大模型可以大幅提升工作效率。理想汽車創(chuàng)始人李想在中國電動汽車百人會論壇(2023)的演講中表示,此前理想一年要做大概1000萬幀自動駕駛圖像的人工標(biāo)定,年成本接近1億元,但使用軟件2.0大模型進(jìn)行自動化標(biāo)定后,效率是人的1000倍。毫末智行也2023年4月第八屆AIDAY上表示,其最新推出的DriveGPT可將交通場景圖像的標(biāo)注費(fèi)用從行業(yè)平均約5元/張降至約0.5元/張。Meta最新的圖像分割模型SAM(SegmentAnythingModel)在對圖像和視頻中的物體進(jìn)行識別分割時(shí)展現(xiàn)出了強(qiáng)大的能力,且具有零樣本性能,即能夠?qū)奈从?xùn)練過的圖片進(jìn)行精準(zhǔn)分割,未來也有望賦能自動駕駛訓(xùn)練所需的圖像數(shù)據(jù)積累。 在"BEV+Transformer"趨勢下,算法復(fù)雜度、數(shù)據(jù)規(guī)模以及模型參數(shù)均呈指數(shù)級提升,推動自動駕駛芯片向著大算力、新架構(gòu)以及存算一體等方向演進(jìn)。 1、大算力: 向數(shù)百TOPS算力演進(jìn)。傳統(tǒng)L1/L2輔助駕駛所需處理的數(shù)據(jù)量小且算法模型相對簡單,因此以Mobileye為代表的單目視覺+芯片算法強(qiáng)耦合的一體機(jī)方案即可滿足需求。但領(lǐng)航功能作為高階輔助駕駛的代表,需要"更強(qiáng)算力+軟硬件解耦的芯片+域控制器"來滿足海量數(shù)據(jù)處理與后續(xù)持續(xù)OTA迭代的需求。高速領(lǐng)航開始向20萬以下車型滲透,15-30TOPS可滿足基本需求,但若想要"好用"或需要30-80TOPS。城區(qū)領(lǐng)航的場景復(fù)雜程度和技術(shù)實(shí)現(xiàn)難度更高,目前普遍需要搭載激光雷達(dá),芯片以英偉達(dá)Orin、華為MDC和地平線J5為主,算力配置普遍超200TOPS。而在應(yīng)用"BEV+Transformer"技術(shù)后,多傳感器前融合以及2D至3D空間的轉(zhuǎn)化需要AI芯片具備更強(qiáng)的推理能力,因此也需要比以往更大的算力支撐,包括更高的AI算力、CPU算力和GPU算力。 2、新架構(gòu): 加強(qiáng)并行計(jì)算能力和浮點(diǎn)運(yùn)算能力。相較于CNN/RNN,Transformer具有更強(qiáng)的并行計(jì)算能力,可加入時(shí)間序列矢量,其數(shù)據(jù)流特征有顯著差別,浮點(diǎn)矢量矩陣乘法累加運(yùn)算更適合采用BF16精度。Transformer允許數(shù)據(jù)以并行的形式進(jìn)行計(jì)算,且保留了數(shù)據(jù)的全局視角,而CNN/RNN的數(shù)據(jù)流只能以串行方式計(jì)算,不具備數(shù)據(jù)的全局記憶能力。傳統(tǒng)AI推理專用芯片大多針對CNN/RNN,并行計(jì)算表現(xiàn)不佳,且普遍針對INT8精度,幾乎不考慮浮點(diǎn)運(yùn)算。因此想要更好適配Transformer算法,就需要將AI推理芯片從硬件層面進(jìn)行完整的架構(gòu)革新,加入專門針對Transformer的加速器,或使用更強(qiáng)的CPU算力來對數(shù)據(jù)整形,這對芯片架構(gòu)、ASIC研發(fā)能力,以及成本控制都提出了更高的要求。以特斯拉、地平線為代表的廠商均"重ASIC(即AI推理專用芯片),輕GPU"。特斯拉引領(lǐng)BEV+Transformer路線,以專用NPU(神經(jīng)網(wǎng)絡(luò)處理器)承擔(dān)AI運(yùn)算,在NPU設(shè)計(jì)之初便進(jìn)行了針對性優(yōu)化。而地平線等后來者或需要在下一代芯片中對AI推理芯片架構(gòu)進(jìn)行針對性優(yōu)化。 3、存算一體: SoC芯片需配置高帶寬存儲器(HBM)或SRAM,并加速向存算一體靠攏,解決大算力下的數(shù)據(jù)吞吐量瓶頸。模型越大,內(nèi)存對AI加速器就越重要,以頻繁地讀取權(quán)重矩陣或訓(xùn)練好的模型參數(shù)。據(jù)佐思汽研介紹,Transformer中的權(quán)重模型超過1GB,對比傳統(tǒng)CNN的權(quán)重模型通常不超過20MB。模型參數(shù)越大,就需要更高的帶寬,一次性讀出更多參數(shù)。存算一體可分為近存計(jì)算(PNM)、存內(nèi)處理(PIM)以及存內(nèi)計(jì)算(CIM),存內(nèi)計(jì)算則接近存算一體,當(dāng)前PNM已廣泛用于高性能芯片,即采用HBM堆疊,2.5D封裝,從而與CPU集成,而PIM和CIM仍處在發(fā)展中。以特斯拉FSDSoC為例,其采用總帶寬為68GB/s的8顆LPDDR4內(nèi)存,而集成在NPU中的SRAM可達(dá)到32MBL3緩存,帶寬達(dá)2TB/s,遠(yuǎn)超市面上同類芯片。而據(jù)汽車之心微信公眾號,特斯拉在最新HW4.0上的二代FSDSoC上使用了16顆GDDR6,在內(nèi)存用料上繼續(xù)引領(lǐng)行業(yè)。
欲了解更多中國智能駕駛行業(yè)的未來發(fā)展前景,可以點(diǎn)擊查看中研普華產(chǎn)業(yè)院研究報(bào)告《2023-2028年中國智能駕駛行業(yè)市場深度全景調(diào)研及投資前景分析報(bào)告》。
關(guān)注公眾號
免費(fèi)獲取更多報(bào)告節(jié)選
免費(fèi)咨詢行業(yè)專家
2023-2028年中國智能駕駛行業(yè)深度分析及投資前景預(yù)測報(bào)告
智能駕駛即利用人工智能、視覺計(jì)算、雷達(dá)、監(jiān)控裝置和全球定位系統(tǒng)協(xié)同合作,讓汽車能夠部分或全面感知周圍環(huán)境并進(jìn)行自動安全地駕駛,有效彌補(bǔ)了人類駕駛員存在的缺陷。國際汽車工程師協(xié)會把汽...
查看詳情
產(chǎn)業(yè)規(guī)劃 特色小鎮(zhèn) 產(chǎn)業(yè)園區(qū)規(guī)劃 產(chǎn)業(yè)地產(chǎn) 可研報(bào)告 商業(yè)計(jì)劃書 細(xì)分市場研究 IPO上市咨詢
我國算力產(chǎn)業(yè)的發(fā)展情況近期,工業(yè)和信息化部聯(lián)合有關(guān)部門印發(fā)了《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計(jì)劃》,大家都很關(guān)注,...
消費(fèi)電子一般指消費(fèi)電子產(chǎn)品,是指圍繞著消費(fèi)者應(yīng)用而設(shè)計(jì)的與生活、工作娛樂息息相關(guān)的電子類產(chǎn)品,最終實(shí)現(xiàn)消費(fèi)者自...
作為鞋類市場近些年興起的一個(gè)細(xì)分領(lǐng)域,老人鞋一直呈快速發(fā)展態(tài)勢。老人鞋,也叫老年鞋,是近些年鞋類市場上興起的一...
船舶工業(yè)是現(xiàn)代綜合性產(chǎn)業(yè),也是軍民結(jié)合的戰(zhàn)略性產(chǎn)業(yè),能夠?yàn)楹Q箝_發(fā)、水上交通運(yùn)輸、能源運(yùn)輸、國防建設(shè)等提供必要...
中國期貨業(yè)協(xié)會最新數(shù)據(jù)顯示,5月全國期貨市場成交量為8.25億手,成交額為50.37萬億元,同比分別增長75.16%和25.60%...
集裝箱租賃是指集裝箱租賃公司與承租人,一般為海運(yùn)班輪公司,鐵路、公路運(yùn)輸公司等,簽訂協(xié)議,用長期或短期的方式把...
中研普華集團(tuán)聯(lián)系方式廣告服務(wù)版權(quán)聲明誠聘英才企業(yè)客戶意見反饋報(bào)告索引網(wǎng)站地圖 Copyright ? 1998-2023 ChinaIRN.COM All Rights Reserved. 版權(quán)所有 中國行業(yè)研究網(wǎng)(簡稱“中研網(wǎng)”) 粵ICP備05036522號
微信掃一掃