算法：“BEV+Transformer”引領(lǐng)自動駕駛感知范式

陳博 2023年10月31日 來源：中研網(wǎng) 1014 64
繁體

BEV全稱Bird'sEyeView，即鳥瞰圖，該算法旨在將多傳感器收集的圖像信息投射至統(tǒng)一3D空間，再輸入至單一大模型進(jìn)行整體推理。相較于傳統(tǒng)的攝像頭圖像，BEV提供了一個(gè)更貼近實(shí)際物理世界的統(tǒng)一空間，為后續(xù)的多傳感器融合以及規(guī)劃控制模塊開發(fā)提供了更大的便利和更多的可B

大模型是當(dāng)前AI領(lǐng)域最為火熱的前沿趨勢之一，可賦能自動駕駛領(lǐng)域的感知、標(biāo)注、仿真訓(xùn)練等多個(gè)核心環(huán)節(jié)。在感知層，以特斯拉為首，"BEV+Transformer"范式已開始在自動駕駛領(lǐng)域得到廣泛使用，可有效提升感知精確度，利于后續(xù)規(guī)劃控制算法的實(shí)施，促進(jìn)端到端自動駕駛框架的發(fā)展。

BEV全稱Bird'sEyeView，即鳥瞰圖，該算法旨在將多傳感器收集的圖像信息投射至統(tǒng)一3D空間，再輸入至單一大模型進(jìn)行整體推理。相較于傳統(tǒng)的攝像頭圖像，BEV提供了一個(gè)更貼近實(shí)際物理世界的統(tǒng)一空間，為后續(xù)的多傳感器融合以及規(guī)劃控制模塊開發(fā)提供了更大的便利和更多的可能。具體來說，BEV感知的優(yōu)勢在于：1)統(tǒng)一了多模態(tài)數(shù)據(jù)處理維度，將多個(gè)攝像頭或雷達(dá)數(shù)據(jù)轉(zhuǎn)換至3D視角，再做目標(biāo)檢測與分割等任務(wù)，從而降低感知誤差，并為下游預(yù)測和規(guī)劃控制模塊提供更豐富的輸出;2)實(shí)現(xiàn)時(shí)序信息融合，BEV下的3D視角相較于2D信息可有效減少尺度和遮擋問題，甚至可通過先驗(yàn)知識"腦補(bǔ)"被遮擋的物體，有效提高自動駕駛安全性;3)感知和預(yù)測可在統(tǒng)一3D空間中實(shí)施，通過神經(jīng)網(wǎng)絡(luò)直接完成端到端優(yōu)化，可有效降低傳統(tǒng)感知任務(wù)中感知與預(yù)測串行的誤差累積。

Transformer的注意力(Attention)機(jī)制可幫助實(shí)現(xiàn)2D圖像數(shù)據(jù)至3DBEV空間的轉(zhuǎn)化。Transformer是GoogleBrian團(tuán)隊(duì)在2017年提出的神經(jīng)網(wǎng)絡(luò)模型，起初用于機(jī)器翻譯，隨著技術(shù)的發(fā)展開始進(jìn)軍圖像視覺領(lǐng)域，目前已成功涉足分類、檢測和分割三大圖像問題。據(jù)汽車之心微信公眾號介紹，傳統(tǒng)CNN模型的原理是通過卷積層構(gòu)造廣義過濾器，從而對圖像中的元素進(jìn)行不斷地篩選壓縮，因此其感受域一定程度上取決于過濾器的大小和卷積層的數(shù)量。隨著訓(xùn)練數(shù)據(jù)量的增長，CNN模型的收益會呈現(xiàn)過飽和趨勢。而Transformer的網(wǎng)絡(luò)結(jié)構(gòu)在嫁接2D圖像和3D空間時(shí)借鑒了人腦的注意力(Attention)機(jī)制，在處理大量信息時(shí)能夠只選擇處理關(guān)鍵信息，以提升神經(jīng)網(wǎng)絡(luò)的效率，因此Transformer的飽和區(qū)間很大，更適宜于大規(guī)模數(shù)據(jù)訓(xùn)練的需求。在自動駕駛領(lǐng)域，Transformer相比于傳統(tǒng)CNN，具備更強(qiáng)的序列建模能力和全局信息感知能力，目前已廣泛用于視覺2D圖像數(shù)據(jù)至3D空間的轉(zhuǎn)化。

除感知層外，大模型還有望顯著提升后端訓(xùn)練中數(shù)據(jù)清洗標(biāo)注的效率，并助力生成新場景以賦能仿真訓(xùn)練。訓(xùn)練模型在收集到傳感器傳送回的圖像數(shù)據(jù)后，需先對數(shù)據(jù)進(jìn)行清洗，再對其中的車輛、行人、道路標(biāo)識、車道線等元素進(jìn)行標(biāo)注。相較于此前的人工標(biāo)注，大模型可以大幅提升工作效率。理想汽車創(chuàng)始人李想在中國電動汽車百人會論壇(2023)的演講中表示，此前理想一年要做大概1000萬幀自動駕駛圖像的人工標(biāo)定，年成本接近1億元，但使用軟件2.0大模型進(jìn)行自動化標(biāo)定后，效率是人的1000倍。毫末智行也2023年4月第八屆AIDAY上表示，其最新推出的DriveGPT可將交通場景圖像的標(biāo)注費(fèi)用從行業(yè)平均約5元/張降至約0.5元/張。Meta最新的圖像分割模型SAM(SegmentAnythingModel)在對圖像和視頻中的物體進(jìn)行識別分割時(shí)展現(xiàn)出了強(qiáng)大的能力，且具有零樣本性能，即能夠?qū)奈从?xùn)練過的圖片進(jìn)行精準(zhǔn)分割，未來也有望賦能自動駕駛訓(xùn)練所需的圖像數(shù)據(jù)積累。

在"BEV+Transformer"趨勢下，算法復(fù)雜度、數(shù)據(jù)規(guī)模以及模型參數(shù)均呈指數(shù)級提升，推動自動駕駛芯片向著大算力、新架構(gòu)以及存算一體等方向演進(jìn)。

1、大算力：

向數(shù)百TOPS算力演進(jìn)。傳統(tǒng)L1/L2輔助駕駛所需處理的數(shù)據(jù)量小且算法模型相對簡單，因此以Mobileye為代表的單目視覺+芯片算法強(qiáng)耦合的一體機(jī)方案即可滿足需求。但領(lǐng)航功能作為高階輔助駕駛的代表，需要"更強(qiáng)算力+軟硬件解耦的芯片+域控制器"來滿足海量數(shù)據(jù)處理與后續(xù)持續(xù)OTA迭代的需求。高速領(lǐng)航開始向20萬以下車型滲透，15-30TOPS可滿足基本需求，但若想要"好用"或需要30-80TOPS。城區(qū)領(lǐng)航的場景復(fù)雜程度和技術(shù)實(shí)現(xiàn)難度更高，目前普遍需要搭載激光雷達(dá)，芯片以英偉達(dá)Orin、華為MDC和地平線J5為主，算力配置普遍超200TOPS。而在應(yīng)用"BEV+Transformer"技術(shù)后，多傳感器前融合以及2D至3D空間的轉(zhuǎn)化需要AI芯片具備更強(qiáng)的推理能力，因此也需要比以往更大的算力支撐，包括更高的AI算力、CPU算力和GPU算力。

2、新架構(gòu)：

加強(qiáng)并行計(jì)算能力和浮點(diǎn)運(yùn)算能力。相較于CNN/RNN，Transformer具有更強(qiáng)的并行計(jì)算能力，可加入時(shí)間序列矢量，其數(shù)據(jù)流特征有顯著差別，浮點(diǎn)矢量矩陣乘法累加運(yùn)算更適合采用BF16精度。Transformer允許數(shù)據(jù)以并行的形式進(jìn)行計(jì)算，且保留了數(shù)據(jù)的全局視角，而CNN/RNN的數(shù)據(jù)流只能以串行方式計(jì)算，不具備數(shù)據(jù)的全局記憶能力。傳統(tǒng)AI推理專用芯片大多針對CNN/RNN，并行計(jì)算表現(xiàn)不佳，且普遍針對INT8精度，幾乎不考慮浮點(diǎn)運(yùn)算。因此想要更好適配Transformer算法，就需要將AI推理芯片從硬件層面進(jìn)行完整的架構(gòu)革新，加入專門針對Transformer的加速器，或使用更強(qiáng)的CPU算力來對數(shù)據(jù)整形，這對芯片架構(gòu)、ASIC研發(fā)能力，以及成本控制都提出了更高的要求。以特斯拉、地平線為代表的廠商均"重ASIC(即AI推理專用芯片)，輕GPU"。特斯拉引領(lǐng)BEV+Transformer路線，以專用NPU(神經(jīng)網(wǎng)絡(luò)處理器)承擔(dān)AI運(yùn)算，在NPU設(shè)計(jì)之初便進(jìn)行了針對性優(yōu)化。而地平線等后來者或需要在下一代芯片中對AI推理芯片架構(gòu)進(jìn)行針對性優(yōu)化。

3、存算一體：

SoC芯片需配置高帶寬存儲器(HBM)或SRAM，并加速向存算一體靠攏，解決大算力下的數(shù)據(jù)吞吐量瓶頸。模型越大，內(nèi)存對AI加速器就越重要，以頻繁地讀取權(quán)重矩陣或訓(xùn)練好的模型參數(shù)。據(jù)佐思汽研介紹，Transformer中的權(quán)重模型超過1GB，對比傳統(tǒng)CNN的權(quán)重模型通常不超過20MB。模型參數(shù)越大，就需要更高的帶寬，一次性讀出更多參數(shù)。存算一體可分為近存計(jì)算(PNM)、存內(nèi)處理(PIM)以及存內(nèi)計(jì)算(CIM)，存內(nèi)計(jì)算則接近存算一體，當(dāng)前PNM已廣泛用于高性能芯片，即采用HBM堆疊，2.5D封裝，從而與CPU集成，而PIM和CIM仍處在發(fā)展中。以特斯拉FSDSoC為例，其采用總帶寬為68GB/s的8顆LPDDR4內(nèi)存，而集成在NPU中的SRAM可達(dá)到32MBL3緩存，帶寬達(dá)2TB/s，遠(yuǎn)超市面上同類芯片。而據(jù)汽車之心微信公眾號，特斯拉在最新HW4.0上的二代FSDSoC上使用了16顆GDDR6，在內(nèi)存用料上繼續(xù)引領(lǐng)行業(yè)。

欲了解更多中國智能駕駛行業(yè)的未來發(fā)展前景，可以點(diǎn)擊查看中研普華產(chǎn)業(yè)院研究報(bào)告《2023-2028年中國智能駕駛行業(yè)市場深度全景調(diào)研及投資前景分析報(bào)告》。

關(guān)注公眾號

免費(fèi)獲取更多報(bào)告節(jié)選

免費(fèi)咨詢行業(yè)專家

相關(guān)深度報(bào)告REPORTS

2023-2028年中國智能駕駛行業(yè)深度分析及投資前景預(yù)測報(bào)告

智能駕駛即利用人工智能、視覺計(jì)算、雷達(dá)、監(jiān)控裝置和全球定位系統(tǒng)協(xié)同合作，讓汽車能夠部分或全面感知周圍環(huán)境并進(jìn)行自動安全地駕駛，有效彌補(bǔ)了人類駕駛員存在的缺陷。國際汽車工程師協(xié)會把汽...

查看詳情

產(chǎn)業(yè)規(guī)劃 特色小鎮(zhèn) 產(chǎn)業(yè)園區(qū)規(guī)劃 產(chǎn)業(yè)地產(chǎn) 可研報(bào)告 商業(yè)計(jì)劃書 細(xì)分市場研究 IPO上市咨詢

智能駕駛

延伸閱讀

1如何應(yīng)對2020年新形勢下中國智能駕駛行業(yè)的變化與挑戰(zhàn)！1258

2中國經(jīng)濟(jì)基本面穩(wěn)定，但動力和質(zhì)量較為不足，5G智能駕駛行業(yè)發(fā)展如何受限？972

3經(jīng)濟(jì)數(shù)字化趨勢突出，汽車維修行業(yè)如何借力發(fā)力，企業(yè)如何邁出更大一步？772

4技術(shù)升級提升競爭力，行業(yè)轉(zhuǎn)型增強(qiáng)優(yōu)勢，鐵路器材行業(yè)企業(yè)如何選擇？572

5投資與產(chǎn)出不成正比，鐵路器材企業(yè)如何做出正確的投資規(guī)劃和戰(zhàn)略選擇？386

6行業(yè)集中度在不斷提升，不進(jìn)則退。汽車內(nèi)飾情報(bào)分析把握有力發(fā)展方向！272

算力市場研究報(bào)告分析：我國算力產(chǎn)業(yè)的發(fā)展情況

我國算力產(chǎn)業(yè)的發(fā)展情況近期，工業(yè)和信息化部聯(lián)合有關(guān)部門印發(fā)了《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計(jì)劃》，大家都很關(guān)注，...

2023消費(fèi)電子行業(yè)發(fā)展分析消費(fèi)電子產(chǎn)業(yè)鏈業(yè)績逐季改善

消費(fèi)電子一般指消費(fèi)電子產(chǎn)品，是指圍繞著消費(fèi)者應(yīng)用而設(shè)計(jì)的與生活、工作娛樂息息相關(guān)的電子類產(chǎn)品，最終實(shí)現(xiàn)消費(fèi)者自...

中老年鞋行業(yè)市場現(xiàn)狀及未來前景預(yù)測分析

作為鞋類市場近些年興起的一個(gè)細(xì)分領(lǐng)域，老人鞋一直呈快速發(fā)展態(tài)勢。老人鞋，也叫老年鞋，是近些年鞋類市場上興起的一...

2023造船行業(yè)發(fā)展?fàn)顩r：三季度中國造船產(chǎn)能利用監(jiān)測指數(shù)同比增長超兩成

船舶工業(yè)是現(xiàn)代綜合性產(chǎn)業(yè)，也是軍民結(jié)合的戰(zhàn)略性產(chǎn)業(yè)，能夠?yàn)楹Ｑ箝_發(fā)、水上交通運(yùn)輸、能源運(yùn)輸、國防建設(shè)等提供必要...

我國期貨行業(yè)的發(fā)展態(tài)勢國內(nèi)150家期貨公司總資產(chǎn)1.7萬億元

中國期貨業(yè)協(xié)會最新數(shù)據(jù)顯示，5月全國期貨市場成交量為8.25億手，成交額為50.37萬億元，同比分別增長75.16%和25.60%...

中國集裝箱租賃行業(yè)市場分析：總體租箱需求將持續(xù)增長

集裝箱租賃是指集裝箱租賃公司與承租人，一般為海運(yùn)班輪公司，鐵路、公路運(yùn)輸公司等，簽訂協(xié)議，用長期或短期的方式把...

猜您喜歡

【版權(quán)及免責(zé)聲明】凡注明"轉(zhuǎn)載來源"的作品，均轉(zhuǎn)載自其它媒體，轉(zhuǎn)載目的在于傳遞更多的信息，并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。中研網(wǎng)倡導(dǎo)尊重與保護(hù)知識產(chǎn)權(quán)，如發(fā)現(xiàn)本站文章存在內(nèi)容、版權(quán)或其它問題，煩請聯(lián)系。聯(lián)系方式：jsb@chinairn.com、0755-23619058，我們將及時(shí)溝通與處理。

国产大屁股av在线播放_国语自产精品视频_嘿咻在线视频精品免费_日韩大片观看网址

算法：“BEV+Transformer”引領(lǐng)自動駕駛感知范式

相關(guān)深度報(bào)告REPORTS