汽車輔助駕駛已經(jīng)逐漸成為現(xiàn)代汽車的重要組成部分。它不僅能夠提升駕駛的安全性,還能為駕駛員提供更加人性化的駕駛體驗(yàn)。而這一切都離不開感知技術(shù)的支持。那么,汽車輔助駕駛究竟是如何通過(guò)感知技術(shù)來(lái)實(shí)現(xiàn)其功能的呢?
感知方案都有哪些?
蝙蝠通過(guò)超聲波聽聲點(diǎn)位,人類通過(guò)眼睛和耳朵來(lái)感知空間,而在汽車上,則通過(guò)各種傳感器進(jìn)行感知。目前市場(chǎng)主流的組合輔助駕駛主要是V+R+L+U的感知組合,其中R代表毫米波雷達(dá),V代表攝像頭,L代表激光雷達(dá),U代表超聲波雷達(dá),此外,車內(nèi)的車載駕駛員監(jiān)控(DMS)也算作一個(gè)攝像頭。
舉例來(lái)說(shuō),以比亞迪的天神之眼C為例,其配備了5個(gè)毫米波雷達(dá)與12個(gè)攝像頭,包括3顆800萬(wàn)前視攝像頭、4顆300萬(wàn)環(huán)視攝像頭、4顆300萬(wàn)側(cè)視攝像頭、1顆300萬(wàn)后視攝像頭,也就是5R12V感知方案。
V+R+L+U們看到的世界是什么樣的?
以奔馳為例,其前視采用雙目攝像頭。雙目攝像頭通過(guò)兩個(gè)攝像頭同時(shí)感知前方物體,并利用視差算法計(jì)算物體距離,從而實(shí)現(xiàn)較為精準(zhǔn)的測(cè)距功能。
視差算法有一個(gè)特點(diǎn),就是左右兩個(gè)攝像頭的距離越遠(yuǎn),測(cè)距能力越遠(yuǎn)。但由于汽車內(nèi)部空間有限,攝像頭普遍集成在風(fēng)擋玻璃后視鏡的位置,2個(gè)攝像頭之間的距離一般為十幾厘米,導(dǎo)致其探測(cè)距離略顯不足。
而比亞迪、小鵬等公司,則在雙目的基礎(chǔ)上,又加上了一個(gè)長(zhǎng)焦,有了三目攝像頭。以比亞迪代表性的三目前視攝像頭為例,其三目攝像頭包括兩個(gè)用于視差算法的雙目攝像頭和一個(gè)長(zhǎng)焦鏡頭。其中2個(gè)廣角攝像頭探測(cè)角度為120度,800萬(wàn)像素,1個(gè)長(zhǎng)焦攝像頭探測(cè)角度為30度,800萬(wàn)像素。其中,長(zhǎng)焦鏡頭主要用于識(shí)別遠(yuǎn)處的小物體,如紅綠燈等;雙目攝像頭通過(guò)視差算法測(cè)距,系統(tǒng)可以精確計(jì)算前方物體的距離。通過(guò)雙目視差算法可以獲得稠密點(diǎn)云,可以清晰地感知到路面的起伏和坑洼,如主動(dòng)懸架的預(yù)瞄等。
根據(jù)比亞迪提供的資料,在三目方案下最高探測(cè)距離達(dá)到350米,實(shí)現(xiàn)1cm的物體探測(cè)精度,甚至可以對(duì)路面進(jìn)行預(yù)瞄,識(shí)別路面上的減速帶、凹陷等,提前讓車輛減速通過(guò)。
同時(shí)在現(xiàn)有技術(shù)的支撐下,多個(gè)攝像頭的設(shè)計(jì)也能支持系統(tǒng)同時(shí)運(yùn)行多種算法。如其中一個(gè)攝像頭運(yùn)行AI算法,識(shí)別特定類型的障礙物,如車輛、行人和自行車、車道線等。長(zhǎng)焦鏡頭用于遠(yuǎn)距離物體識(shí)別,如AEB、ACC、紅綠燈,從而提高系統(tǒng)的識(shí)別范圍和準(zhǔn)確性,滿足當(dāng)下城市輔助駕駛的要求。
說(shuō)到算法,不得不提到BEV和Occupancy。BEV是Bird’s Eye View的縮寫,即鳥瞰視角技術(shù)。BEV將多個(gè)攝像頭拍攝的圖像拼接成一個(gè)全景圖像的技術(shù)。根據(jù)傳感器不同,可以分為BEV LiDAR點(diǎn)云類,還有BEV Camera圖像類,還有BEV Fusion融合類。
BEV鳥瞰圖
舉例來(lái)說(shuō),通過(guò)多個(gè)攝像頭采集圖像后融合,系統(tǒng)將采集圖像通過(guò)矯正后,統(tǒng)一輸入到神經(jīng)網(wǎng)絡(luò)來(lái)提取特征,然后通過(guò)注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)模型transformer將這些特征進(jìn)行關(guān)聯(lián),之后再投影到一個(gè)向量空間之中,最終拿到一張反映周圍環(huán)境的鳥瞰圖。這種算法可以幫助系統(tǒng)識(shí)別障礙物并確定可行駛區(qū)域,但BEV感知無(wú)法預(yù)測(cè)懸垂的障礙物,如開啟的車門,限高的欄桿等,這個(gè)時(shí)候就要請(qǐng)出Occupancy占用網(wǎng)絡(luò)了。
Occupancy占用網(wǎng)絡(luò)圖
BEV算法所采集的圖像輸出為2D,而Occupancy占用網(wǎng)絡(luò)將其升維為3D,這有點(diǎn)像俄羅斯方塊,占用網(wǎng)絡(luò)就是將世界網(wǎng)格化,定義哪個(gè)單元被占用,哪個(gè)單元是空閑的。
占據(jù)網(wǎng)絡(luò)算法通過(guò)分析前方物體的形狀和位置,判斷哪些區(qū)域是可以安全行駛的,哪些區(qū)域存在潛在的障礙物。只要空閑的單位格沒被占用,那么就可以通行,汽車識(shí)別能力大幅提升。這種功能對(duì)于城市駕駛尤為重要,因?yàn)樵诔鞘协h(huán)境中,車輛需要頻繁應(yīng)對(duì)復(fù)雜的道路狀況和多變的障礙物。
但中國(guó)道路環(huán)境和路況更加復(fù)雜,單純依靠視覺感知,還存在一些不足。于是,激光雷達(dá)就成了當(dāng)前行業(yè)較為主流的感知方案。
激光雷達(dá)通過(guò)激光束掃描構(gòu)建環(huán)境點(diǎn)云圖,線數(shù)越多,垂直分辨率越高。以目前主流的192線雷達(dá)為例,其點(diǎn)云圖可清晰分辨200米外車輛輪廓,但對(duì)體積更小的異物,如倒伏在道路中央的輪胎、錐桶等,在200米遠(yuǎn)時(shí)僅能模糊識(shí)別為異物,需要在100米,乃至50米時(shí)才能較為清楚地分辨出其輪廓。
雖然ADAS攝像頭能夠提供更豐富的視覺信息,但在不同光照條件和物體材質(zhì)的情況下,攝像頭的測(cè)距精度和識(shí)別能力明顯不如激光雷達(dá)。測(cè)距不準(zhǔn),意味著下降較低。
而激光雷達(dá)能夠?qū)崟r(shí)獲取三維點(diǎn)云數(shù)據(jù),并快速構(gòu)建出環(huán)境的三維模型。讓車輛能夠快速全面了解周圍的道路、障礙物和其他車輛的位置和運(yùn)動(dòng)狀態(tài),為決策系統(tǒng)提供豐富的信息。簡(jiǎn)單來(lái)說(shuō),激光雷達(dá)不會(huì)被表面圖案欺騙,它只關(guān)心是否存在障礙物。(朋月)