雖然對端到端成為今年霸榜營銷熱詞有強烈的預感,但還是沒有料到各大廠家會在宣傳上加那么大杠桿。
說起來,端到端絕對不是上下嘴皮子一翻就能實現(xiàn)的,而是需要滿足很多前置條件。
01
胖子不是一天吃成的,端到端也不是一天實現(xiàn)的。
要實現(xiàn)終極的一段式端到端,需要經(jīng)歷四大階段。
對這四個階段的闡述,根據(jù)自家算法的發(fā)展史,不同的玩家會有不同的觀點。
從地平線的自動駕駛算法架構迭代歷程來看:
第一階段,實現(xiàn)感知層神經(jīng)網(wǎng)絡化,決策規(guī)劃層基于規(guī)則+算法實現(xiàn)。
第二階段,實現(xiàn)決策規(guī)劃層神經(jīng)網(wǎng)絡化,將決策規(guī)劃的規(guī)則驅動進化為數(shù)據(jù)驅動。
第三階段,以基于Transformer的BEV大模型替代神經(jīng)網(wǎng)絡化感知層中的多個小模型,實現(xiàn)感知的端到端。
同樣基于Transformer將神經(jīng)網(wǎng)絡化的決策規(guī)劃層進化為端到端規(guī)劃,端到端感知和端到端規(guī)劃之間傳遞特征級信息,實現(xiàn)分段式端到端。
在這里有必要提一點,神經(jīng)網(wǎng)絡化并不等同于端到端,它是端到端的必要條件而非充分條件。
第四階段,消除端到端感知和端到端決策規(guī)劃的界限,實現(xiàn)全程可導,進化為一段式端到端。
雖然各家的劃分方式有些微的不同,但萬變不離其宗。
相較傳統(tǒng)的分模塊方案,端到端的核心改變在于決策規(guī)劃層面。
——即原來基于人工編碼實現(xiàn)、規(guī)則驅動的決策規(guī)劃轉向了基于神經(jīng)網(wǎng)絡學習實現(xiàn)、數(shù)據(jù)驅動的決策規(guī)劃。
特斯拉能夠在2022年底一下子轉向端到端,就是因為它率先實現(xiàn)了決策規(guī)劃層的神經(jīng)網(wǎng)絡化,做足了轉型的預熱。
彼時,國內智駕頭部玩家依然對將神經(jīng)網(wǎng)絡全面用于安全要求極高的決策規(guī)則持懷疑態(tài)度。
雖然也在探索在規(guī)劃層使用深度學習算法,但轉型并不堅決,依然以規(guī)則為主。
由規(guī)則編碼轉向神經(jīng)網(wǎng)絡是一個頗為浩大的工程,需要消耗一定的時間。
基于此,奇瑞自動駕駛負責人谷俊麗才說國內廠商落后特斯拉1.5-2年。
看到這里,大家就不會再噴谷俊麗了吧?
02
國外的月亮不一定比國內圓,但是外來的和尚有時候就是會念經(jīng)。
由于引領自動駕駛技術路線向端到端范式轉變,特斯拉在自動駕駛領域的聲望達到了頂峰。
特斯拉和端到端范式之所以被大家夸成了一朵花,主要是因為規(guī)則驅動的分模塊方案無法高效地收斂層出不窮的長尾場景。
——在基于規(guī)則實現(xiàn)的系統(tǒng)中,要解決的場景越多,要編寫的代碼就越多,就越難以開發(fā)、測試和維護。
而且,自動駕駛系統(tǒng)性能迭代的進程是不斷覆蓋各種長尾場景的過程,在規(guī)則驅動的范式下,解決了新的長尾,又有可能會激活老的長尾。
系統(tǒng)進三步,退兩步,還怎么邁向全無人駕駛的珠穆朗瑪呢?
端到端范式依靠數(shù)據(jù)驅動解決了“吾生也有涯,而長尾場景無涯”的問題。
依靠深度學習神經(jīng)網(wǎng)絡的記憶能力解決了“按下葫蘆浮起瓢”的問題。
無論是海量數(shù)據(jù)驅動還是具備長期記憶能力的深度學習,背后都特別考驗數(shù)據(jù)采集、處理、標注、模型訓練、模型驗證評估、OTA部署這一條數(shù)據(jù)閉環(huán)。
這也意味著,只有那些早早布局數(shù)據(jù)閉環(huán)建設的智駕廠商才能在當下的端到端初期階段吃到最大紅利。
在這波端到端范式火起來之前,華為、特斯拉、小鵬、蔚來、Momenta這些頭部智駕廠商的感知層大都實現(xiàn)了端到端,即實現(xiàn)了動態(tài)BEV網(wǎng)絡、靜態(tài)BEV網(wǎng)絡和占用網(wǎng)絡的三網(wǎng)合一。
所缺者,唯規(guī)劃層的神經(jīng)網(wǎng)絡化,實現(xiàn)端到端感知的過程離不開自動化程度不斷提升的數(shù)據(jù)閉環(huán)。
所以,這些頭部智駕廠商的端到端宣傳還是比較靠譜的。
至于某些兩年前才開始布局自動駕駛業(yè)務的新勢力車企,無論是智駕數(shù)據(jù)的積累還是數(shù)據(jù)閉環(huán)的建設都處于初期階段,其自動駕駛第一陣營的宣傳和端到端大模型的宣傳都頗為存疑。
03
或許是因為競爭太激烈的緣故,國內車企在自動駕駛領域的宣傳特別離譜,個個都要在年內實現(xiàn)全國都能開,家家都是第一梯隊。
具體到端到端上面,盡管需要那么多的前提條件,各家還是不甘落后地紛紛“推出”了真假難辨的端到端方案。
不過,在這些挑撥人們的神經(jīng)的宣傳面前,大家一定要擦亮眼,冷靜地意識到,絕大部分廠商的端到端方案尚處于初級階段,還需要經(jīng)過較長一段時間的雕琢。
小鵬汽車8月底小鵬Mona 03上市發(fā)布會上提出了端到端四部曲:
第一步,實現(xiàn)三網(wǎng)合一,端到端量產;
第二步,車端大模型參數(shù)量翻倍;
第三步,云端大模型參數(shù)量提升5倍;
第四步,解決99%極端問題。
第一步里的三網(wǎng)合一不同于端到端感知中的動態(tài)BEV網(wǎng)絡、靜態(tài)BEV網(wǎng)絡、占用網(wǎng)絡的三網(wǎng)合一。
是特指將分段式端到端方案中的大語言模型XBrain、端到端感知大模型XNet、端到端規(guī)劃大模型XPlanner合并成一張大網(wǎng),實現(xiàn)一段式端到端方案。
從時間線上來看,小鵬5月20號AI Day上宣布量產上車的端到端方案并非OneModel端到端。
第二步里的車端大模型參數(shù)量翻倍,是指將一段式端到端方案中的許多小模型合并成少數(shù)幾個大模型,通過計算資源的集約,在硬件算力、存儲資源都不變的情況下提升大模型的參數(shù)規(guī)模。
換句話說,從24年Q3到24年底之間,小鵬汽車的一段式端到端大模型中依然存在不少小模型和中模型。
小模型的說法來自小鵬自動駕駛負責人李力耘,他的表態(tài)一方面揭露了半年前的小鵬端到端大模型“即非端到端,是名端到端”的實際。
一方面也表明,很多車企只不過是在車端把各種小模型堆疊在了一起,揉成了一個四不像的“端到端”。
在2024年的電動汽車百人會上,長城汽車旗下自動駕駛算法公司毫末智行CEO顧維灝發(fā)表了一個觀點:國內車企向端到端范式的轉變需要經(jīng)歷幾年的時間。
顧維灝說的端范式應該指的是技術成熟階段,現(xiàn)在端到端還處在初級階段,乾坤未定,你我皆黑馬。
這也是傳統(tǒng)大廠難得的智駕窗口期,快人一小步,就能領先一大截。
是新勢力更快,還是老法師更快,讓子彈飛一會,我們一定會有答案。