特斯拉FSD能否打破自動駕駛的默認偏見?
4月28日,馬斯克閃現(xiàn)北京,同一天特斯拉通過了中國4項數(shù)據(jù)安全合規(guī)要求,成為首家通過此要求的外資車企。業(yè)內分析認為,這是特斯拉掃清數(shù)據(jù)安全障礙的重要標志。
本文引用地址:http://cafeforensic.com/article/202405/459101.htm特斯拉的全自動駕駛(Full Self-Drive , FSD)是輔助駕駛系統(tǒng)Autopilot的升級版,可用于城市公共道路,包括自動停車、自動變道和交通導航。早在四年前特斯拉就推出了FSD軟件,并將其不斷升級至最新的FSD V12版本。但在中國尚無這項功能可用,特斯拉一直尋求在中國提供FSD技術的機會。
特斯拉在中國售出了180萬輛汽車,中國復雜的交通條件中產生的大量數(shù)據(jù),對于特斯拉在中國和全球推廣其FSD技術,都有著重要的戰(zhàn)略意義。
FSD落地中國需要哪些條件?
FSD想要落地中國,包括數(shù)據(jù)采集、數(shù)據(jù)存儲等都需要進行合規(guī)化和本地化。長期以來,數(shù)據(jù)安全問題一直是阻礙特斯拉在中國全面推廣FSD軟件系統(tǒng)的主要障礙。2023年8月特斯拉回應“哨兵模式”時就明確指出已經(jīng)在中國建立數(shù)據(jù)中心,實現(xiàn)數(shù)據(jù)存儲的本地化,所有在中國大陸市場銷售車輛所生產的數(shù)據(jù),都會存儲在中國境內。
有知情人士透露,特斯拉正在考慮在中國建立數(shù)據(jù)中心,以訓練其自動駕駛技術,這是特斯拉的一個重大的戰(zhàn)略轉變。純視覺路線對于圖像的處理更依賴大量數(shù)據(jù)采集和模型訓練,因此特斯拉在美國自建超算中心Dojo并自研D1芯片,以大幅提升FSD訓練效率。特斯拉在中國采集的數(shù)據(jù)只能在本地進行模型訓練,這意味著需要在中國建立類似于Dojo的超算中心,需要一定開發(fā)周期和成本。
此外,據(jù)稱特斯拉還與百度達成了一項協(xié)議,從而能夠使用百度的地圖和導航技術來實現(xiàn)FSD功能。據(jù)了解,海外車企只能通過與中國本土公司合作的方式,才能獲得地圖服務許可證,合法運營自動駕駛功能,這也是智能駕駛系統(tǒng)在中國公共道路上運行的要求。通過使用百度提供的車道級地圖數(shù)據(jù),一方面可以解決特斯拉的測繪資質問題,另一方面也可以加速FSD在中國的落地。
特斯拉FSD與國內自動駕駛方案不同,進入國內市場后,將有利于多種技術方案對標,促進自動駕駛技術提升,如同2018年特斯拉超級工廠項目在上海簽約時,再次發(fā)揮“鯰魚效應”。近年來,比亞迪、理想、蔚來和小鵬等本土競爭對手從技術到成本,全方位加大了與特斯拉的競爭力度,華為也順勢推出了智能駕駛系統(tǒng)。中國先進的ADAS開始在本土以外的國際市場嶄露頭角,這對于中國的自動駕駛技術產業(yè)來說至關重要。
現(xiàn)在正處于自動駕駛商業(yè)化應用的前期階段,預計2030年前后將是自動駕駛逐步走向普及的階段。從當前自動駕駛技術發(fā)展來看,L2級智能駕駛技術(即部分自動化,需要駕駛員主動監(jiān)控道路狀況,隨時準備接管)已實現(xiàn)上車,而真正無需駕駛員介入的完全自動駕駛是5級(L5)。整個行業(yè)離最終「完全自動駕駛」的愿景依然存在一定距離,雖然規(guī)?;逃萌孕钑r日,但現(xiàn)有的落地場景已十分豐富。
什么是FSD?
隨著新能源汽車進入智能化下半場,智能駕駛一直是行業(yè)追逐的技術制高點之一。FSD就是特斯拉研發(fā)的自動化輔助駕駛系統(tǒng)的簡稱,其測試版于2020年推出。該系統(tǒng)的最終目標是實現(xiàn)車輛可在沒有人干預的情況下,自主識別路況、規(guī)劃路線、控制速度和方向,完成從起點到終點的行駛。
今年3月,特斯拉向北美車主推送了最新的FSD V12.3.1版本,是繼V12.1和V12.2在員工內部和小范圍用戶測試后首次大范圍推送。據(jù)悉,當前FSD系統(tǒng)可實現(xiàn)的功能包括自動緊急剎車(AEB)、自動變道和交通導航,還增加了在城市街道的半自主導航以及對交通燈或停車標志做出反應的能力。
市面上最常見的自動駕駛系統(tǒng),大部分仍然采用分模塊的設計,把感知層、決策層以及控制層,分為三個模塊,各個模塊內采用各自的算法模型來完成設計需求。在這其中,AI算法主要是應用在感知模塊中,決策層和控制層面還是常規(guī)的代碼邏輯,依賴基于規(guī)則的判斷,依靠汽車攝像頭識別車道、行人、車輛、標志和交通信號燈等,然后通過工程師們編寫代碼來應對各種情況。
與常見的自動駕駛系統(tǒng)不同的是,特斯拉FSD V12最大的變化在于采用了端對端神經(jīng)網(wǎng)絡技術(End-to-End Neural Network , E2E NN),打開了以往的感知層、決策層以及控制層這三大模塊之間的權限,將“規(guī)則驅動”的算法轉變?yōu)椤皵?shù)據(jù)驅動”的算法。簡單地說,該方案把攝像頭獲取的圖像數(shù)據(jù)輸入到算法后,能直接輸出例如轉向、加速、制動等車輛控制指令,更像是一個人類的大腦,不需要高精地圖以及激光雷達,僅依靠圖像數(shù)據(jù)輸入就能分析并輸出控制策略。
從分模塊設計,到“端到端”,這背后其實是一條技術路線的改變。分模塊設計將自動駕駛任務進行切分,形成多個子任務,每個子任務解決駕駛過程中存在的某些特定問題,比如感知、預測、決策、執(zhí)行,最終進行系統(tǒng)集成完成整個駕駛任務。為了盡可能應對路上遇到的各種情況,特斯拉數(shù)百名工程師寫了30萬行C++代碼用以制定規(guī)則。
但是,任務太多會導致集成困難以及錯誤累加。同時,系統(tǒng)設計時引入了過多的人為經(jīng)驗,但難免缺失部分罕見場景,系統(tǒng)對于陌生的場景如果沒有相應規(guī)則往往無法處理,泛化能力較差。
另一種則是自動駕駛“端到端”方案,省去了感知、預測、規(guī)劃等各項子任務,能夠避免大量重復處理工作,提高計算效率。同時,該方案不需要制定大量的人工規(guī)則,在處理一些非結構化場景(比如缺少車道線與交通規(guī)則的約束)有了很大的提升,應對各種場景的能力顯著提升,大大減少需要人工干預的次數(shù)。是未來最有希望實現(xiàn)無人駕駛的途徑之一,也是大模型對自動駕駛技術發(fā)展產生深度影響的體現(xiàn)。
FSD V12是有史以來第一個端到端AI自動駕駛系統(tǒng),相比之前版本,F(xiàn)SD V12.3版本在城市環(huán)境下的無關鍵接管行駛里程大幅增加,從約100多英里(約合160公里)提升到了386.7英里(約合622公里)。
FSD V12是如何煉成的?
特斯拉FSD V12的體驗顯著提升背后,是其技術路徑逐漸收斂的結果。V12的重大突破在于打通了整個技術棧的最后一環(huán)(決策規(guī)劃),在深度學習算法上的應用,通過高度精細化的數(shù)據(jù)處理流程、多任務學習框架、以及持續(xù)的模型迭代,實現(xiàn)了從數(shù)據(jù)收集、預處理、標注到模型訓練的全鏈條優(yōu)化。
· 多維度視覺感知:FSD借助多攝像頭布局,實現(xiàn)360°全景視覺覆蓋,為車輛提供無死角的視覺信息輸入。
· BEV與Transformer的革新應用:結合BEV技術與Transformer模型,將二維視覺數(shù)據(jù)轉化為高精度的三維空間表示,有效提升環(huán)境建模的精確度與實時性。
· HydraNets(多任務并行處理):通過HydraNets等創(chuàng)新神經(jīng)網(wǎng)絡架構,實現(xiàn)對多種駕駛任務的同時高效處理,增強系統(tǒng)整體效能。
· 自動化數(shù)據(jù)標注與訓練流程:依托自動化標注系統(tǒng)與海量數(shù)據(jù)集,不斷迭代優(yōu)化自動駕駛算法,通過閉環(huán)反饋機制確保模型的持續(xù)進化。
· 仿真技術的深度應用:利用高保真模擬環(huán)境模擬各類駕駛場景,增強算法魯棒性與安全性,為實際道路測試前提供有效的驗證平臺。
首先,通過視覺感知網(wǎng)絡生成三維向量空間,對于僅有唯一解的問題,可直接生成明確的規(guī)控方案,而對于有多個可選方案的復雜問題,使用向量空間和感知網(wǎng)絡提取的中間層特征,訓練神經(jīng)網(wǎng)絡規(guī)劃器,得到軌跡分布;其次,融入成本函數(shù)、人工干預數(shù)據(jù)或其他仿真模擬數(shù)據(jù),獲得最優(yōu)的規(guī)控方案;最終生成轉向、加速等控制指令,由執(zhí)行模塊接受控制指令實現(xiàn)自動駕駛。
盡管特斯拉FSD屬于端到端大模型,但在中國應用時,還是需要補齊國內場景的訓練數(shù)據(jù),主要是交通規(guī)則和交通標識相關的信息,復雜的路口數(shù)據(jù)也需要重新采集標注進行調整,考慮BEV感知方案是否可以得到很好的本地化適配。
端到端對數(shù)據(jù)要求非常高,需要高質量、分布多樣的、海量的訓練數(shù)據(jù)。馬斯克在去年的財報會上曾提到數(shù)據(jù)在自動駕駛方面的重要性,他說:“用100萬個視頻case訓練,勉強夠用;200萬個,稍好一些;300萬個,就會感到Wow;到了1000萬個,就變得難以置信了?!苯刂寥ツ?,特斯拉已經(jīng)分析了從特斯拉客戶的汽車中收集的1000萬個視頻片段(clips),他們判斷完成一個端到端自動駕駛的訓練至少需要100萬個、分布多樣、高質量的clips才能正常工作。
然而對于國內廠商來說,數(shù)據(jù)的采集和提取存在著困難。早年,自動駕駛廠商們往往依賴采集車采集數(shù)據(jù),但是這種數(shù)據(jù)往往低質量、分布有偏,難以進行大規(guī)模端到端訓練。隨著量產車規(guī)?;涞兀瑥S商們又開始轉向采用量產車影子模式采取數(shù)據(jù),但是卻面臨著數(shù)據(jù)有效性和數(shù)據(jù)規(guī)模性平衡的問題。如果采集泛化信息,則有可能面臨大量垃圾數(shù)據(jù)的問題;如果采集策略過于嚴格,則有可能丟失有價值的數(shù)據(jù)。如何定義數(shù)據(jù)質量和處理數(shù)據(jù)同樣也是國內廠商需要解決的難題。
毫不夸張地說,數(shù)據(jù)會占據(jù)端到端自動駕駛開發(fā)中80%以上的研發(fā)成本,當前特斯拉擁有近10萬張A100,位居全球top5,預計到2024年年底會擁有100EFlops的算力。換句話說,只有有足夠資金和資源的頭部企業(yè)和頭部供應商才能搶先一步探索出端到端自動駕駛解法。
端到端的技術沒大規(guī)模普及開來,另外一個核心問題是自動駕駛系統(tǒng)的不可解釋性。例如在模型訓練當中,出現(xiàn)不好的駕駛習慣或者測試時出現(xiàn)系統(tǒng)處理不好的路況下,沒人能解釋清楚問題的根本原因?,F(xiàn)在特斯拉的解決方案,只能是針對性的多喂同類的數(shù)據(jù),例如之前測試中路口停止標識之前是車輛停止的距離路口過遠,就多投喂這類數(shù)據(jù)來進行學習。
在中國,幾乎所有新能源車企都已推出不同級別的輔助駕駛和自動駕駛系統(tǒng),大多數(shù)都實現(xiàn)了高速NOA(Navigate on Autopilot , 自動輔助導航),即允許車輛在高速公路或快速路上實現(xiàn)自主行駛,完成超車、轉彎等動作,而不需要駕駛員親自操作。
而城市道路環(huán)境比高速公路更為復雜多變,城市NOA發(fā)展得相對滯后。不過,也已有一些頭部車企開始布局城市場景,比如蔚來的城市NOA已分布全國606座城市,城市主干路覆蓋率達到90%以上;理想汽車也已覆蓋超過110個城市的城區(qū)道路;而問界和小鵬的高級智駕版能做到不限城市,問界的HUAWEI ADS 2.0高階智駕功能不僅支持城市所有道路、國道,還支持縣道、鄉(xiāng)道、縣鄉(xiāng)等公開道路。這意味著,特斯拉的FSD在中國市場將面臨眾多競爭對手 —— 這種狀況是北美市場所沒有的。
根據(jù)機構基于中國乘用車協(xié)會數(shù)據(jù)的測算,特斯拉在中國汽車市場的份額從2023年第一季度的10.5%大幅縮減至2023年第四季度的6%左右。特斯拉即使在大幅降價的背景下,汽車銷量還是有所減少,毋庸置疑的是,馬斯克非常希望能夠趁早擺脫自2020年以來的首次季度收入同比下降。
同時,激烈的競爭還會影響到FSD的定價策略。由于多數(shù)中國車企沒有開通訂閱付費模式,從買斷價格來看,小鵬XPILOT 3.0售價3.6萬元(購車選配則為2萬元),蔚來NIO Pilot全配包售價3.9萬元,理想、小米以及埃安的部分車型則不額外收取ADAS費用。
相比之下,特斯拉FSD是業(yè)界最貴的,盡管在半個月前已經(jīng)把FSD在北美的買斷價格從1.2萬美元降至8000美元,也同步下調了FSD在北美的訂閱價格,從199美元/月下調到99美元/月,相當于降價一半,但只有購買了EAP(Enhanced Autopilot,增強版自動輔助駕駛)的用戶才能享受這一折扣。
另外值得注意的是,知名特斯拉投資者加里·布萊克對FSD接受率的質疑。根據(jù)信用卡數(shù)據(jù)提供商YipitData提供的數(shù)據(jù),在試用了一個月FSD的美國特斯拉車主中,只有2%的用戶選擇繼續(xù)訂閱該服務,遠低于預期的6%。倘若FSD入華后不得不再次降價,如果按2%的滲透率計算,那FSD的營收是非常有限的。
(本文登于EEPW 2024年第6期)
評論