回顧剛剛過去的4月上海車展,自動駕駛收獲了前所未有的關注度。
華為、百度、滴滴、大疆等一眾科技企業紛紛秀出看家本事,我們仿佛能看到,自動駕駛正從苦心孤詣默默前行的人工智能技術工程領域出圈進入大眾視野,這不由令人想到100多年前世界上第一輛內燃機車轟動巴黎世博會的歷史性場景。
站在當下的時間節點,快速掌握自動駕駛制勝之道,無疑對這個行業有著重要和深遠的意義。
科技巨頭高質量數據,中國玩家的“秘密武器
細看車展期間眾多科技企業在自動駕駛上的強調重心,你或許會發現,相比過去幾年對車聯網、車載操作系統、智能座艙的關注,今年車展上科技企業們開始強調落地、規模、量產,以及最關鍵的——系統適應中國復雜路況的能力。
一方面,適應中國路況是「自動駕駛中國隊」相比以特斯拉、谷歌Waymo為代表的硅谷陣營的巨大優勢所在。
另一方面,跑通復雜路況的背后,是對高質量數據的獲取能力驗證。
自動駕駛汽車本質即一套大型、通用、移動屬性的人工智能,而當前人工智能所依靠的底層理論是基于人工神經網絡的深度學習技術。
2012年,多倫多大學的研究生阿萊克斯·克里澤夫斯基和教授杰弗里·辛頓提出深度學習網絡,以大量標注數據集為基礎,讓人工神經網絡自主學習更深層、包含更豐富語義的信息,達到更精確的識別效果。
這個過程可以簡單理解為輔導小朋友寫作業,從不會寫到會寫,靠的是大腦的算法能力,而深度學習解決的就是算法問題,其所采用的聰明的算法模型,不僅能學會,而且學得很快。
再比如抖音、淘寶、拼多多、美團等各大互聯網平臺的「猜你喜歡」,通過對用戶瀏覽行為數據的大量收集和歸納,形成一套懂我們的算法模型,繼而套用模型預測更多用戶可能感興趣的商品。
自動駕駛汽車同樣需要通過深度學習技術,自主識別自身當前所處交通場景下的各式物體,并基于環境數據形成有預測能力的算法模型,指導分析決策。
具體來說,可以把自動駕駛拆解為感知、決策和執行。其中感知(即人類駕駛員的“眼睛”)和決策(即人類駕駛員的“大腦”)為兩個核心步驟。
對于機器智能來說,“看到”這一動作背后的本質是識別,而想讓自動駕駛感知系統的整體識別率足夠精準,就需要借助不同傳感器的優勢組合,對大量物體的多維數據如圖像、視頻、3D點云圖等進行融合感知。完成了對周邊物體的精準融合感知,下一步便交由自動駕駛大腦進行分析和決策。
從行業整體發展階段來看,目前多數自動駕駛系統在普通場景下的決策表現已經相當完善了,主要難點在于對各式罕見路況下Corner Case(長尾場景)的及時響應能力。
在技術不出現質變的情況下,處理好Corner Case就是未來自動駕駛落地的臨門一腳,也是最主要的難題。
這一腳球,靠的就是高質量數據。
所謂高質量數據,就是只有在極其復雜路況、極端天氣、有地域特色的特殊駕駛習慣、特殊路況標識等罕見長尾場景中才能收集到的數據。
從感知到決策,自動駕駛需要大量真實交通場景下的多維、長尾數據喂養,高質量數據的獲取速度和規模很大程度上決定了自動駕駛技術落地的時間表和商業化體量。
而中國恰好擁有全球最大的汽車銷量規模、最長道路里程數、最豐富駕駛習慣,能夠獲取海量高質量數據訓練自動駕駛AI。
不難推斷,高質量數據將成為中國玩家在這場自動駕駛攻堅之戰中看不見的制勝「秘密武器」。
而制約高質量數據獲取的最大問題在于成本,時間成本和資金成本。
時間方面,美國一家科技智庫曾經發布報告,一套自動駕駛系統至少需要經過至少170億公里驗證才能達到量產條件,如果組建一支100輛測試車隊,以40公里時速24小時不停跑,要500年時間。
資金方面,相比幾年前,自動駕駛硬件成本最高的激光雷達已經壓到了十萬以內的區間,但依然沒有突破當前汽車市場上最跑量的A級車價格區間。這種成本基數下,想要覆蓋從哈爾濱到海南的真實數據,資金投入是難以想象的。
數據驅動,自動駕駛進入認知智能時代
以上,我們探討的只是高質量數據的獲取環節。
從海量高質量數據獲取到系統真正上路應用,還要將數據轉化為可識別路面上各種對象,并對實時變化周邊環境進行推理和推斷的算法模型。
早在二千多年前莊子就曾慨嘆「以有涯隨無涯,殆已」,極端場景同樣無法窮舉,這就需要推測和預測。
回想我們開車從新手到老司機的過程,我們也不需要跑遍所有道路,而是通過大腦本身的學習和推理能力,就能處理之前沒有見過的路況。
這套學習和推理能力,是人類大腦超越初級機器智能的底層原因。
回到自動駕駛的應用層面。
一套具備高商業化價值的高級別自動駕駛系統,必然是一套具有高通用性的系統,能夠快速“上車” 大多數車型,且其算法模型的學習和推理能力覆蓋盡可能多地域場景的「認知智能」。
這里的“認知智能”,要求該自動駕駛系統“能理解、會思考、善預測”,擁有處理復雜場景和情形的能力,像人類駕駛員一樣具備比較好的“預測能力”。作為人類駕駛員,我們面臨的道路競爭目標雖然很多,但因為每天看多了,基本可以判斷什么樣的路口會突然躥出行人、哪些非機動車可能違規(如外賣小哥會突然超車)等。建立在人類高層認知基礎上,通過預測,我們會把注意力放在容易出問題的方向和距離上進行觀察,以保證在很高的水平上安全通過。
同理,機器自動駕駛的道理也一樣。機器學習的目的,就是在訓練數據集中學習到一個最優模型,并且這個最優模型對未知數據有很好的預測能力(即模型具有很好的泛化能力),從而實現感知智能到認知智能的關鍵突破。
由此可見,認知智能對于數據規模、獲取成本、數據質量,以及對系統數據處理能力要求很高,能夠用更快速度收集到大量真實數據,并有能力快速將數據用于算法訓練玩家,就能夠獲得持續的領先優勢。可以說,「認知智能」是自動駕駛終局實現的基礎。
自動駕駛的“最后一公里”
隨著量產自動駕駛系統批量落地和迭代,自動駕駛行業已經進入深水區,誰先搶占數據高地,突破corner case的高質量數據獲取和認知智能束縛,誰就有機會最先站上自動駕駛的制高點。
而立足中國這一訓練認知智能的最佳訓練土壤,先行用風車戰略打通高質量數據獲取和認知智能落地閉環的毫末智行,必然將在中國自動駕駛引領全球進入認知智能時代的浪潮中、在全球范圍內的自動駕駛「最后一公里」路上,扮演先鋒角色。
文章來源:毫末智行(有刪減)