
關于自動駕駛汽車的發展,存在各種討論,比如汽車軟件和全自動駕駛汽車上路還需要多久。
然而,與自動駕駛汽車相關的數據問題卻鮮少涉及。當自動駕駛汽車上路時,他們所需要的海量數據存儲帶來了很多問題,例如這些數據將如何安全地管理、保存和傳輸。
弗洛里安·鮑曼是戴爾科技公司汽車和人工智能的首席技術官(CTO)。他接受Siliconrepublic.com網站采訪時談論了自動駕駛汽車行業所面臨的數據挑戰,首先是數據存儲水平的不斷提高。
“如今的汽車就是路上的移動數據中心”
弗洛里安·鮑曼
汽車自動化分五級。自動化程度越高,所需的數據存儲量就越大。舉個例子,比如二級自動駕駛汽車需要全程人為操作,但有附加的自動化系統,如變道輔助、盲點檢測或自動停車功能。鮑曼認為,二級自動駕駛汽車需要4到10PB的數據。
然而,三級自動駕駛汽車需要50到100PB的數據存儲,五級自動駕駛汽車則需要3EB以上的存儲空間。鮑曼說:“三級自動駕駛系統意味著汽車可以實現自動駕駛。而五級自動駕駛汽車可以實現完全自動駕駛”“。
如何處理所有數據?
盡管自動駕駛汽車所需的數據存儲量是巨大的,但挑戰并非源于存儲階段,而是傳輸階段。鮑曼說,例如,讓車輛上路去記錄來自攝像機、激光掃描儀和雷達的數據時,每輛車每天能產生80TB的數據。
他說:“然后,你必須通過數據線連接車輛,將數據從汽車系統傳輸到數據中心,接著將數據從研發中心復制到數據中心。通常,我們的客戶在每個洲都有一個集中的數據庫,數據傳輸就可以通過加速文件傳輸方法或物理方式實現”。
鮑曼認為,汽車行業在數據方面面臨的兩大挑戰是數據的安全性,尤其是在數據傳輸方面,以及對5G的需求。
5G基礎設施對數據的重要性
鮑曼表示,5G對于自動駕駛汽車的研發和生產至關重要,尤其是在未來5到10年,屆時將有更多的技術集成到汽車中。他說:“如今的汽車就是路上的移動數據中心。因此,必須對車輛中的數據進行預處理,例如,識別值得通過5G傳輸到數據中心的有價值的數據” 。
他還說,自動駕駛汽車需要存儲邊緣數據,也就是在車內存儲數據。“你需要計算邊緣存儲,特別是在沒有5G覆蓋的地方。這是另一個問題,因為你必須在車輛中緩存數據,以便在有5G信號后發送數據”。
與5G相關的另一個問題是上傳速度。鮑曼說:“5G是為高速下載流數據設計的,所以上傳速度沒有那么快。因此,你不可能真正通過5G上傳大量數據,它是為從數據中心向最終用戶傳輸數據而不是從車輛到數據中心而設計的。但5G的優勢在于其低延遲”。
集中數據面臨的挑戰
與所有圍繞數據的討論一樣,所述數據的安全性是一個至關重要的考慮因素。鮑曼說,圍繞自動駕駛,有很多初創公司致力于增加數據安全性,也有很多開源技術應用于其中,例如加密數據或使用VPN連接。
不過,他補充說,對于大型汽車公司和初創企業來說,能在數據科學家所在地之外的地方訪問數據是非常重要的。
“我們有一個開發團隊在美國灣區工作,另一個開發團隊在東海岸的密歇根地區工作,然后我們在德國有一個開發團隊,還有的在韓國,中國,所有這些人都必須訪問數據,而數據就位于阿姆斯特丹的一個數據中心,那么,如何遠程訪問和定位數據呢?”
他說,真正的挑戰是如何創建一個全球系統,讓數據科學家能夠定位和使用數據,同時遵循GDPR的條例。他說:“它與地理分布機器學習和聯合學習齊頭并進。”
“我們的目標是無需移動數據,開發人員也無需將數據復制到集中的數據中心,就可以進行全球機器學習工作。”
新冠肺炎與自動駕駛行業
鮑曼還談到了整個自動駕駛行業以及新冠肺炎疫情對該行業的影響。他說,雖然一些戰略項目被凍結暫停了,但整個行業發展并沒有真正放緩。
他說:“客戶仍在投資存儲網絡和計算,因為這些項目肯定會實施,如果他們現在停止開發,那么他們未來就會遭受極大損失。”
“從長遠來看,[新冠肺炎]將成為加速所有這些工廠自動化的催化劑,因此,公司正努力避免在生產過程中使用人工,并試圖實現全程自動化和數字化“。
“(冠狀病毒)不會是自動駕駛行業面臨的最后一次危機,但如果能夠實現生產的完全自動化,行業的發展就不會受到影響。”