在這個由數據驅動的時代,科技創業者們正站在變革的風口浪尖。他們不僅需要敏銳的洞察力,更需要敢于突破的勇氣。Nullmax公司正是這樣一位勇敢的先行者。
在2024年7月16日的上海,Nullmax公司舉辦了一場備受矚目的技術發布會,主題為“AI無止境,智變新開端”。它不僅是一場科技盛宴,更是一次對未來自動駕駛技術的深刻洞見。Nullmax推出的新一代自動駕駛技術——Nullmax Intelligence(簡稱“NI”),以其全場景自動駕駛應用、純視覺、真無圖、多模態的技術特點,引發了業界的廣泛關注。
在智能駕駛的發展歷程中,規則曾是主導。然而,隨著場景的復雜化,規則的局限性逐漸顯現。Nullmax的創始人兼CEO&CTO徐雷博士在發布會后接受媒體采訪時表示,傳統的規則方法已無法應對復雜的交通環境。為此,Nullmax采用了基于端到端的大模型NI,結合多模態端到端大模型和安全類腦,實現了從規則到仿生智能的飛躍。
徐雷博士強調,安全類腦的引入是自動駕駛領域的一大創新。它不依賴于大模型的感知結果,而是一個獨立系統,類似于魚通過傳感器避免碰撞。這種獨立性不僅提升了系統的安全性,也為自動駕駛技術的發展提供了新的思路。
在訪談中,徐雷博士還提到了實時性和靈活性的重要性。Nullmax的系統能夠在0到150 km/h的車速范圍內穩定運行,這得益于其高效的數據處理能力和靈活的系統設計。這種靈活性不僅支持多種車型,還兼容不同的芯片和傳感器,展現了Nullmax在技術解決方案上的深度與廣度。
在談到AIGC生成的虛擬數據時,徐雷博士表示,生成式AI在應對復雜任務中發揮了關鍵作用。通過生成接近真實的圖片和視頻,Nullmax能夠在可控條件下生成特定的交通場景,從而提升系統的智能化水平。
盡管多模態端到端大模型在技術上已經取得了顯著進展,但徐雷博士也指出,從技術到產品的轉化仍需時間。Nullmax正在不斷優化其技術,預計明年初將進行大規模測試,這將為自動駕駛技術的商業化提供堅實的基礎。
在自動駕駛產業鏈中,Nullmax定位為軟件Tier1,為車企提供從感知到決策的端到端解決方案。徐雷博士認為,盡管車企在產業鏈中占據有利位置,但軟件供應商通過技術創新和市場需求的深刻理解,同樣能夠找到自己的市場定位。
Nullmax的技術發布會不僅是一次技術的展示,更是對未來智能駕駛的一次深刻思考。在這個充滿挑戰與機遇的時代,科技創業者們需要的不僅是技術,更是對未來的洞察和勇氣。Nullmax的NI技術,正是這樣一次勇敢的嘗試,它不僅引領了技術的發展,更為整個行業指明了方向。
以下為訪談內容(經整理)
智能駕駛的進化:從規則到仿生智能
Q:在智能駕駛系統中,類腦神經網絡是如何發揮作用的?它是一個模塊還是一個系統的冗余?
徐雷: 傳統的智能駕駛解決方案一開始是基于規則的方法,依靠感知和規劃來實現自動駕駛。例如十幾年前的汽車就具備自動跟車和自適應巡航等功能。通過檢測前方車輛的速度、距離和朝向,系統可以根據總結的人類駕駛經驗制定規則,實現自動跟車。
隨著場景的復雜化,單純依靠規則已無法應對。例如,在高速公路或單車道上自動跟車較為簡單,但在更復雜的換道和轉向場景下,規則變得難以適用。尤其是在無標線的復雜路口,制定規則變得幾乎不可能。因此,許多城市智能駕駛系統通過高精地圖和激光定位來解決這些問題。
我們目前采用的方案是基于端到端的大模型NI(Nullmax Intelligence)。該系統包括兩個部分:多模態端到端大模型和安全類腦。多模態端到端大模型可以識別視頻、音頻和交通手勢等,指導車輛在路口的行駛方向。基于導航信息,該模型輸出行駛軌跡,并通過一級和二級仲裁來評估軌跡的合理性。
在一級仲裁中,通過人類可理解的規則進行檢測并可視化結果,例如檢測軌跡的加速度是否過大或車輛是否進入自行車道等。如果發現問題,系統會進行調整。但這仍不足以確保絕對安全,因此我們引入了安全類腦的概念。安全類腦的神經元數量很少,僅為10萬級別,但它具備天然的避障能力,確保車輛不會與其他車輛發生碰撞。
多模態端到端模型由人類設計,而安全類腦則是通過仿生學研究獲得的。例如,通過研究斑馬魚的神經元連接和權重,我們發現其能有效避障的機制,從而應用于智能駕駛系統中,起到監督和安全保障的作用。
Q:關于安全類腦的概念,Nullmax為什么要在自動駕駛領域引入這一技術?
徐雷: 規則無法全面覆蓋所有場景,無論是端到端的大模型還是分模塊的端到端系統,都基于對周圍環境的感知。然而,感知的準確性無法達到百分之百,總會有未考慮到的規則。安全類腦則不同,它不依賴任何大模型的感知結果,而是一個獨立系統,類似于魚通過傳感器避免碰撞。一級仲裁依賴大模型的輸出,而二級仲裁則由獨立的安全類腦系統負責。
李孟博士在哈佛進行腦科學研究,破解斑馬魚大腦中的神經元連接,發表在《Nature》。這種類腦研究耗時長,投入大,目前很少有自動駕駛公司進行這類研究并將其應用于自動駕駛。
Q:一級仲裁和安全類腦的配合是否有可能出現錯誤?安全類腦是最后一道屏障嗎?
徐雷: 我們的系統由多模態端到端大模型和安全類腦構成。一級仲裁通過規則兜底,基于大模型的輸出制定交通和物理規則。二級仲裁獨立于一級仲裁,由安全類腦負責。我們的NI系統輸出三個關鍵部分:HMI可視化結果、場景描述和駕駛行為,確保系統對環境的理解和決策。
在沒有激光和高精地圖的情況下,車輛需要實時感知和理解十字路口的環境。例如,車輛需要識別道路邊緣、柵欄和車道線的變化,盡管實時感知的結果會有抖動,但足以支持對場景的理解和安全駕駛。
Q:實時監督和感知的實時性如何?在城市或高速上支持的最大車速是多少?
徐雷: 這完全不是問題。我們的量產方案支持0到150 km/h的車速。我們的系統大模型有三個輸出:軌跡、場景描述和靜態動態任務,它們的輸出頻率不同。
場景描述的輸出頻率是0.2秒(200毫秒),并非實時。場景描述是對當前環境的概述,例如紅燈或其他情況,而這并不需要實時性。相反,軌跡和障礙物檢測是實時的。我們的系統有長短記憶,例如前方500米右轉的長記憶和檢測行人橫穿的短記憶。
對于實時性要求高的任務,如車道線和障礙物檢測,我們的系統與現有量產方案相同,具備強實時性。而場景語言描述的實時性要求不高,目前使用0.2秒的推理時間來確定場景,如下雨直道或紅燈等。
Q:行業內流行端到端的方案,通常是將規則代碼整合成一個或兩個模塊。但從昨天的發布會來看,我們似乎在探索下一階段的智能驅動。如何理解智能驅動?為什么堆規則和數據不如智能驅動?智能驅動需要解決哪些關鍵問題?面臨什么瓶頸?
徐雷: 我們專注于一個模塊,而不是傳統的規則堆積。首先,我們明確了問題的核心,并確保方案自我驗證。經驗告訴我們,單純堆積規則未必能有效解決問題。
智能驅動的核心在于高效的數據利用和訓練。首先,數據的質量至關重要。就像大模型訓練需要高質量數據一樣,我們需要高效管理和生成這些數據。
其次,訓練過程并非簡單。它涉及數據選擇、參數調優以及在有限預算內最大化性能提升。這些過程需要技術深度,遠超簡單的規則堆積。例如,ChatGPT的進化不僅需要大量數據,還需有效的訓練策略和調試手段。
總結來說,智能驅動的挑戰在于數據質量、訓練效率以及如何高效利用數據進行模型優化。這些是堆規則無法解決的核心問題。
數據驅動的智能化提升
Q:關于AIGC生成的虛擬數據,其質量和可靠性如何?能否應對復雜任務?
徐雷: 我們正是為了應對復雜任務才使用生成式AI來生成數據。一些危險場景在現實中很難遇到,也很難通過模擬得到準確數據。因此,我們利用生成式AI生成接近真實的圖片和視頻。這些生成的數據在視覺上與真實數據難以區分,可以在可控條件下生成特定的交通場景和視頻。例如,生成一輛車在固定距離內行駛,盡管周圍場景會變化。
此外,對于配備多個攝像頭的車輛,我們需要生成對應的視角變化數據。例如,車輛轉彎時,攝像頭視角和生成的圖片需要隨之改變,確保數據的連續性和準確性,這對生成式AI提出了高要求。
Q:關于物理世界數據與虛擬數據的爭議,你怎么看?
徐雷: 這取決于發展的階段。早期,實際數據對提升系統性能至關重要。然而,隨著系統的增強,常見場景的挑戰變得少之又少。我們需要創造復雜場景來提升系統智能化水平,超越純數據驅動。就像新手駕駛,剛開始可能不熟練,但隨著經驗積累,能應對更多復雜情況,這是一種智能化提升。
車端產生的數據量巨大,但并非全部有價值。隨著系統性能提升,有價值的數據比例變得非常低。關鍵在于找到這些價值數據,而不僅僅依賴大量的路測數據。
Q:特斯拉FSD即將進入中國,您認為這對自動駕駛行業或Nullmax有何影響?
徐雷: 中國市場巨大,合資品牌和特斯拉等都會參與競爭,我們對此表示歡迎。對消費者而言,多一種選擇總是好的。高水平的競爭環境能培養出高水平的技術和人才。行業的發展速度與競爭激烈程度成正比。以前汽車企業五年推出一款新車,是因為競爭不激烈。引入更多高水平的方案,將促進行業整體提升。我們歡迎所有企業參與,共同推動自動駕駛技術的發展。
Q:聽說特斯拉現在的成本已經降到4000塊錢?你們怎么看?
徐雷: 差不多。特斯拉主要使用幾個攝像頭和自研芯片的域控制器,連毫米波雷達都沒有。我們并不排斥激光雷達或其他傳感器,但我們希望即使在沒有激光雷達和地圖的情況下,車也能正常行駛,完成左轉或右轉。當然,更好的車可以配備更多傳感器以提高駕駛體驗。
特斯拉使用至少8個攝像頭和其系統在100多T算力上運行。坦率地說,國內方案通常需要激光雷達、地圖和大量算力。我們希望未來的車能具備這樣的智能駕駛能力,而不僅僅是高端車型才能擁有。
Q:馬毅教授提到Scaling Law無法實現AGI,很多自動駕駛公司也持類似觀點。您怎么看待Scaling Law?
徐雷: Scaling Law本質上是一種“大力出奇跡”的方法,通過大量數據和高算力不斷訓練模型。在一定程度上,它確實有效,但其天花板可能已定,無法無限制提升。要突破這個天花板,可能需要更巧妙或成本更低的方法。
當前大家使用Scaling Law,是因為了解問題的挑戰所在,但對問題的本質理解還不夠深入,所以選擇先嘗試這種方法。通過不斷實踐,我們可能會加深對問題的理解,找到更好的解決方案。
我認同馬毅教授的觀點,Scaling Law可能不是最高效的方式。找到正確的方法并不容易,需要逐步積累和理解。我們做自動駕駛也是如此,不可能不懂機器學習和深度學習就能成功。必須通過逐步探索,篩選出可行的路徑。
盡管Scaling Law可能不是最終答案,但探索過程中發現的不可行路徑,也能幫助我們縮小搜索范圍。因此,無論Scaling Law還是其他嘗試,都值得去做。只有不斷探索,才能找到最優解。
多模態端到端大模型的未來展望與挑戰
Q:這套多模態端到端大模型何時能上車?
徐雷: 我們幾年前就開始研發這套技術,涉及2D、3D檢測等領域。2022年,我們發布了實時構建地圖的研究。去年起,我們將所有技術整合,包括生成式錐形桶技術,證明了這是一套可行的城市自動駕駛方案,不依賴地圖和激光。雖然技術驗證成功,但從技術到產品還有一段路要走,預計明年初才能大規模測試。目前,業界雖談端到端技術,但尚未見到實質性的展示。我們開技術發布會是希望讓大家了解進展,但這距離成熟產品還有距離。
Q:關于商業化,Nullmax在產業鏈中的角色是怎樣的?主要是提供什么樣的解決方案?具體有哪些項目和合作?
徐雷: 我們主要角色定位在軟件Tier1,為車企提供從感知到決策的端到端解決方案。我們與Tier1和OEM均有合作。在海外市場,我們大部分通過Tier1合作,但也有不少直接與OEM合作。國內市場同樣如此,我們與國內外的Tier1都有廣泛合作,同時也與OEM在端到端解決方案等前沿領域直接合作。
我們覆蓋低中高算力,行泊車方案和艙駕一體。我們在低算力平臺上有TI和瑞薩的方案,也有國產的愛芯元智和黑芝麻方案;在高算力平臺上有高通和英偉達的方案。這些方案要么已經量產,要么正在進行項目。我們與芯片廠商如瑞薩和TI的合作,展示了我們在低算力平臺上的優勢,例如在CES 2024上展示的2T低算力方案,可以純視覺實現前向行車功能。
在8T算力平臺上,我們無需差分GPS,純靠視覺實現高速NOA和記憶泊車,并能檢測障礙物。在高通平臺上,我們成功移植了7V方案,展示了軟件平臺化的優勢。
我們與國內外主要的Tier1都有合作,他們是我們的重要客戶。我們可以為多個平臺提供解決方案,這在傳統Tier1中是很少見的。比如,TI芯片的不同算力平臺、黑芝麻的A1000、以及高通的8775和8620,我們都可以支持。Tier1客戶因此能夠在不同的平臺上使用我們的技術。
車廠方面,我們在端到端解決方案和Mobility等前沿領域直接合作,因為這些領域的Tier1較少涉足,車廠在高階方面的投入更多,所以我們更多直接與車廠合作。
Nullmax致力于通過多樣化的合作和技術覆蓋,為自動駕駛商業化提供強大支持。
Q:有觀點認為,車企在自動駕駛產業鏈中占據著有利位置,而軟件供應商則處于劣勢,因為車企可以自己開發軟件。對此,您怎么看?
徐雷: 我們的思路是基于對自動駕駛技術的堅定信念和明確的技術路線。我們選擇了漸進式的技術路線,因為它能有效應對各種復雜情況,并且在實現目標方面具有商業化的可行性。盡管車企也有優勢,但這并不妨礙我們作為軟件供應商找到自己的位置并獲得成功。
我們作為供應商的選擇不是偶然的,而是基于對技術路線的深刻理解和市場需求的分析。雖然車企具備資源和數據優勢,但這些優勢并不一定轉化為市場競爭力。車企的內部團隊有時可能不需要面對激烈的市場競爭,因此他們的技術可能未必最先進。
實際上,我們已經在市場中證明了我們的方案具備競爭力。例如,我們在低算力平臺上成功實現了前向行車功能,這證明了我們的技術能力。車企雖然擁有一定的優勢,但我們能夠靈活地調整策略,更快速地響應市場需求。
在國際市場中,我們也發現了分工的清晰和合作的順暢,這與國內市場中的競爭環境形成了鮮明對比。現代工業化的時代要求分工明確,每個參與者都可以找到自己的定位,無需全方位覆蓋所有領域。我們堅信,在這樣一個開放包容的環境中,適應時代發展趨勢的企業才能脫穎而出,時代將會證明一切。
Q:在當前汽車行業環境下,純軟件供應模式是否存在挑戰?尤其是在成本壓力下,車企對軟件的重視程度較低,軟件的價值也難以衡量。一些企業選擇了軟硬件結合的模式,您對此有何看法?
徐雷: 您的問題觸及了一個核心問題。確實,過去幾年中,軟件供應商在硬件主導的市場中面臨了不少挑戰,尤其是在激烈的同質化競爭下。一些企業通過低門檻的方式進入市場,例如基于現有芯片進行代工,而不進行深度研發。這種現象的出現主要是因為資本的驅動以及市場對低成本方案的需求。
然而,市場環境正在發生變化。隨著同質化競爭的減少,行業逐漸回歸理性。供需關系決定了市場的價值,而不是單純的成本。在汽車產業中,軟件和硬件的結合并不是唯一的解決方案,而是一個形態問題。真正的挑戰在于如何在市場中找到適合的定位并創造價值。
我們并不打算取代車企,而是希望通過與車企的合作,共同推動行業的進步。車企在整個產業鏈中扮演著重要角色,而我們作為軟件供應商,致力于提供高價值的技術解決方案。我們看到市場對高階技術方案的需求在增加,盡管開發費用高昂,但市場對優質方案的認可度也在提升。
例如,過去我們能從高階方案中獲得大額的開發費用,而現在中階方案的費用也同樣可觀。這說明市場正在逐步淘汰那些無法提供高價值的低門檻競爭者。未來,我們將繼續關注市場動態,并探索顛覆性的技術思路,保持前瞻性,推動行業的發展。
總之,市場價值的決定因素是供需關系,而不是簡單的成本計算。我們將在不斷變化的市場環境中,繼續以技術創新為核心,推動自動駕駛及相關領域的發展。
Q:我們的落地方案特點是高度靈活,支持多種車型,不僅芯片兼容性強,甚至攝像頭也不受限制。這種靈活性帶來了哪些挑戰,如何解決?
徐雷: 我們的高度靈活方案源于對需求的深刻理解。與特斯拉的一體化方案不同,我們面對的是各種不同的客戶需求,包括傳統車企、新勢力車企及海外市場。每種需求都可能需要不同的配置和方案。
作為曾在高通工作的芯片專家,我深知單一方案難以覆蓋從2T到2000T的各種芯片。不同芯片有不同的特點,比如高通和英偉達擅長高算力芯片,而TI和瑞薩則擅長低算力芯片。因此,我們從一開始就設計了MaxOS中間件系統,支持硬件和應用的解耦,使系統能夠適配各種芯片和傳感器。
我們的方案由傳感器輸入、視覺處理、模型推理和后處理構成,設計時已考慮到未來芯片的不斷演進。我們關注的是功能和性能,而非單一芯片。我們還支持中國市場對國產芯片的需求。
此外,我們的系統像一棵技術的樹,多個方案在不同芯片上運行,數據可以使整個系統不斷優化,而不是僅限于某個芯片方案。與傳統OEM和Tier1廠商不同,我們的方案具備更強的軟件抽象能力,能夠更好地適配各種車型,并提升系統性能。
我們著眼于提升單車價值,而非僅通過軟件綁定芯片。雖然很多芯片廠商希望通過搭配算法銷售芯片,但真正的增長來自于更多的車上使用以及提供更多用戶粘性的功能。我們的行業門檻較高,不會有太多公司能夠長期存活。
我要評論