隨著自動駕駛技術(shù)的發(fā)展,海量數(shù)據(jù)的持續(xù)涌現(xiàn)為系統(tǒng)訓(xùn)練與驗證提供了前所未有的資源支撐。然而,如何從龐雜的、不同來源的仿真或路采數(shù)據(jù)中高效提煉出真正有價值的信息,并據(jù)此科學(xué)評估系統(tǒng)的安全性與性能,成為擺在企業(yè)面前的一道現(xiàn)實難題。安全評估報告的可信度,離不開堅實的數(shù)據(jù)基礎(chǔ),而數(shù)據(jù)的充足性與多樣性,則在訓(xùn)練與測試驗證過程中發(fā)揮著決定性作用,直接影響著系統(tǒng)能力的優(yōu)化與安全性的提升。

在資源有限、數(shù)據(jù)成本高昂的現(xiàn)實情況下,盲目擴充數(shù)據(jù)不僅不可持續(xù),也難以實現(xiàn)高效利用。因此,如何精準識別關(guān)鍵數(shù)據(jù)缺口,提升數(shù)據(jù)利用效率,實現(xiàn)數(shù)據(jù)驅(qū)動下的持續(xù)優(yōu)化閉環(huán),正成為推動自動駕駛技術(shù)安全落地的核心挑戰(zhàn)。

針對這一難題,2025年3月19日,在第六屆軟件定義汽車論壇暨AUTOSAR中國日上,F(xiàn)oretellix中國工程部技術(shù)經(jīng)理吳兆勇介紹了一項創(chuàng)新性的解決方案——數(shù)據(jù)驅(qū)動的自動駕駛開發(fā)工具鏈Foretify。

在深入了解Foretify之前,不妨通過以下視頻先對其核心功能有一個初步了解。視頻展示了Foretellix與NVIDIA Omniverse聯(lián)合解決方案的最新進展:該方案支持物理級高精度傳感器仿真場景的自動生成,可廣泛應(yīng)用于自動駕駛算法的訓(xùn)練與測試驗證。

Foretellix:邁向高級自動駕駛
打開網(wǎng)易新聞 查看更多視頻
Foretellix:邁向高級自動駕駛

Foretify解決方案的核心技術(shù)聚焦于數(shù)據(jù)評估(Foretify Evaluation)與數(shù)據(jù)生成(Foretify Generate)兩個方面。通過先進的數(shù)據(jù)評估能力,工具鏈能夠深入分析測試數(shù)據(jù),衡量其覆蓋度,識別現(xiàn)有數(shù)據(jù)集中的薄弱環(huán)節(jié)。基于此,數(shù)據(jù)生成技術(shù)進一步自動化地生成針對性數(shù)據(jù),有效填補覆蓋盲區(qū),提升數(shù)據(jù)的多樣性與完整性。

吳兆勇 | Foretellix中國工程部技術(shù)經(jīng)理
打開網(wǎng)易新聞 查看精彩圖片
吳兆勇 | Foretellix中國工程部技術(shù)經(jīng)理

以下為演講內(nèi)容整理:

無論是算法的訓(xùn)練過程,還是其測試驗證環(huán)節(jié),均無法脫離數(shù)據(jù)的支撐。企業(yè)和客戶通常掌握著源自多種渠道的海量數(shù)據(jù),這些數(shù)據(jù)包括仿真數(shù)據(jù)以及實際道路測試數(shù)據(jù)等,挑戰(zhàn)之處在于如何迅速地從這些海量數(shù)據(jù)中挖掘出真正具有價值的信息。對于算法訓(xùn)練或測試驗證而言,如何從數(shù)據(jù)中分析評估自動駕駛系統(tǒng)的安全性及其表現(xiàn)是一個重要課題。

如何以量化指標和數(shù)據(jù)支撐生成安全評估報告,也是我們客戶最為關(guān)注的核心問題之一。我們迫切希望明確,現(xiàn)有海量數(shù)據(jù)在訓(xùn)練和驗證過程中是否具備足夠的充分性,數(shù)據(jù)覆蓋是否全面,是否存在關(guān)鍵缺口亟待補充。在識別這些不足后,如何高效地優(yōu)化并填補數(shù)據(jù)。這些都是我們當前面臨的重要挑戰(zhàn)。然而,我們擁有的資源是有限的,尤其在中國這樣競爭激烈的環(huán)境下,無論是人力資源、算力資源、還是上市時間窗口,都顯得尤為緊迫。

針對上述挑戰(zhàn),F(xiàn)oretellix提出了一套以數(shù)據(jù)為中心的解決方案,核心在于構(gòu)建一條高效、可量化的閉環(huán)流程,專為自動駕駛系統(tǒng)的開發(fā)與驗證而設(shè)計。該方案由兩項關(guān)鍵技術(shù)組成:數(shù)據(jù)評估(Foretify Evaluate)與數(shù)據(jù)生成(Foretify Generate)。Foretify Evaluate能深入分析現(xiàn)有測試數(shù)據(jù),生成詳盡的評估報告,精準識別數(shù)據(jù)覆蓋度與潛在缺口;隨后,F(xiàn)oretify Generate 針對性地生成補充數(shù)據(jù),填補不足,最終實現(xiàn)評估與生成閉環(huán),持續(xù)優(yōu)化數(shù)據(jù)體系。

圖源:演講嘉賓素材
打開網(wǎng)易新聞 查看精彩圖片
圖源:演講嘉賓素材

我們的工具鏈平臺名為Foretify,集成了多個功能模塊,圍繞“數(shù)據(jù)驅(qū)動”這一核心理念構(gòu)建。首先,我們從數(shù)據(jù)出發(fā),面對用戶已積累的大量路測或仿真數(shù)據(jù),F(xiàn)oretify能高效提取其中的關(guān)鍵信息,為后續(xù)的數(shù)據(jù)分析與評估提供有力支撐。我們的一位北美客戶是一家專注于 L4 級無人配送小車的企業(yè),他們亟需了解當前采集數(shù)據(jù)的具體內(nèi)容、所覆蓋的場景類型,以及在不同場景下自動駕駛系統(tǒng)的實際表現(xiàn)。

為滿足這一需求,我們的平臺子模塊logIQ可接收原始道路采集數(shù)據(jù),并自動識別、標注用戶關(guān)心的關(guān)鍵場景片段。例如,自動檢測每一次車輛通過十字路口的場景。logIQ 不僅能實現(xiàn)精準的場景切分與分類,還能為每個場景提取相關(guān)參數(shù)與行為指標,進而構(gòu)建結(jié)構(gòu)化的數(shù)據(jù)集。

基于這些數(shù)據(jù)集,我們便能夠開展更深入的分析與診斷工作——包括識別異常、評估ODD覆蓋度、分析系統(tǒng)在特定場景中的行為表現(xiàn)等,從而為系統(tǒng)優(yōu)化提供可靠的數(shù)據(jù)支撐。

圖源:演講嘉賓素材
打開網(wǎng)易新聞 查看精彩圖片
圖源:演講嘉賓素材

在提取出結(jié)構(gòu)化數(shù)據(jù)后,我們可借助Foretify Manager——一套專為大規(guī)模數(shù)據(jù)分析設(shè)計的平臺工具,對全量數(shù)據(jù)進行統(tǒng)一匯總與深入分析。該平臺基于統(tǒng)計方法呈現(xiàn)各項關(guān)鍵指標在目標測試空間中的分布情況,從中提取有價值的信息與洞見。

圖源:演講嘉賓素材
打開網(wǎng)易新聞 查看精彩圖片
圖源:演講嘉賓素材

在上圖可視化圖表中,右側(cè)標記綠色的區(qū)域表示已有數(shù)據(jù)覆蓋的指標區(qū)間,即場景中存在對應(yīng)的測試數(shù)據(jù)落在該范圍內(nèi);紅色區(qū)域則標識覆蓋盲區(qū),代表當前數(shù)據(jù)尚未觸達該指標區(qū)間,也即我們需要關(guān)注與補充的覆蓋漏洞。

圖示左側(cè)展示了對測試需求的追蹤情況,包括目標覆蓋項與關(guān)鍵性能指標(KPI)等內(nèi)容,所有數(shù)據(jù)均可在Foretify Manager中實現(xiàn)統(tǒng)一整合與追蹤,助力高效決策與數(shù)據(jù)閉環(huán)優(yōu)化。

我們還提供了名為Triage的問題分類與診斷模塊,專為從海量測試數(shù)據(jù)中快速識別和歸類自動駕駛系統(tǒng)中的潛在問題而設(shè)計。Triage 支持用戶基于特定指標自定義規(guī)則,并自動執(zhí)行篩選與分類。

用戶可靈活設(shè)定規(guī)則以捕捉關(guān)鍵場景,例如所有發(fā)生碰撞或接近碰撞的案例,或 TTC低于某一閾值的事件等。一旦規(guī)則設(shè)定完成,系統(tǒng)將自動篩選匹配案例,大幅提升問題定位效率。

此外,對于某些關(guān)鍵失效案例,平臺還提供深入分析與可視化回放功能,支持用戶對問題根因進行詳細研判,助力閉環(huán)優(yōu)化與系統(tǒng)迭代。

通過Evaluation模塊,我們能夠識別測試數(shù)據(jù)中的不足、缺口與覆蓋盲區(qū)。為了有針對性地補全這些漏洞并提升數(shù)據(jù)質(zhì)量,我們引入了另一項核心技術(shù)能力——Generation。

在數(shù)據(jù)生成方面,我們采用兩條技術(shù)路徑。第一條路徑基于實際路測數(shù)據(jù),從中提取具有代表性和分析價值的場景,并在此基礎(chǔ)上進行場景擴展。為此,我們開發(fā)了Smart Replay功能,它可在真實駕駛場景基礎(chǔ)上引入多樣化變化,實現(xiàn)智能化的數(shù)據(jù)生成。

例如,在自動駕駛車輛左轉(zhuǎn)的場景中,若原始數(shù)據(jù)中行人在車輛通過后才開始通行,Smart Replay 可通過微調(diào)行人穿行時機,使場景更具挑戰(zhàn)性。此外,我們還可以動態(tài)調(diào)整NPC的行為參數(shù),如車速、車道位置等,甚至修改環(huán)境條件,如天氣、時間等因素。

借助 Smart Replay,我們能夠?qū)φ鎸崍鼍斑M行二次泛化,在保持真實性的前提下生成豐富、具代表性的測試樣本,從而顯著擴充數(shù)據(jù)集。這是我們數(shù)據(jù)生成的第一條核心技術(shù)路徑。

第二條技術(shù)路線則采用相對傳統(tǒng)的方式,即通過正向設(shè)計場景并進行隨機泛化。然而,我們在此基礎(chǔ)上引入了關(guān)鍵創(chuàng)新:基于 OpenSCENARIO DSL 的抽象場景,實現(xiàn)更智能、更可控的場景泛化。

OpenSCENARIO DSL 是我們與 ASAM 共同推進的最新行業(yè)標準。下圖所示為其典型用例——一個抽象場景的定義示例。不同于傳統(tǒng)以軌跡或具體行為為核心的場景創(chuàng)建方式,抽象場景從更高層級描述行為邏輯與交互關(guān)系,聚焦于場景意圖和本質(zhì)特征。這種表達方式不僅更具通用性,也極大提升了自動化泛化的效率與質(zhì)量。

圖源:演講嘉賓素材
打開網(wǎng)易新聞 查看精彩圖片
圖源:演講嘉賓素材

例如,假設(shè)我們希望通過抽象場景描述一個cut in并道場景,其場景本質(zhì)可描述為:一輛 NPC 車輛從鄰近車道并入,最終駛?cè)胛曳杰囕v前方的同一車道。我們可通過簡潔的幾行 OpenSCENARIO DSL 代碼定義該場景的起始與結(jié)束狀態(tài),并設(shè)定關(guān)鍵約束條件——如場景開始時兩車位于不同車道、同向行駛,場景結(jié)束時 NPC 車位于我方車輛前方的同一車道。

至于具體發(fā)生在哪段道路、以何種速度切入、從哪個方向變道等細節(jié),無需在抽象層級中定義,因為這些均屬于該抽象場景所涵蓋的參數(shù)空間,可由平臺在后續(xù)場景生成階段進行實例化泛化生成。借助 OpenSCENARIO DSL,我們能夠準確表達行為的本質(zhì)特征行為,而后通過 Foretify 平臺進行隨機泛化求解,自動生成大量不同的并道場景。

抽象場景的優(yōu)勢在于其巨大的表達空間,尤其適用于大規(guī)模場景空間探索,發(fā)現(xiàn)未知風險。它已廣泛應(yīng)用于 V&V 驗證流程中的海量測試,以及 AI 算法訓(xùn)練所需的合成數(shù)據(jù)生成,為自動駕駛開發(fā)帶來更高效、更系統(tǒng)化的場景支撐。

此外,抽象場景天然具備模塊化特性,允許我們基于一組基礎(chǔ)模塊靈活構(gòu)建出更復(fù)雜的場景組合。同時,抽象場景的定義與地圖是解耦的:在編寫抽象場景時,無需指定其所屬的具體地圖或位置。這使得同一個抽象場景可適配于多個地圖環(huán)境,并在所有符合約束條件的位置上自動生成具體實例。如下圖所示:當路口右轉(zhuǎn)遇行人這樣一個抽象場景與一張包含多種交叉路口元素的地圖搭配使用時,F(xiàn)oretify 將自動在所有滿足約束條件的路口位置上,生成多種變化形式的具體路口場景,實現(xiàn)場景的大規(guī)模、多樣化自動生成。

圖源:演講嘉賓素材
打開網(wǎng)易新聞 查看精彩圖片
圖源:演講嘉賓素材

這種設(shè)計不僅提升了生成效率,更具備強大的未知風險發(fā)現(xiàn)能力。例如,對于“兩車交匯”這一常見場景,人工正向設(shè)計時往往局限于十字路口等典型區(qū)域。而通過 Foretify,系統(tǒng)能夠在如加油站捷徑這類非常規(guī)道路上,自動識別并生成潛在交匯與碰撞場景,揭示出工程師可能遺漏的高風險區(qū)域。

這些“意料之外”的特殊情境,正是提高測試覆蓋度、暴露系統(tǒng)脆弱點的關(guān)鍵所在。抽象場景與地圖的解耦性,為我們提供了更廣泛、更系統(tǒng)的場景探索能力,是面向規(guī)?;炞C與安全分析的重要技術(shù)手段。

綜上所述,F(xiàn)oretify 以數(shù)據(jù)為核心,構(gòu)建了由 Evaluation(評估)與 Generation(生成) 驅(qū)動的高效開發(fā)閉環(huán)。通過 Evaluation,我們能夠系統(tǒng)識別測試或訓(xùn)練數(shù)據(jù)中的覆蓋盲區(qū)與代表性不足;借助 Generation,結(jié)合抽象場景建模與智能泛化能力,平臺可自動補全數(shù)據(jù)缺口、擴展多樣化的場景樣本,不僅提升V&V驗證效率和測試覆蓋率,也可為 AI 算法訓(xùn)練提供高質(zhì)量、具挑戰(zhàn)性的合成數(shù)據(jù)。未來,我們還將持續(xù)推進更多創(chuàng)新功能,敬請大家持續(xù)關(guān)注。

(以上內(nèi)容來自Foretellix中國工程部技術(shù)經(jīng)理吳兆勇于2025年3月18日-19日在第六屆軟件定義汽車論壇暨AUTOSAR中國日發(fā)表的《邁向高級自動駕駛:基于數(shù)據(jù)驅(qū)動的自動駕駛開發(fā)驗證工具鏈》主題演講。)