6 月 23 日消息,阿里云今日宣布推出面向自動駕駛領域模型的訓練、推理加速框架 PAI-TurboX。
據(jù)介紹,該框架可提升感知、規(guī)劃控制乃至世界模型的訓推效率,在多個行業(yè)模型的訓練任務中,PAI-TurboX 均可縮短 50% 的時間。該框架可用于多模態(tài)數(shù)據(jù)預處理、離線大規(guī)模模型訓練以及實時智駕推理等環(huán)節(jié),可為自動駕駛、具身智能等領域提供全面解決方案,目前已應用于多家車企。
在系統(tǒng)側,PAI-TurboX 通過優(yōu)化 CPU 親和性、動態(tài)編譯、流水線并行等策略,顯著提升模型的訓練推理效率;
在數(shù)據(jù)側,PAI-TurboX 提出了高性能的 DataLoader 引擎,并且優(yōu)化了數(shù)據(jù)預處理流程和實現(xiàn)了智能訓練樣本分組,有效提升數(shù)據(jù)處理效率。
此外,PAI-TurboX 還提供了算子優(yōu)化和量化等能力,可進一步減少訓練階段的訪存延遲,提升吞吐效率,同時在推理任務中,能在保障精度的同時降低計算開銷與內(nèi)存帶寬需求,可實現(xiàn)異構平臺下的高性能推理部署。
官方實測結果顯示:
在自動駕駛的 3D 物體檢測模型 BEVFusion 訓練任務中,PAI-TurboX 可以將訓練時間縮短 58.5%;
在實時在線矢量化高精地圖構建模型 MapTR 訓練任務中,PAI-TurboX 可以將訓練時間縮短 53%;
在端到端自動駕駛模型 SparseDrive 訓練任務中,PAI-TurboX 可以在感知模塊訓練和聯(lián)合訓練兩個階段獲得明顯的速度提升,相同訓練步數(shù)下兩個階段可分別縮短 51.5% 和 48.5%。
從公開資料獲悉,阿里云人工智能平臺 PAI 可提供貫穿 AI 開發(fā)和運維全流程的平臺服務。自 2016 年誕生以來,PAI 已累計服務超過 10 萬家企業(yè)客戶及數(shù)百萬 AI 開發(fā)者,支撐阿里云百煉、魔搭社區(qū)等 MaaS 服務及社區(qū)。