本發(fā)明屬于自動(dòng)駕駛汽車測(cè)試評(píng)價(jià),具體的說是一種自動(dòng)駕駛擬人連續(xù)交互測(cè)試場(chǎng)景生成方法。
背景技術(shù):
1、自動(dòng)駕駛汽車是汽車科技發(fā)展的潮流與趨勢(shì),科學(xué)完善的測(cè)試評(píng)價(jià)體系是保障自動(dòng)駕駛汽車安全上路的基礎(chǔ)與前提。基于場(chǎng)景的測(cè)試方法已成為自動(dòng)駕駛汽車性能驗(yàn)證的重要手段,其核心在于如何生成豐富的測(cè)試場(chǎng)景。當(dāng)前針對(duì)獨(dú)立場(chǎng)景已經(jīng)得到了眾多研究。然而現(xiàn)有方法在連續(xù)場(chǎng)景生成過程中缺乏考慮場(chǎng)景危險(xiǎn)度及擬人性。
技術(shù)實(shí)現(xiàn)思路
1、為解決上述問題,本發(fā)明提供了一種自動(dòng)駕駛擬人連續(xù)交互測(cè)試場(chǎng)景生成方法,將連續(xù)場(chǎng)景生成過程分為自動(dòng)駕駛軌跡預(yù)測(cè)及交通車軌跡生成兩部分:前者基于自然駕駛過程分析自動(dòng)駕駛未來可能的交通行為,后者在完成交互行為類型選擇的基礎(chǔ)上通過transform網(wǎng)絡(luò)生成交通車預(yù)期軌跡,通過二者的迭代運(yùn)行完成了擬人交互場(chǎng)景連續(xù)生成。
2、本發(fā)明技術(shù)方案結(jié)合附圖說明如下:
3、一種自動(dòng)駕駛擬人連續(xù)交互測(cè)試場(chǎng)景生成方法,包括以下步驟:
4、對(duì)車輛運(yùn)動(dòng)行為進(jìn)行分析,包括分割時(shí)序數(shù)據(jù)和聚類軌跡段;
5、對(duì)被測(cè)自動(dòng)駕駛汽車軌跡進(jìn)行預(yù)測(cè),包括分析當(dāng)前行為和預(yù)測(cè)未來交通行為;
6、生成交通車交互軌跡,包括生成交通車交互行為類型和生成交通軌跡。
7、進(jìn)一步的,分割時(shí)序數(shù)據(jù)的具體方法如下:
8、選擇基于貪心的貝葉斯凝合式序列分割(bayesian?model-based?agglomerativesequence?segmentation,bmass);
9、對(duì)于一段駕駛時(shí)序數(shù)據(jù)seq=(x1,y1),(x2,y2),(x3,y3),…,(xn,yn),其中xi∈rp×1為采樣時(shí)間,yi∈rq×1為時(shí)間序列數(shù)據(jù);當(dāng)y對(duì)x的回歸只在某一段區(qū)間內(nèi)服從某種斜率的線性回歸模型,而在其他區(qū)間內(nèi)則服從不同斜率的線性回歸模型時(shí),則使用分段線性回歸模型進(jìn)行序列數(shù)據(jù)分析;
10、bmass算法首先將所有時(shí)間點(diǎn)都看作一個(gè)獨(dú)立線性回歸模型,計(jì)算相鄰段合并的邊際似然值,將最大值產(chǎn)生的位置作為凝合點(diǎn)合并,并持續(xù)迭代,通過凝合迭代方式將序列段一一合并,直至對(duì)數(shù)似然為負(fù)數(shù)或所有段都已合并,從而完成自然駕駛數(shù)據(jù)分割;
11、對(duì)于序列seq={seq1,seq2,seq3,…,seqs},若將其中的seqi與seqi+1合并成seqi∪seqi+1,則seq與其凝合后的序列seqh={seq1,seq2,seq3,…,seqi∪seqi+1,…,seqs}的邊際似然為:
12、
13、式中,φ0為歸一化常數(shù),根據(jù)分段線性回歸模型特征進(jìn)行計(jì)算;φ0(·)代表每個(gè)分段的后驗(yàn)歸一化系數(shù);
14、迭代過程中每個(gè)凝合點(diǎn)的似然為:
15、
16、式中:λ為凝合點(diǎn)與非凝合點(diǎn)的比例系數(shù)。
17、進(jìn)一步的,聚類軌跡段的具體方法如下:
18、采用高斯混合模型-隱狄利克雷分配模型將得到的軌跡段進(jìn)行聚類,其中g(shù)mm模塊完成軌跡段數(shù)據(jù)的降維表征,lda算法進(jìn)行語義挖掘聚類;
19、不同軌跡中各個(gè)基礎(chǔ)交通行為類別的出現(xiàn)次數(shù)和不同基礎(chǔ)交通行為類別中軌跡采樣點(diǎn)的出現(xiàn)次數(shù)符合多項(xiàng)式分布:
20、
21、
22、式中,tm為第m,個(gè)軌跡段中采樣點(diǎn)的基礎(chǔ)交通行為類別分布;τm為第m,個(gè)基礎(chǔ)交通行為的類別分布;γk為第k個(gè)基礎(chǔ)交通行為類別的采樣點(diǎn)分布;nm為第m,個(gè)基礎(chǔ)交通行為中采樣點(diǎn)的數(shù)量;k為軌跡段中的基礎(chǔ)交通行為類別數(shù)量;
23、將τm和γk均設(shè)為狄利克雷分布,則所有基礎(chǔ)交通行為集合的似然概率公式如下:
24、
25、式中,wm,n為第m,個(gè)軌跡段的第n個(gè)采樣點(diǎn);求解軌跡段集合的似然概率需要累乘所有軌跡段中采樣點(diǎn)生成概率,單個(gè)采樣點(diǎn)的生成概率為采樣點(diǎn)對(duì)應(yīng)基礎(chǔ)交通行為類別的邊緣概率;
26、將基礎(chǔ)交通行為類別數(shù)量設(shè)定為5,聚類獲取不同類型車輛運(yùn)動(dòng)基元。
27、進(jìn)一步的,分析當(dāng)前行為的具體方法如下:
28、通過計(jì)算當(dāng)前自動(dòng)駕駛行駛軌跡與分割獲取的自然駕駛軌跡的相似性獲取其當(dāng)前交通行為;
29、通過歐氏距離計(jì)算軌跡相似度的方法計(jì)算兩條軌跡序列每個(gè)時(shí)間步下對(duì)應(yīng)點(diǎn)的歐氏距離均值,公式如下:
30、
31、式中,為曲線a和曲線b在k時(shí)刻的x方向位置;為曲線a和曲線b在k時(shí)刻的y方向位置,使用歐式距離計(jì)算軌跡的相似度要求兩條軌跡在時(shí)間和采樣個(gè)數(shù)上相同;
32、使用歐氏距離四次方的均值作為相似度的評(píng)價(jià)指標(biāo):
33、
34、再根據(jù)軌跡段橫縱向長(zhǎng)度將軌跡橫縱向歸一化處理。
35、進(jìn)一步的,預(yù)測(cè)未來交通行為的具體方法如下:
36、統(tǒng)計(jì)自然駕駛數(shù)據(jù)分割后獲取的到的不同基礎(chǔ)交通行為持續(xù)時(shí)長(zhǎng)及該行為后續(xù)所連接的基礎(chǔ)交通行為類型,建立基礎(chǔ)交通行為轉(zhuǎn)換矩陣;
37、當(dāng)前基礎(chǔ)交通行為自轉(zhuǎn)移概率為:
38、aii=nend/?nall?(8)
39、式中,nend為該類基礎(chǔ)交通行為持續(xù)時(shí)長(zhǎng)低于該行為當(dāng)前持續(xù)時(shí)長(zhǎng)的軌跡段數(shù)量;nall為該類基礎(chǔ)交通行為所有的軌跡段數(shù)量;
40、由該類基礎(chǔ)交通行為轉(zhuǎn)變?yōu)槠渌愁惢A(chǔ)交通行為的轉(zhuǎn)移概率為:
41、aij=(1-aii)×ncj/?nall?(9)
42、式中,ncj為第i類基礎(chǔ)交通行為后序?yàn)閖類基礎(chǔ)交通行為的軌跡段數(shù)量;
43、選擇狀態(tài)轉(zhuǎn)移矩陣中最高的3類作為預(yù)期行為備選,并通過transform網(wǎng)絡(luò)生成對(duì)應(yīng)軌跡;假設(shè)交通車維持當(dāng)前駕駛行為,分別計(jì)算3類預(yù)期駕駛行為與交通車軌跡間的最小距離es和平均距離eu,如下所示:
44、
45、最后,將最小距離大于閾值且平均距離最大的預(yù)期行為備選作為預(yù)測(cè)軌跡,若所有最小距離均小于閾值,則選擇狀態(tài)轉(zhuǎn)移最高的行為及軌跡作為預(yù)測(cè)軌跡。
46、進(jìn)一步的,生成交通車交互行為類型的具體方法如下:
47、制訂交通車行為選擇及軌跡長(zhǎng)度計(jì)算規(guī)則,設(shè)定的交通車行為選擇規(guī)則及預(yù)期軌跡點(diǎn)位置如表1所示:
48、表1交通車交互行為規(guī)則表
49、
50、
51、表中橫向表示自動(dòng)駕駛汽車預(yù)測(cè)得到的未來交通行為,縱向表示當(dāng)前交通車與自動(dòng)駕駛汽車的相對(duì)位置;規(guī)則表中對(duì)交通車預(yù)期采取的行為及采取該行為后的預(yù)期軌跡終點(diǎn)進(jìn)行了明確;對(duì)于存在多類行為備選的情況,交通車隨機(jī)選擇其中一種。
52、進(jìn)一步的,生成交通軌跡的具體方法如下:
53、在完成交通車行為類型選擇及軌跡長(zhǎng)度判斷后,生成其具體軌跡;選擇transform網(wǎng)絡(luò)作為交通車行為生成的框架,對(duì)車輛運(yùn)動(dòng)行為分析獲取的不同基礎(chǔ)交通行為分別訓(xùn)練transformer軌跡生成模型;transformer軌跡預(yù)測(cè)網(wǎng)絡(luò)參數(shù)如表所示,輸入數(shù)據(jù)為車輛橫縱向位置信息;
54、表2tranformer網(wǎng)絡(luò)參數(shù)表
55、 網(wǎng)絡(luò)參數(shù) 值 網(wǎng)絡(luò)參數(shù) 值 input_size 2 output_size 1 embedding_size 8 n_head 8 dim_feedforward 2048 dropout 0 batch_size 512 initial_learning_rate 0.001 gamma 0.995 epoch 1000
56、損失函數(shù)為預(yù)測(cè)值與掩碼矩陣對(duì)應(yīng)位置相乘后和標(biāo)簽值的均方誤差損失,公式如下:
57、
58、在模型訓(xùn)練過程使用學(xué)習(xí)率衰減,衰減策略為指數(shù)衰減,指數(shù)衰減公式如下:
59、lr=lrinitialγepoch???????(12)
60、式中,lr為當(dāng)前輪的學(xué)習(xí)率;lrinitial表示初始學(xué)習(xí)率;γ為0.995;epoch為當(dāng)前輪的輪次。
61、本發(fā)明的有益效果為:
62、本發(fā)明提出一種基于擬人交互軌跡的連續(xù)測(cè)試場(chǎng)景生成方法。首先分析自然駕駛數(shù)據(jù)獲取真實(shí)人類駕駛過程車輛之間的行為軌跡;在此基礎(chǔ)上,建立被測(cè)自動(dòng)駕駛汽車軌跡預(yù)測(cè)模型完成未來軌跡預(yù)測(cè);隨后,建立交通車擬人交互軌跡模型,實(shí)現(xiàn)擬人連續(xù)交互測(cè)試場(chǎng)景生成。由于交通車行為規(guī)則的目標(biāo)在于與被測(cè)自動(dòng)駕駛汽車產(chǎn)生軌跡交互,這提升了被測(cè)自動(dòng)駕駛汽車與交通車之間的碰撞風(fēng)險(xiǎn),從而提升了場(chǎng)景的風(fēng)險(xiǎn)性;此外,由于交通車軌跡生成模型是基于人類駕駛數(shù)據(jù)訓(xùn)練的transformer網(wǎng)絡(luò),這可以確保交通車行為符合人類駕駛特征,即保證了連續(xù)測(cè)試場(chǎng)景的擬人性。生成的擬人連續(xù)交互測(cè)試場(chǎng)景具有長(zhǎng)時(shí)序特征,相比獨(dú)立測(cè)試場(chǎng)景更能準(zhǔn)確反映被測(cè)自動(dòng)駕駛汽車決策控制策略在真實(shí)服役條件下的綜合性能,同時(shí)還能有效避免獨(dú)立測(cè)試場(chǎng)景初始狀態(tài)不可達(dá)的問題。