本發(fā)明屬于制導(dǎo),具體涉及基于伯恩斯坦基的導(dǎo)彈多約束閉環(huán)制導(dǎo)方法。
背景技術(shù):
1、制導(dǎo)律是導(dǎo)彈實現(xiàn)攔截導(dǎo)引和精確打擊的關(guān)鍵技術(shù)之一。隨著現(xiàn)代戰(zhàn)場環(huán)境的復(fù)雜多變及導(dǎo)彈防御系統(tǒng)的不斷完善,對于末制導(dǎo)的要求也越來越高。在要求導(dǎo)彈的脫靶量盡可能小的基礎(chǔ)上,還希望導(dǎo)彈能夠以最大的末速度擊中目標(biāo),從而實現(xiàn)了導(dǎo)彈的最大增程。
2、導(dǎo)彈制導(dǎo)方法設(shè)計問題本質(zhì)上屬于非線性優(yōu)化問題。求解最優(yōu)控制問題的數(shù)值方法通常分為間接法和直接法。前者解析推導(dǎo)了局部最優(yōu)性的必要條件,而后者將原來的無限維問題轉(zhuǎn)化為有限維問題,并求解由此產(chǎn)生的非線性規(guī)劃(nlp)問題。轉(zhuǎn)錄過程通常使用一組適當(dāng)?shù)亩囗検絹肀硎緺顟B(tài)、控制或兩者。隨著數(shù)值計算能力的提高,直接法在求解復(fù)雜、高度非線性的最優(yōu)控制問題上顯示出了越來越大的優(yōu)勢。
3、近年來,基于拉格朗日多項式的偽譜法成為非線性優(yōu)化問題的主流方法,偽譜法的優(yōu)點是適用性廣泛、能夠提供較高的數(shù)值精度,特別是在求解某些光滑、低維度的優(yōu)化問題時。但當(dāng)遇到狀態(tài)量和控制量急劇變化的情況時,應(yīng)用偽譜法求解問題可能會導(dǎo)致狀態(tài)量和控制量顯示出超過預(yù)期界限的振蕩。開環(huán)制導(dǎo)方法在執(zhí)行過程中缺乏對環(huán)境變化或系統(tǒng)狀態(tài)變化的實時反饋,無法及時調(diào)整導(dǎo)航策略以應(yīng)對外界干擾或系統(tǒng)誤差,可能導(dǎo)致導(dǎo)航誤差的積累。并且在面對復(fù)雜環(huán)境時靈活性和適應(yīng)性較差,難以實現(xiàn)精確的導(dǎo)航和控制,需要更加靈活和魯棒的閉環(huán)控制方法來應(yīng)對復(fù)雜情況。因此,如何設(shè)計一種求解難度低,計算效率高,具有實時性的導(dǎo)彈多約束制導(dǎo)方法是導(dǎo)彈制導(dǎo)領(lǐng)域亟待解決的問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明要解決的問題是實現(xiàn)實時性的、計算效率高的導(dǎo)彈多約束制導(dǎo)方法,提出基于伯恩斯坦基的導(dǎo)彈多約束閉環(huán)制導(dǎo)方法。
2、為實現(xiàn)上述目的,本發(fā)明通過以下技術(shù)方案實現(xiàn):
3、一種基于伯恩斯坦基的導(dǎo)彈多約束閉環(huán)制導(dǎo)方法,包括如下步驟:
4、s1.建立導(dǎo)彈和目標(biāo)的三維運動學(xué)模型,設(shè)置導(dǎo)彈和目標(biāo)的狀態(tài)變量、導(dǎo)彈和目標(biāo)的控制量;
5、s2.構(gòu)建導(dǎo)彈和目標(biāo)的狀態(tài)變量、導(dǎo)彈和目標(biāo)的控制量的貝塞爾曲線,將導(dǎo)彈的制導(dǎo)問題通過貝塞爾曲線轉(zhuǎn)化為多約束下的非線性規(guī)劃問題;
6、s3.設(shè)置基于序列二次規(guī)劃sqp算法求解步驟s2構(gòu)建的多約束下的非線性規(guī)劃問題,構(gòu)建基于伯恩斯坦基的導(dǎo)彈多約束閉環(huán)制導(dǎo)方法;
7、s4.選取n個節(jié)點進行采樣,利用步驟s2的方法將最優(yōu)控制問題通過貝塞爾曲線轉(zhuǎn)化為多約束下的非線性規(guī)劃問題,然后利用步驟s3的基于序列二次規(guī)劃sqp算法進行求解,通過在線實時生成開環(huán)控制的方式實現(xiàn)閉環(huán)反饋,得到最優(yōu)的導(dǎo)彈和目標(biāo)的控制量。
8、進一步的,步驟s1的具體實現(xiàn)方法包括如下步驟:
9、s1.1.建立導(dǎo)彈的三維運動學(xué)模型,具體表達式如下:
10、
11、其中,為導(dǎo)彈速度對于時間的變化率,g為重力加速度,v為導(dǎo)彈速度,xm,ym,zm分別為導(dǎo)彈在慣性坐標(biāo)系下的x軸、y軸、z軸的坐標(biāo),nx,ny,nz分別為導(dǎo)彈的過載矢量在彈道坐標(biāo)系在x軸、y軸、z軸的分量,θ為彈道傾角,為彈道傾角對于時間的變化率,為彈道偏角,為彈道偏角對于時間的變化率,為導(dǎo)彈質(zhì)量對于時間的變化率,m為導(dǎo)彈質(zhì)量,mc為燃料質(zhì)量秒流量,分別為導(dǎo)彈在慣性坐標(biāo)系下的x軸、y軸、z軸的坐標(biāo)對于時間的變化率;
12、nx,ny,nz的表達式如下:
13、
14、
15、其中,p為導(dǎo)彈發(fā)動機推力,x為氣動阻力,y為升力,z為側(cè)向力,α和β分別為導(dǎo)彈的攻角和側(cè)滑角;
16、x,y,z與動壓和導(dǎo)彈的特征面積成正比,具體表達式如下:
17、x=cxqs
18、y=cyqs
19、z=czqs
20、
21、其中,cx,cy,cz分別為氣動阻力系數(shù)、升力系數(shù)、側(cè)向力系數(shù),s為導(dǎo)彈的特征面積,q為作用在導(dǎo)彈上的空氣動力與來流的動壓,ρ為導(dǎo)彈所處高度的空氣密度;
22、s1.2.建立目標(biāo)的非機動目標(biāo)的三維運動學(xué)模型,具體表達式如下:
23、
24、其中,為彈道傾角對于時間的變化率,vt為目標(biāo)的速度,xt,yt,zt為目標(biāo)在慣性坐標(biāo)系下的x軸、y軸、z軸的坐標(biāo),θt為彈道傾角,為彈道偏角,為彈道偏角對于時間的變化率,為目標(biāo)的過載在彈道坐標(biāo)系y下的分量,為目標(biāo)的過載在彈道坐標(biāo)系z下的分量,為目標(biāo)在慣性坐標(biāo)系下的x軸、y軸、z軸的坐標(biāo)對于時間的變化率;
25、s1.3.建立導(dǎo)彈的建立非線性最優(yōu)控制模型,包括約束條件、優(yōu)化指標(biāo)、最優(yōu)問題描述;
26、s1.3.1.約束條件包括導(dǎo)彈的質(zhì)量約束,過載約束以及終端約束;
27、基于導(dǎo)彈在初制導(dǎo)階段導(dǎo)彈的質(zhì)量會隨著發(fā)動機燃料的消耗而減小,在發(fā)動機停止運行后導(dǎo)彈的質(zhì)量保持不變,設(shè)置導(dǎo)彈的質(zhì)量約束的具體表達式如下:
28、
29、其中,為發(fā)動機停止運行的時間,mc0為發(fā)動機運行時間內(nèi)燃料質(zhì)量秒流量;
30、設(shè)置導(dǎo)彈在彈道坐標(biāo)系下各過載分量的約束為:
31、|nx|≤nxmax
32、|ny|≤nymax
33、|nz|≤nzmax
34、其中,nxmax,nymax,nzmax分別為導(dǎo)彈的過載矢量在彈道坐標(biāo)系在x軸、y軸、z軸的分量絕對值的最大值;
35、基于導(dǎo)彈可容許的最大脫靶量為rmax,設(shè)置導(dǎo)彈的終端約束為:
36、
37、其中,tf為導(dǎo)彈完成制導(dǎo)的末時刻;
38、s1.3.2.設(shè)計導(dǎo)彈的攔截彈道時,將導(dǎo)彈的末速度作為優(yōu)化指標(biāo)j,表達式為:
39、j=min{-[v(tf)]2};
40、s1.3.3.將最優(yōu)問題描述為導(dǎo)彈和目標(biāo)的狀態(tài)變量、導(dǎo)彈和目標(biāo)的控制量,表達式為:
41、
42、d(x,u,t)≤0
43、x(t0)=x0
44、其中,x(t)為導(dǎo)彈和目標(biāo)的狀態(tài)變量,u(t)為導(dǎo)彈和目標(biāo)的過載,t0表示初始時刻,x0為導(dǎo)彈和目標(biāo)的狀態(tài)變量的初始值;d(x,u,t)為不等式約束;
45、
46、
47、進一步的,步驟s2的具體實現(xiàn)方法包括如下步驟:
48、s2.1.設(shè)置貝塞爾曲線是由一組控制點和伯恩斯坦基函數(shù)生成的曲線,其中n階的伯恩斯坦基多項式bi,n定義為:
49、
50、s2.2.由于求積節(jié)點τ定義在[-1,1]區(qū)間內(nèi),因此伯恩斯坦多項式在[-1,1]區(qū)間內(nèi)重新定義,得到表達式為:
51、
52、s2.3.選取步驟s2.2定義的伯恩斯坦多項式作為插值基函數(shù),將導(dǎo)彈和目標(biāo)的狀態(tài)變量x(t)以及導(dǎo)彈和目標(biāo)的控制量u(t)轉(zhuǎn)化貝塞爾曲線,表達式為:
53、
54、其中,xj(t),uj(t)分別為時域[tj,tj+1]上的狀態(tài)變量和控制量,xsj,usj為求積節(jié)點處的函數(shù)值,xj(τ),uj(τ)為狀態(tài)變量、控制量對應(yīng)的貝塞爾曲線。
55、進一步的,步驟s3中的基于序列二次規(guī)劃sqp算法的具體實現(xiàn)方法包括如下步驟:
56、s3.1.將狀態(tài)變量xk和控制量uk構(gòu)成新的狀態(tài)向量表達式為:
57、
58、采集計算的新的狀態(tài)向量初值以及新的狀態(tài)向量初值對應(yīng)的初始正定矩陣h1,令k=1,設(shè)置計算精度值為ε:設(shè)置0<ε<δ,δ為信賴半徑;
59、s3.2.求解二次規(guī)劃子問題:
60、s3.2.1.根據(jù)求解結(jié)果更新主迭代搜索方向d,二次規(guī)劃問題如下:
61、
62、其中,為的梯度,為最優(yōu)控制問題中的等式約束,為最優(yōu)控制問題中的不等式約束;
63、s3.2.2.設(shè)置子問題求得的近似解(dk,λk)必須滿足待求解非線性規(guī)劃問題的kkt條件,其中,dk為主搜索方向,λk為步長;
64、s3.2.3.基于步驟s3.2.1和s3.2.2的設(shè)置進行計算,然后進行條件判斷,當(dāng)||dk||≤ε時,停止計算,求得問題最優(yōu)解否則進行下一步;
65、s3.2.4.進行判斷,當(dāng)設(shè)置使用擬牛頓公式計算正定矩陣hk+1,并令k=k+1,再轉(zhuǎn)入步驟s3.2.3,否則,進行下一步;
66、s3.2.5.求解一維最優(yōu)問題得到最優(yōu)步長λk,令根據(jù)擬牛頓公式更新正定矩陣hk,得到新的正定矩陣hk+1,令k=k+1,轉(zhuǎn)到步驟s3.2.3。
67、進一步的,步驟s4的具體實現(xiàn)方法包括如下步驟:
68、s4.1.選取n個節(jié)點進行采樣,設(shè)置第一次采樣時間為t1,采集后的數(shù)據(jù)計算得到的狀態(tài)變量的初始值為x0,利用步驟s2的方法將最優(yōu)控制問題通過貝塞爾曲線轉(zhuǎn)化為多約束下的非線性規(guī)劃問題,然后利用步驟s3的基于序列二次規(guī)劃sqp算法進行求解,計算出區(qū)間[t0,t1]內(nèi)的開環(huán)最優(yōu)控制
69、s4.2.設(shè)置i=1,基于步驟s4.1得到的計算t1時刻的狀態(tài)變量為x1=x(t1);
70、s4.3.設(shè)置ti+1=ti+δt,δt為優(yōu)化計算時間,在區(qū)間[ti,ti+1]內(nèi),以xi為初值,將作用于[ti,ti+1],計算然后基于得到的計算xi+1,t∈[ti,tf];
71、s4.4.重復(fù)迭代步驟s4.3,直到t為導(dǎo)彈完成制導(dǎo)的末時刻,實現(xiàn)導(dǎo)彈多約束閉環(huán)制導(dǎo)。
72、本發(fā)明的有益效果:
73、本發(fā)明所述的一種基于伯恩斯坦基的導(dǎo)彈多約束閉環(huán)制導(dǎo)方法,解決了傳統(tǒng)開環(huán)控制無法實時反饋的問題,通過連續(xù)開環(huán)控制實現(xiàn)閉環(huán)制導(dǎo),可以實時系統(tǒng)狀態(tài)變化等情況做出反饋,從而實現(xiàn)對各個時間段的最優(yōu)控制。當(dāng)外界環(huán)境發(fā)生改變時,能夠?qū)崟r通過新的信息重新規(guī)劃控制量,調(diào)整彈道軌跡,提高求解精度和計算效率,在實際場景中有很強的應(yīng)用性。同時,應(yīng)用伯恩斯坦基可以在狀態(tài)量和控制量發(fā)生急劇變化時消除吉布斯現(xiàn)象,實現(xiàn)貝塞爾曲線平滑。