本發(fā)明涉及理療機(jī)器人,特別涉及一種改進(jìn)的路徑優(yōu)化算法和光學(xué)理療機(jī)器人。
背景技術(shù):
1、在現(xiàn)代醫(yī)療治療中,光學(xué)理療因其非侵入性和治療效果被廣泛應(yīng)用于疼痛緩解和組織修復(fù)等方面。光學(xué)理療機(jī)器人利用紅外光、激光等特定波長的光源,自動定位并精確照射到患者的病變部位,從而提供有效的治療。然而,現(xiàn)有的光學(xué)理療機(jī)器人在自動路徑規(guī)劃和照射精度方面存在明顯不足,如機(jī)器人無法總是精確定位到病理部位或關(guān)鍵穴位,導(dǎo)致治療效果不理想,尤其在處理復(fù)雜或動態(tài)變化的治療環(huán)境時更加顯著。
2、目前普遍使用的路徑優(yōu)化算法,如基本的粒子群優(yōu)化算法,雖然在多個領(lǐng)域表現(xiàn)出一定的效果,但在光學(xué)理療應(yīng)用中往往因計算復(fù)雜度高、響應(yīng)速度慢、參數(shù)調(diào)整不靈活而無法滿足高精度和高效率的治療需求。
3、因此,本發(fā)明提出一種改進(jìn)的路徑優(yōu)化算法,應(yīng)用于光學(xué)理療機(jī)器人的路徑規(guī)劃中,通過整合深度強(qiáng)化學(xué)習(xí)的自適應(yīng)調(diào)參能力和粒子群優(yōu)化的全局搜索能力,創(chuàng)新性地解決了路徑規(guī)劃的精度和響應(yīng)速度問題,顯著提高了理療路徑規(guī)劃的效率和精度。
技術(shù)實現(xiàn)思路
1、針對現(xiàn)有技術(shù)中的這些不足,本發(fā)明提出了一種改進(jìn)的路徑優(yōu)化算法和光學(xué)理療機(jī)器人,通過結(jié)合dqn與粒子群優(yōu)化pso算法,并將其應(yīng)用到光學(xué)理療機(jī)器人中,能夠自動識別和定位理療區(qū)域及經(jīng)絡(luò)點,提高理療過程的精準(zhǔn)性和自動化水平。
2、本發(fā)明提出一種改進(jìn)的路徑優(yōu)化算法,該算法通過引入深度q網(wǎng)絡(luò)改進(jìn)粒子群優(yōu)化算法,實現(xiàn)對機(jī)器人的高精度和自適應(yīng)路徑規(guī)劃。
3、優(yōu)選地,所述改進(jìn)的路徑優(yōu)化算法的核心在于利用dqn的學(xué)習(xí)和預(yù)測能力,動態(tài)調(diào)整pso算法中的參數(shù),以優(yōu)化路徑規(guī)劃過程中的搜索效率和響應(yīng)速度。此方法的具體步驟如下:
4、s1:收集數(shù)據(jù)用于定義pso算法中的初始粒子位置,同時作為dqn模型輸入的狀態(tài)信息;
5、s2:初始化粒子群和dqn模型,用于后續(xù)的參數(shù)調(diào)整學(xué)習(xí);
6、s3:dqn學(xué)習(xí)調(diào)整;
7、s4:根據(jù)dqn選擇的動作,更新pso參數(shù),以控制粒子的運(yùn)動軌跡和搜索策略;
8、s5:路徑優(yōu)化,使用調(diào)整后的pso參數(shù)執(zhí)行粒子群優(yōu)化,更新粒子的速度和位置,以找到最優(yōu)路徑;
9、s6:機(jī)械臂按照計算的最優(yōu)路徑移動,并收集關(guān)于移動效果和環(huán)境的反饋數(shù)據(jù);
10、s7:對dqn模型進(jìn)行持續(xù)更新,基于每次路徑執(zhí)行的實際結(jié)果和環(huán)境反饋數(shù)據(jù)進(jìn)行迭代學(xué)習(xí)。此過程中,模型參數(shù)通過使用adam優(yōu)化器不斷調(diào)整。通過這種持續(xù)的迭代優(yōu)化,確保機(jī)器人在未來操作中能夠?qū)崟r調(diào)整其路徑規(guī)劃,以適應(yīng)環(huán)境的變化并優(yōu)化治療效果。
11、進(jìn)一步地,步驟s2中所述pso算法啟動時,首先需要初始化一群粒子,每個粒子代表機(jī)械臂的一條潛在路徑。粒子的每個初始位置 x i表示一種特定的狀態(tài)或解決方案,初始速度 v i決定了粒子探索空間的速度和方向。
12、
13、或小隨機(jī)值
14、其中 x start是起始位置,δ是初始化區(qū)間,提供足夠的多樣性。
15、dqn模型用于動態(tài)優(yōu)化pso中的關(guān)鍵參數(shù):慣性權(quán)重 w,個體學(xué)習(xí)因子? c1,和社會學(xué)習(xí)因子 c2。dqn模型的參數(shù)(權(quán)重和偏置)在這一步被隨機(jī)初始化或加載預(yù)訓(xùn)練的權(quán)重。
16、優(yōu)選的,步驟s3中所述dqn學(xué)習(xí)調(diào)整包括:
17、s31:定義狀態(tài)向量,包括當(dāng)前粒子的位置、速度、歷史最佳位置和全局最佳位置;
18、s32:設(shè)置基于路徑質(zhì)量的獎勵函數(shù),根據(jù)路徑接近目標(biāo)的程度和平滑性給予正或負(fù)的獎勵;
19、s33:dqn根據(jù)當(dāng)前狀態(tài)向量預(yù)測pso參數(shù)的最佳調(diào)整,包括調(diào)整慣性權(quán)重、個體學(xué)習(xí)因子和社會學(xué)習(xí)因子的值。
20、進(jìn)一步地,步驟s31中所述定義狀態(tài)向量,包括:當(dāng)前粒子的位置 x i,粒子的速度 v i,歷史最佳位置 p best,i,全局最佳位置 g best。
21、進(jìn)一步地,步驟s32中所述定義獎勵機(jī)制:獎勵函數(shù)? r?基于路徑的質(zhì)量,如接近目標(biāo)的程度和路徑的平滑性。如果新路徑 x i? t+1改善了接近目標(biāo)的距離,獎勵為正;如果路徑導(dǎo)致與目標(biāo)距離增加,獎勵為負(fù)。
22、
23、||·||表示歐幾,里得距離,sign(·)是符號函數(shù),它根據(jù)距離減少或增加返回+1或-1。
24、進(jìn)一步地,步驟s33中所述dqn根據(jù)當(dāng)前狀態(tài)預(yù)測最佳的pso參數(shù)調(diào)整。dqn預(yù)測的每個動作對應(yīng)于一組pso參數(shù)的調(diào)整方案。這一動作通常包括調(diào)整 w, c1?, c2的值。dqn模型通過試錯學(xué)習(xí)這些參數(shù)的最佳設(shè)置,優(yōu)化長期的路徑規(guī)劃效果。動作可以是增加慣性權(quán)重,減少個體學(xué)習(xí)因子。
25、
26、進(jìn)一步地,步驟s4中所述根據(jù)dqn選擇的動作更新pso參數(shù), w是控制粒子速度的保持, c1控制粒子向個人歷史最優(yōu)位置的吸引力, c2控制粒子向全局最優(yōu)位置的吸引力。
27、
28、
29、
30、其中, f w, f c1, f c2是根據(jù)dqn動作調(diào)整pso參數(shù)的函數(shù)。
31、進(jìn)一步地,步驟s5中所述路徑優(yōu)化,使用調(diào)整后的pso參數(shù)執(zhí)行粒子群優(yōu)化,更新粒子的速度 v i? t+1和位置 x i? t+1。
32、
33、
34、計算新的適應(yīng)度值,這將作為獎勵反饋到dqn,幫助其學(xué)習(xí)哪些參數(shù)調(diào)整最有效。
35、
36、通過以上方法,機(jī)器人在進(jìn)行理療操作時,能夠精確定位治療區(qū)域并實時適應(yīng)環(huán)境變化,如患者體位變動或其他環(huán)境因素的變化。配合dqn對pso參數(shù)的實時調(diào)整,不僅優(yōu)化了路徑規(guī)劃,而且有效避開了環(huán)境中的障礙物,增強(qiáng)了治療過程的安全性。
37、本發(fā)明還提出一種基于改進(jìn)的路徑優(yōu)化算法的光學(xué)理療機(jī)器人,機(jī)器人通過高精度掃描裝置所獲得的數(shù)據(jù),采用上述路徑優(yōu)化算法進(jìn)行機(jī)械臂路徑操作,確保光源準(zhǔn)確照射到理療部位。
38、機(jī)器人包括移動底座、外殼、多軸機(jī)械臂、高精度掃描裝置、經(jīng)絡(luò)識別模塊、復(fù)合光源模塊和控制系統(tǒng);
39、移動底座:配備有驅(qū)動裝置,該驅(qū)動裝置包括多個電動輪和至少一個電機(jī),通過預(yù)設(shè)控制指令使機(jī)器人自動移動到指定的理療區(qū)域,實現(xiàn)復(fù)雜路徑的精確導(dǎo)航;
40、外殼:設(shè)置在移動底座上,保護(hù)內(nèi)部機(jī)械部件并提高設(shè)備的耐用性和安全性;
41、多軸機(jī)械臂:安裝在移動底座上,設(shè)計使其能根據(jù)理療需求自動調(diào)整伸展角度和長度,以適應(yīng)不同的理療區(qū)域,配備高精度伺服電機(jī),提供靈活的移動能力和精確的位置定位;
42、高精度掃描裝置:采用光學(xué)成像技術(shù),自動識別并定位理療區(qū)域、經(jīng)絡(luò)點和穴位,生成高精度圖像數(shù)據(jù)供理療使用;
43、經(jīng)絡(luò)識別模塊:利用紅外成像技術(shù)精確映射經(jīng)絡(luò)路徑和主要穴位,與掃描裝置和復(fù)合光源模塊緊密集成,實現(xiàn)自動調(diào)整照射位置和參數(shù);
44、復(fù)合光源模塊:安裝于多軸機(jī)械臂的輸出端,發(fā)出包括激光和紅外光的光線,具備調(diào)節(jié)機(jī)制以改變光線的強(qiáng)度和波長,針對深層組織進(jìn)行理療;
45、控制系統(tǒng):整合和協(xié)調(diào)所有關(guān)鍵組件的操作,包括驅(qū)動裝置、機(jī)械臂、光源模塊、掃描裝置和經(jīng)絡(luò)識別模塊,結(jié)合深度q網(wǎng)絡(luò)與粒子群優(yōu)化算法,動態(tài)調(diào)整路徑規(guī)劃以適應(yīng)臨床環(huán)境的變化。
46、優(yōu)選地,所述多軸機(jī)械臂,本發(fā)明采用六自由度機(jī)械臂,最大臂展達(dá)705mm。并根據(jù)所述的路徑優(yōu)化算法優(yōu)化機(jī)械臂的移動路徑,動態(tài)調(diào)整機(jī)械臂各關(guān)節(jié)的運(yùn)動軌跡和速度,確保它可以精確地到達(dá)指定的理療區(qū)域。
47、優(yōu)選地,所述高精度掃描裝置,捕獲的三維圖像數(shù)據(jù)用于定義機(jī)械臂的初始路徑和終點位置。這些數(shù)據(jù)作為dqn模型的輸入,幫助算法預(yù)測和優(yōu)化機(jī)械臂的運(yùn)動路徑。
48、優(yōu)選地,所述經(jīng)絡(luò)識別模塊與高精度掃描裝置協(xié)同工作,識別人體的經(jīng)絡(luò)點和穴位。所述的路徑優(yōu)化算法利用這些定位信息來精確調(diào)整機(jī)械臂的路徑,確保光源模塊能準(zhǔn)確照射到這些特定點。
49、優(yōu)選地,所述復(fù)合光源模塊通過機(jī)械臂移動進(jìn)行位置調(diào)整,確保光療能量正確地投放到治療區(qū)域。
50、優(yōu)選地,所述控制系統(tǒng)包含所述的路徑優(yōu)化算法,處理來自掃描裝置和經(jīng)絡(luò)識別模塊的輸入,優(yōu)化治療參數(shù),在控制機(jī)械臂運(yùn)動的同時不斷調(diào)整各組件的行為以適應(yīng)治療過程中的動態(tài)變化。
51、經(jīng)由上述的技術(shù)方案可知,與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:
52、本發(fā)明提出的一種改進(jìn)的路徑優(yōu)化算法和光學(xué)理療機(jī)器人減少了對理療人員依賴,降低了人力成本。使得理療機(jī)構(gòu)能在同一工作時間內(nèi)服務(wù)更多的用戶,在提升服務(wù)質(zhì)量的同時,增強(qiáng)了經(jīng)濟(jì)效益。
53、通過引入dqn優(yōu)化pso算法,本發(fā)明實現(xiàn)了對光學(xué)理療機(jī)器人理療路徑的高精度規(guī)劃。精確的路徑規(guī)劃使得理療光線可以精確照射到患者的病理部位,增強(qiáng)治療效果,減少周圍健康組織的輻射風(fēng)險。
54、本發(fā)明的改進(jìn)的路徑優(yōu)化算法允許機(jī)器人在實時監(jiān)測到患者體位變化或其他環(huán)境變動時,動態(tài)調(diào)整理療路徑。還通過自動避開關(guān)鍵組織和障礙物,減少了操作過程中的意外風(fēng)險。這種自適應(yīng)能力顯著提高了機(jī)器人在復(fù)雜臨床環(huán)境中的實用性、有效性和安全性。