日本国产欧美大码a视频,亚洲美女久久,人人爱人人搞,亚洲18在线观看,aaa少妇高潮大片免费下载,日日干夜夜草,99免费在线观看

一種基于多時間尺度注意力機(jī)制的云邊協(xié)同工業(yè)無線信道預(yù)測方法

文檔序號:42298053發(fā)布日期:2025-06-27 18:37閱讀:5來源:國知局
本發(fā)明涉及無線通訊的,尤其涉及一種工業(yè)無線信道預(yù)測方法。
背景技術(shù)
::1、2、傳統(tǒng)的深度學(xué)習(xí)方法(如cnn、lstm),例如申請?zhí)枮?02211281296.x的發(fā)明公開了一種無線網(wǎng)絡(luò)信道狀態(tài)預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)。盡管在某些應(yīng)用中取得了良好的效果,但在異構(gòu)環(huán)境下存在兩個問題。第一,現(xiàn)有模型難以有效區(qū)分los與nlos場景的信道的共性與差異,導(dǎo)致泛化性能受限。多任務(wù)學(xué)習(xí)(mtl)雖通過共享特征提升異構(gòu)建模能力,但其多目標(biāo)優(yōu)化過程復(fù)雜,難以在資源受限的環(huán)境中部署。第二,傳統(tǒng)深度學(xué)習(xí)模型缺乏實(shí)時調(diào)整機(jī)制,面對信道狀態(tài)的劇烈波動時,魯棒性和適應(yīng)性不足。3、隨著云計(jì)算和邊緣計(jì)算的發(fā)展,云邊協(xié)同架構(gòu)作為一種有效的解決方案,逐漸應(yīng)用于工業(yè)無線信道的預(yù)測任務(wù)。云服務(wù)器主要負(fù)責(zé)處理全局特征建模和復(fù)雜數(shù)據(jù)計(jì)算,分析信道的全局模式和長期趨勢;邊緣計(jì)算節(jié)點(diǎn)則負(fù)責(zé)近實(shí)時的數(shù)據(jù)處理和短期動態(tài)的預(yù)測,以降低通信延遲和計(jì)算負(fù)載。然而,現(xiàn)有的云邊協(xié)同架構(gòu)仍存在一些不足,尤其是在任務(wù)調(diào)度策略上,傳統(tǒng)的靜態(tài)調(diào)度和啟發(fā)式方法往往難以適應(yīng)信道狀態(tài)的動態(tài)變化,導(dǎo)致在實(shí)時性和預(yù)測精度之間難以取得理想的平衡。4、為了解決這一問題,近年來,深度強(qiáng)化學(xué)習(xí)(drl)方法在多任務(wù)優(yōu)化和資源調(diào)度方面得到了廣泛應(yīng)用。drl通過動態(tài)決策優(yōu)化,能夠適應(yīng)復(fù)雜的工業(yè)環(huán)境。然而,現(xiàn)有的基于drl的調(diào)度方法大多數(shù)專注于單一目標(biāo)的優(yōu)化(如最小化延遲),缺乏能夠有效處理多目標(biāo)(如延遲和預(yù)測精度)之間的沖突的機(jī)制,限制了其在工業(yè)環(huán)境中的應(yīng)用。5、為了彌補(bǔ)以上信道預(yù)測的精度與預(yù)測任務(wù)延遲的不足,需要設(shè)計(jì)一種更適用于實(shí)際工業(yè)場景,且具有更好泛化性以及高精度、低延遲的工業(yè)無線信道預(yù)測方法。技術(shù)實(shí)現(xiàn)思路1、針對現(xiàn)有方法在工業(yè)無線信道的預(yù)測中存在精度低、延遲高的技術(shù)問題,本發(fā)明提出一種基于多時間尺度注意力機(jī)制的云邊協(xié)同工業(yè)無線信道預(yù)測方法,將以多時間尺度注意力模型為核心的預(yù)測模型部署于設(shè)計(jì)的云邊協(xié)同工業(yè)無線信道預(yù)測架構(gòu)中,利用多目標(biāo)動態(tài)信道預(yù)測任務(wù)調(diào)度算法對預(yù)測任務(wù)進(jìn)行智能分配,實(shí)現(xiàn)在云端和邊緣端之間動態(tài)平衡預(yù)測精度和延遲。2、為了達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:3、一種基于多時間尺度注意力機(jī)制的云邊協(xié)同工業(yè)無線信道預(yù)測方法,包括以下步驟:4、s1、建立包括一臺云服務(wù)器、至少一臺與云服務(wù)器通信的邊緣服務(wù)器,以及至少一個與邊緣服務(wù)器通信的工業(yè)終端設(shè)備的云邊協(xié)同工業(yè)無線信道預(yù)測架構(gòu);5、s2、基于雙深度q網(wǎng)絡(luò)和時序加權(quán)注意力機(jī)制,建立多目標(biāo)動態(tài)信道預(yù)測任務(wù)調(diào)度算法并部署在邊緣服務(wù)器;建立基于多時間尺度注意力機(jī)制的云邊協(xié)同工業(yè)無線信道預(yù)測模型,包括部署在云服務(wù)器的云端預(yù)測模型和部署在邊緣服務(wù)器的邊緣預(yù)測模型;6、s3、工業(yè)終端設(shè)備實(shí)時采集信道數(shù)據(jù)并基于信道特性將信道數(shù)據(jù)標(biāo)記為los或nlos場景數(shù)據(jù),將標(biāo)記后的信道數(shù)據(jù)上傳至邊緣服務(wù)器;7、s4、邊緣服務(wù)器接收到工業(yè)終端設(shè)備上傳的標(biāo)記后的信道數(shù)據(jù)后,通過多目標(biāo)動態(tài)信道預(yù)測任務(wù)調(diào)度算法進(jìn)行信道預(yù)測任務(wù)分配;若信道預(yù)測任務(wù)被分配給邊緣服務(wù)器,則邊緣服務(wù)器將標(biāo)記后的信道數(shù)據(jù)輸入邊緣預(yù)測模型,得到信道狀態(tài)預(yù)測結(jié)果;若信道預(yù)測任務(wù)被分配給云服務(wù)器,則邊緣服務(wù)器將標(biāo)記后的信道數(shù)據(jù)上傳至云服務(wù)器,云服務(wù)器通過云端預(yù)測模型獲得信道狀態(tài)預(yù)測結(jié)果。8、進(jìn)一步,在建立多目標(biāo)動態(tài)信道預(yù)測任務(wù)調(diào)度算法前,需獲取基于多目標(biāo)動態(tài)信道預(yù)測任務(wù)調(diào)度的馬爾可夫決策模型,方法為:對狀態(tài)空間和邊緣服務(wù)器的動作空間建模;建立綜合考慮信道預(yù)測精度與信道預(yù)測任務(wù)延遲的獎勵函數(shù);9、所述對狀態(tài)空間和邊緣服務(wù)器的動作空間建模包括如下步驟:10、在時隙t內(nèi),系統(tǒng)狀態(tài)由邊緣服務(wù)器的負(fù)載、網(wǎng)絡(luò)帶寬、數(shù)據(jù)量和傳輸時延構(gòu)成;11、智能體選擇的動作at={0,1},其中,動作at=0表示信道預(yù)測任務(wù)分配至邊緣服務(wù)器,動作at=1表示信道預(yù)測任務(wù)分配至云服務(wù)器,當(dāng)邊緣服務(wù)器的負(fù)載lt大于等于邊緣服務(wù)器的負(fù)載上限lmax時,信道預(yù)測任務(wù)僅上傳至云服務(wù)器,此時動作at=1,其中,lmax表示邊緣服務(wù)器的負(fù)載上限;12、所述建立綜合考慮信道預(yù)測精度與信道預(yù)測任務(wù)延遲的獎勵函數(shù)的方法為:建立在時隙t內(nèi)的延遲獎勵;建立在時隙t內(nèi)的誤差獎勵;綜合延遲獎勵與誤差獎勵,得到獎勵函數(shù)。13、進(jìn)一步,所述系統(tǒng)狀態(tài)的表達(dá)式為:st={lt,bt,ct,dt},其中,lt為邊緣服務(wù)器的負(fù)載,bt為邊緣服務(wù)器的網(wǎng)絡(luò)帶寬,ct為邊緣服務(wù)器的數(shù)據(jù)量,dt為邊緣服務(wù)器的傳輸時延;14、所述延遲獎勵的表達(dá)式為:15、16、其中,ttans表示數(shù)據(jù)傳輸延遲,tinfer表示云邊協(xié)同工業(yè)無線信道預(yù)測模型的推理延遲;所述誤差獎勵的表達(dá)式為:17、18、其中,error(st,at)表示預(yù)測誤差的具體度量;19、所述獎勵函數(shù)的表達(dá)式為:其中,α1和α2為權(quán)重系數(shù)且均大于零。20、進(jìn)一步,所述基于雙深度q網(wǎng)絡(luò)和時序加權(quán)注意力機(jī)制,建立多目標(biāo)動態(tài)信道預(yù)測任務(wù)調(diào)度算法的方法為:建立包括獨(dú)立的延遲網(wǎng)絡(luò)與誤差網(wǎng)絡(luò)的雙重深度q網(wǎng)絡(luò),并在q值計(jì)算之前引入設(shè)計(jì)的時序加權(quán)注意力機(jī)制,得到基于時序加權(quán)注意力的雙重深度q網(wǎng)絡(luò);21、所述邊緣服務(wù)器接收到工業(yè)終端設(shè)備上傳的標(biāo)記后的信道數(shù)據(jù)后,通過多目標(biāo)動態(tài)信道預(yù)測任務(wù)調(diào)度算法進(jìn)行信道預(yù)測任務(wù)分配的方法為:邊緣服務(wù)器利用基于時序加權(quán)注意力的雙重深度q網(wǎng)絡(luò),以當(dāng)前系統(tǒng)狀態(tài)st作為輸入,通過獎勵函數(shù)rt計(jì)算獎勵值,基于獎勵值通過ε-greedy策略選擇動作at,根據(jù)動作at進(jìn)行信道預(yù)測任務(wù)的分配。22、進(jìn)一步,通過設(shè)計(jì)的時序加權(quán)注意力機(jī)制,基于時序加權(quán)注意力的雙重深度q網(wǎng)絡(luò)輸出q值的方法為:23、通過獨(dú)立的延遲網(wǎng)絡(luò)與誤差網(wǎng)絡(luò)分別估計(jì)延遲q值與誤差q值24、25、其中,θl和θe分別為延遲網(wǎng)絡(luò)和誤差網(wǎng)絡(luò)的參數(shù);26、通過設(shè)計(jì)的時序加權(quán)注意力機(jī)制動態(tài)調(diào)整延遲q值和誤差q值的權(quán)重,基于歷史的上下文向量和平均獎勵信號通過gru模塊,生成動態(tài)權(quán)重其中,和分別為平均延遲和平均誤差,和分別表示延遲和誤差的權(quán)重;27、將動態(tài)權(quán)重與當(dāng)前時隙的上下文向量vt逐元素相乘,得到加權(quán)上下文向量并與延遲q值和誤差q值結(jié)合輸入多頭注意力機(jī)制來捕捉短期與長期依賴特性,然后拼接多頭注意力機(jī)制的輸出并通過全連接層生成綜合q值qt。28、進(jìn)一步,所述云端預(yù)測模型由多時間尺度注意層、任務(wù)特定分支層和輸出層依次連接組成;所述邊緣預(yù)測模型由多時間尺度注意層和輸出層依次連接組成;云端預(yù)測模型和邊緣預(yù)測模型中的多時間尺度注意層相同;29、所述多時間尺度注意層由變量選擇網(wǎng)絡(luò)、lstm編碼器、gate和add&norm層ⅰ、門控殘差網(wǎng)絡(luò)ⅰ、多尺度局部自注意力網(wǎng)絡(luò)、gate和add&norm層ⅱ、以及門控殘差網(wǎng)絡(luò)ⅱ依次連接組成。30、進(jìn)一步,所述云端預(yù)測模型和邊緣預(yù)測模型均通過多時間尺度注意層從標(biāo)記后的信道數(shù)據(jù)中提取多時間尺度特征,包括以下步驟:31、先將標(biāo)記后的信道數(shù)據(jù)組織為滑動窗口時間序列,滑動窗口時間序列被送入對應(yīng)的變量選擇網(wǎng)絡(luò),經(jīng)變量選擇網(wǎng)絡(luò)處理后,得到滑動窗口時間序列中每個特征向量的加權(quán)特征,進(jìn)而得到滑動窗口時間序列的加權(quán)特征矩陣;32、滑動窗口時間序列的加權(quán)特征矩陣輸入lstm編碼器進(jìn)行時序依賴特征的提取,得到隱藏狀態(tài)序列;33、對隱藏狀態(tài)序列進(jìn)行隨機(jī)失活操作,生成稀疏化的狀態(tài)序列并送入gate和add&norm層ⅰ,得到門控狀態(tài)序列;34、通過門控殘差網(wǎng)絡(luò)ⅰ對門控狀態(tài)序列進(jìn)一步進(jìn)行特征提取,生成輸入至多尺度局部自注意力網(wǎng)絡(luò)的特征,經(jīng)多尺度局部自注意力網(wǎng)絡(luò)處理后,得到多時間尺度特征矩陣;35、多時間尺度特征矩陣經(jīng)過gate和add&norm層ⅱ、門控殘差網(wǎng)絡(luò)ⅱ依次處理后,得到多時間尺度特征。36、進(jìn)一步,在邊緣預(yù)測模型中,多時間尺度特征被傳入輸出層,在輸出層中將多時間尺度特征映射為信道狀態(tài)預(yù)測結(jié)果,得到未來t個預(yù)測時間步長的信道狀態(tài)預(yù)測序列37、進(jìn)一步,在云端預(yù)測模型中,多時間尺度特被傳遞給任務(wù)特定分支層,分別針對los和nlos場景進(jìn)行特性提?。?8、對于los場景,通過lstm層ⅰ、門控殘差網(wǎng)絡(luò)ⅲ、lstm層ⅱ依次對多時間尺度特征進(jìn)行特征提取,得到長期全局特征o′為多時間尺度特征,k為窗口長度,dh為隱藏層維度,grn為門控殘差網(wǎng)絡(luò)操作,lstm為長短期記憶網(wǎng)絡(luò)操作;39、對于nlos場景,通過一維卷積網(wǎng)絡(luò)ⅰ、門控殘差網(wǎng)絡(luò)ⅳ、一維卷積網(wǎng)絡(luò)ⅱ依次對多時間尺度特征進(jìn)行特征提取,得到局部特征conv-1d為一維卷積操作;40、通過門控機(jī)制融合將長期全局特征與局部特征進(jìn)行融合,融合過程如下:41、glos=σ(wloshlos+blos)42、hfusion=glos⊙hlos+(1-glos)⊙hnlos43、其中,wlos和blos分別是門控單元的權(quán)重和偏置,glos為門控值,σ(·)為sigmoid激活函數(shù),hfusion為融合后的特征矩陣;44、融合后的特征矩陣hfusion被傳遞給輸出層,得到未來t個預(yù)測時間步長的信道狀態(tài)預(yù)測序列45、進(jìn)一步,所述邊緣預(yù)測模型通過淺層參數(shù)共享機(jī)制與云端預(yù)測模型共享多時間尺度注意力層的參數(shù),邊緣預(yù)測模型通過淺層參數(shù)更新機(jī)制進(jìn)行多時間尺度注意力層的參數(shù)更新:46、(1)淺層參數(shù)共享機(jī)制中,來自云端預(yù)測模型共享的多時間尺度注意力層參數(shù)θshared被卸載到邊緣服務(wù)器,替換邊緣預(yù)測模型中多時間尺度注意力層的參數(shù)集,邊緣預(yù)測模型的參數(shù)表示為:47、θedge-pm={θshared,θadjustable}48、其中,θadjustable表示邊緣預(yù)測模型的特定參數(shù),共享的多時間尺度注意力層參數(shù)被凍結(jié),僅需訓(xùn)練θadjustable部分以適配邊緣服務(wù)器的特定任務(wù)需求;49、(2)淺層參數(shù)更新機(jī)制中,當(dāng)邊緣服務(wù)器收集的實(shí)時數(shù)據(jù)達(dá)到設(shè)定容量時,數(shù)據(jù)將被上傳至云服務(wù)器,云服務(wù)器對云端預(yù)測模型的多時間尺度注意力層參數(shù)進(jìn)行微調(diào),并共享至邊緣服務(wù)器。50、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果:51、1、本發(fā)明綜合考慮了工業(yè)無線信道環(huán)境的復(fù)雜性和高動態(tài)性,基于數(shù)據(jù)驅(qū)動的深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí),建立了基于分層智能調(diào)度的云邊協(xié)同工業(yè)無線信道預(yù)測架構(gòu)。具有較高精度和低延遲。52、2、本發(fā)明具有較強(qiáng)的泛化性和實(shí)用性,基于多時間尺度注意力機(jī)制的云邊協(xié)同工業(yè)無線信道預(yù)測模型可解決復(fù)雜動態(tài)場景下的信道數(shù)據(jù)的異構(gòu)性等問題,彌補(bǔ)了過往算法信道預(yù)測的精度不足缺點(diǎn)。53、3、本發(fā)明具有較強(qiáng)的魯棒性,通過所設(shè)計(jì)的多目標(biāo)動態(tài)信道預(yù)測任務(wù)調(diào)度能夠適應(yīng)環(huán)境惡劣的工業(yè)場景,在實(shí)際工業(yè)應(yīng)用中,實(shí)時性強(qiáng),可靠性高。當(dāng)前第1頁12當(dāng)前第1頁12
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1