[發(fā)明專利]一種采用深度確定性策略梯度算法的5G車聯(lián)網(wǎng)V2V資源分配方法有效
| 申請?zhí)枺?/td> | 202110273529.0 | 申請日: | 2021-03-12 |
| 公開(公告)號: | CN112995951B | 公開(公告)日: | 2022-04-08 |
| 發(fā)明(設計)人: | 王書墨;宋曉勤;柴新越;繆娟娟;王奎宇 | 申請(專利權(quán))人: | 南京航空航天大學 |
| 主分類號: | H04W4/44 | 分類號: | H04W4/44;H04W4/46;H04W24/02;H04W24/06;H04W28/02 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210016*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 采用 深度 確定性 策略 梯度 算法 聯(lián)網(wǎng) v2v 資源 分配 方法 | ||
本發(fā)明提出一種基于深度確定性策略梯度(DDPG)算法的車對車(V2V)通信資源分配方法,V2V通信使用網(wǎng)絡切片技術(shù)接入5G網(wǎng)絡,利用深度強化學習優(yōu)化策略獲得最優(yōu)的V2V用戶信道分配和發(fā)射功率聯(lián)合優(yōu)化策略,V2V用戶通過選擇合適的發(fā)射功率和信道,來降低V2V鏈路之間的相互干擾,在滿足鏈路延遲約束下,最大化V2V鏈路的系統(tǒng)總吞吐量。本發(fā)明使用DDPG算法可以有效解決V2V用戶信道分配和功率選擇的聯(lián)合優(yōu)化問題,可以在一系列連續(xù)動作空間的優(yōu)化中表現(xiàn)穩(wěn)定。
技術(shù)領(lǐng)域
本發(fā)明涉及一種車聯(lián)網(wǎng)技術(shù),尤其涉及一種車聯(lián)網(wǎng)的資源分配方法,更具體地說,涉及一種采用深度確定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法的5G車聯(lián)網(wǎng)的車對車(Vehicle-to-Vehicle,V2V)通信資源分配方法。
背景技術(shù)
車聯(lián)網(wǎng)(Vehicle-to-everything,V2X)是物聯(lián)網(wǎng)(Internet of Things,IoT)在智能交通系統(tǒng)(Intelligent Transportation System,ITS)領(lǐng)域中的典型應用,它是指基于Intranet、Internet和移動車載網(wǎng)絡而形成的無處不在的智能車網(wǎng)絡。車聯(lián)網(wǎng)根據(jù)約定的通信協(xié)議和數(shù)據(jù)交互標準共享和交換數(shù)據(jù)。它通過對行人、路邊設施、車輛、網(wǎng)絡和云之間的實時感知和協(xié)作,實現(xiàn)了智能交通管理和服務,例如改善了道路安全,增強了路況感知并減少了交通擁堵。
合理的車聯(lián)網(wǎng)資源分配對于減輕干擾、提高網(wǎng)絡效率和最終優(yōu)化無線通信性能至關(guān)重要。傳統(tǒng)的資源分配方案大多利用緩慢變化的大規(guī)模衰落信道信息進行分配。有文獻提出了一種啟發(fā)式的位置相關(guān)上行鏈路資源分配方案,其特征在于空間資源重用,而不需要完整的信道狀態(tài)信息,因此減少了信令開銷。另有研究開發(fā)了包括車輛分組、復用信道選擇和功率控制的框架,可以降低V2V用戶對蜂窩網(wǎng)絡的總干擾,同時最大化V2V用戶的和速率或最小可達速率。但隨著通信量的與日俱增和通信速率需求的大幅提升,高移動性導致無線信道快速變化給資源分配帶來很大的不確定性,傳統(tǒng)的資源分配方法無法滿足人們對車聯(lián)網(wǎng)的高可靠性和低延時需求。
深度學習提供了多層計算模型,可以從非結(jié)構(gòu)化源中學習具有多級抽象的高效數(shù)據(jù)表示,為解決許多傳統(tǒng)上被認為是困難的問題提供了一種強大的數(shù)據(jù)驅(qū)動方法。基于深度強化學習算法的資源分配方案比傳統(tǒng)資源分配算法更能滿足車聯(lián)網(wǎng)的高可靠性和低延時性的要求。有文獻提出了一種可以應用于單播和廣播場景的基于深度強化學習的新型分布式車對車通信資源分配機制。根據(jù)分布的資源分配機制,智能體,即V2V鏈路或車輛不需要等待全局狀態(tài)信息就可以做出決定以找到最佳子帶和傳輸功率水平。但現(xiàn)有的基于深度強化學習的V2V資源分配算法無法滿足5G網(wǎng)絡下高帶寬、大容量、超可靠低時延等場景的差異化服務需求。
因此本發(fā)明提出的資源分配方法采用5G網(wǎng)絡切片技術(shù),能在5G網(wǎng)絡下為不同應用場景提供差異化服務,同時采用可在一系列連續(xù)動作空間的優(yōu)化中表現(xiàn)穩(wěn)定的DDPG算法進行V2V資源分配,以系統(tǒng)吞吐量最大化作為V2V資源分配的優(yōu)化目標,在復雜度和性能之間取得了很好的平衡。
發(fā)明內(nèi)容
發(fā)明目的:針對現(xiàn)有技術(shù)存在的上述問題,提出一種基于深度強化學習DDPG算法V2V用戶資源分配方法,V2V通信以網(wǎng)絡切片技術(shù)接入5G網(wǎng)絡。該方法能在V2V鏈路對V2I鏈路沒有干擾的情況下,以較低的V2V鏈路延遲實現(xiàn)系統(tǒng)吞吐量最大化的V2V用戶資源分配。
技術(shù)方案:在考慮V2V鏈路延遲的情況下,以合理的資源分配達到系統(tǒng)通信系統(tǒng)吞吐量最大化的目的。我們采用5G網(wǎng)絡切片技術(shù),V2V鏈路和V2I鏈路使用不同的切片,V2V鏈路對V2I鏈路不產(chǎn)生干擾。采用分布式的資源分配方法,不需要基站集中調(diào)度信道狀態(tài)信息,將每條V2V鏈路視為智能體,并且基于瞬時狀態(tài)信息和每個時隙從鄰居共享的信息來選擇信道和發(fā)射功率。通過建立深度強化學習模型,利用DDPG算法優(yōu)化深度強化學習模型。根據(jù)優(yōu)化后的深度強化學習模型,得到最優(yōu)的V2V用戶發(fā)射功率和信道分配策略。完成上述發(fā)明通過以下技術(shù)方案實現(xiàn):一種采用DDPG算法的基于5G網(wǎng)絡切片的V2V資源分配方法,包括步驟如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京航空航天大學,未經(jīng)南京航空航天大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202110273529.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04W 無線通信網(wǎng)絡
H04W4-00 專門適用于無線通信網(wǎng)絡的業(yè)務或設施
H04W4-02 .利用用戶或終端位置的業(yè)務
H04W4-06 .廣播選擇分發(fā);到用戶組的業(yè)務;單向選呼業(yè)務
H04W4-12 .消息傳送,例如SMS[短消息業(yè)務];郵箱;通告,例如,通知用戶通信請求的狀態(tài)或進展
H04W4-16 .與通信相關(guān)的補充業(yè)務,例如,呼叫轉(zhuǎn)移或呼叫保持
H04W4-18 .信息格式或內(nèi)容轉(zhuǎn)換,例如,為了向用戶或終端無線傳送的目的,由網(wǎng)絡對發(fā)送或接收的信息進行適應修改
- 一種計算機網(wǎng)絡策略管理系統(tǒng)及策略管理方法
- 應用于合法監(jiān)聽系統(tǒng)的網(wǎng)絡策略架構(gòu)及其策略處理方法
- 分發(fā)策略的方法、系統(tǒng)和策略分發(fā)實體
- 策略控制方法、策略規(guī)則決策設備和策略控制設備
- 用于控制QoS策略沖突的方法、設備和系統(tǒng)
- 策略融合的方法、UE及服務器
- 策略調(diào)整觸發(fā)、策略調(diào)整方法及裝置、策略調(diào)整系統(tǒng)
- 設備策略管理器
- 策略組中的策略評估、策略選擇方法及裝置
- 策略集群分發(fā)匹配方法、系統(tǒng)及計算機可讀存儲介質(zhì)





