[發明專利]基于強化學習的電子電器控制方法及控制設備、存儲介質有效
| 申請號: | 202010416754.0 | 申請日: | 2020-05-18 |
| 公開(公告)號: | CN111338227B | 公開(公告)日: | 2020-12-01 |
| 發明(設計)人: | 劉強;許弘 | 申請(專利權)人: | 南京三滿互聯網絡科技有限公司 |
| 主分類號: | G05B15/02 | 分類號: | G05B15/02;G05B19/418;G06N20/00 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 田凌濤 |
| 地址: | 210000 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 強化 學習 電子電器 控制 方法 設備 存儲 介質 | ||
本發明涉及基于強化學習的電子電器控制方法,針對具有場景自動控制功能的電子電器,應用強化學習控制策略,通過獲取用戶不斷對電子電器設備的干預控制作為強化學習的決策輸入,動態生成適應用戶不同場景下設備自動控制的場景算法模型,獲得電子電器最為貼近用戶使用習慣的自動化工作模式的場景算法模型,提高電子電器的使用效率,并將上述所設計方法應用于各種電子電器,進而實現了全電子電器場景自動控制的自學習方式的優化更新,為智能家居、智能辦公提供了更好的場景自動控制方法。
技術領域
本發明涉及基于強化學習的電子電器控制方法及控制設備、存儲介質,屬于房屋物聯智能化技術領域。
背景技術
目前市場上大部分的智能家居系統,都是依靠“場景”和“自動化”這兩個功能來完成絕大部分的功能,控制方式主要依賴語音控制或者手機控制。雖然很多用戶覺得現在人工智能很發達,系統應該可以自己學習用戶習慣,并且能夠以家為中心自動應用場景,家庭設備與外界交互與反饋(通過設備監測自動聯動場景設備,能夠采集個人或環境信息),從而極大提升家居生活的舒適性,但是實際上,目前AI在智能家居領域的應用還不夠廣泛,智能家居基本上還是依靠場景和自動化來實現的。
強化學習(Reinforcement Learning)是機器學習里面的一個分支,善于控制一個能夠在某個環境下自主行動的個體,通過個體和環境之間的互動,不斷改進它的行為,強調如何基于環境而行動,以取得最大化的預期利益。強化學習問題包括學習如何做、如何將環境映射為行動,從而獲得最大的獎勵。在強化學習中,學習器是一個制定決策的智能體,它不會被告知該執行什么動作,而是經過反復嘗試運行,來發現能獲得最大獎勵的行為。一般情況下,行動不僅會影響當前的獎勵,而且會影響下個時間點的環境,因此也會影響后續所有的獎勵。因為學習系統的行動會影響到環境,環境又會影響后續的行動,所以從本質上講,強化學習是一個閉環控制問題。強化學習的目的就是解一個MDP(馬可夫決策過程)。具體地說,我們要將學習者和決策者(Agent)放在某個環境(Environment)中,讓它學習如何最大化獲得的總收益。
因此若能將強化學習的思想付諸于智能設備的控制上,將大大提高智能設備的場景自動化使用效率。
發明內容
本發明所要解決的技術問題是提供基于強化學習的電子電器控制方法,針對具有場景自動控制功能的電器,應用強化學習控制策略,能夠使得電子電器獲得更加貼近用戶使用習慣的自動化工作模式,提高電器工作效率。
本發明為了解決上述技術問題采用以下技術方案:本發明設計了基于強化學習的電子電器控制方法,用于針對各個具有場景自動控制功能的電器,實現各個電器的分別控制;分別針對各個電器,基于電器按其所對應各個初始自動控制場景的工作過程,針對電器如下各個狀態,實現針對電器的不同控制方法;
狀態1.電器處于未啟動狀態,若電器接收到人為開啟動作進行工作,則針對當前時間與該電器開啟動作,結合該電器所處環境對應該電器工作目的因素、在該電器啟動工作前的檢測信息,構成該電器所對應新的自動化控制場景;若電器未接收到人為開啟動作,則不做任何進一步操作;
狀態2.電器處于工作狀態中,若電器接收到人為關閉動作停止工作,則針對當前時間與該電器關閉動作,結合該電器所處環境對應該電器工作目的因素、在該電器停止工作前的檢測信息,構成該電器所對應新的自動化控制場景;若電器未接收到人為關閉動作,則針對具備工作目的因素功能可調的電器,定義電器工作目的因素為因素A,并獲得該電器在當前自動化控制場景下針對因素A的設置信息A設,然后執行如下步驟A至步驟B,以人為調整動作為干預原點,基于原點,結合環境所對應因素A的變化,改變電器自動化控制場景中的工作狀態,實現電器對應原點到環境因素忍受波動范圍的自動化控制場景的優化;
步驟A.檢測獲得該電器所處環境對應因素A的檢測信息A測,并進入步驟B;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京三滿互聯網絡科技有限公司,未經南京三滿互聯網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010416754.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:傳感器裝置以及檢測系統
- 下一篇:一種卡瓦式套管頭





