偷拍一区二区三区_亚洲欧美日韩偷拍_亚洲第一免费网站_99精品视频在线免费观看_久久亚洲精品国产_国产成人无码一二三区视频_欧美激情xxxxx_国产精品毛片高清在线完整版_一色道久久88加勒比一_一区二区欧美久久_五月婷婷六月婷婷_国产精品成人久久久久

[發(fā)明專利]使用優(yōu)勢估計強(qiáng)化學(xué)習(xí)有效

專利信息
申請?zhí)枺?/td> 201780015574.8 申請日: 2017-02-09
公開(公告)號: CN108701251B 公開(公告)日: 2022-08-12
發(fā)明(設(shè)計)人: 顧世翔;蒂莫西·保羅·利利克拉普;伊利亞·蘇特思科韋爾;謝爾蓋·弗拉迪米爾·萊文 申請(專利權(quán))人: 谷歌有限責(zé)任公司
主分類號: G06N3/04 分類號: G06N3/04;G06N3/08
代理公司: 中原信達(dá)知識產(chǎn)權(quán)代理有限責(zé)任公司 11219 代理人: 李佳;穆德駿
地址: 美國加利*** 國省代碼: 暫無信息
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 使用 優(yōu)勢 估計 強(qiáng)化 學(xué)習(xí)
【權(quán)利要求書】:

1.一種系統(tǒng),所述系統(tǒng)包括一個或多個計算機(jī)和存儲指令的一個或多個存儲設(shè)備,所述指令在被所述一個或多個計算機(jī)執(zhí)行時能夠操作,所述系統(tǒng)被配置來使得所述一個或多個計算機(jī)執(zhí)行用于訓(xùn)練強(qiáng)化學(xué)習(xí)系統(tǒng)的策略神經(jīng)網(wǎng)絡(luò)的方法,其中,所述策略神經(jīng)網(wǎng)絡(luò)被配置來選擇來自動作的連續(xù)動作空間的待由與環(huán)境交互的代理執(zhí)行的動作,所述連續(xù)動作空間包括位于連續(xù)域上的所有可能動作集,所述方法包括:

獲得經(jīng)驗元組,所述經(jīng)驗元組識別i)表征所述環(huán)境的訓(xùn)練狀態(tài)的訓(xùn)練觀察、ii)由所述代理響應(yīng)于所述訓(xùn)練觀察而執(zhí)行的訓(xùn)練動作、iii)作為所述代理響應(yīng)于所述訓(xùn)練觀察而執(zhí)行所述訓(xùn)練動作的結(jié)果而接收的獎勵以及iv)表征所述環(huán)境的后續(xù)狀態(tài)的后續(xù)觀察;

在包括所述經(jīng)驗元組的訓(xùn)練數(shù)據(jù)上訓(xùn)練所述策略神經(jīng)網(wǎng)絡(luò),所述訓(xùn)練包括:

使用值神經(jīng)網(wǎng)絡(luò)并根據(jù)所述值神經(jīng)網(wǎng)絡(luò)的參數(shù)的當(dāng)前值來處理所述訓(xùn)練觀察以生成第一值估計,所述第一值估計是在所述環(huán)境處于由所述訓(xùn)練觀察表征的所述訓(xùn)練狀態(tài)的情況下所得到的預(yù)期回報的估計,與響應(yīng)于所述訓(xùn)練觀察而執(zhí)行哪一動作無關(guān);

將所述訓(xùn)練觀察作為輸入提供給所述策略神經(jīng)網(wǎng)絡(luò);

針對所述訓(xùn)練觀察,獲得位于所述連續(xù)域上的所述所有可能動作集中的輸出動作,作為來自所述策略神經(jīng)網(wǎng)絡(luò)并且是根據(jù)所述策略神經(jīng)網(wǎng)絡(luò)的參數(shù)的當(dāng)前值而生成的輸出;

確定在所述連續(xù)域中以下二者之間的距離:i)位于所述連續(xù)域上的所述所有可能動作集中的所述輸出動作,所述輸出動作是通過處理所述訓(xùn)練觀察而作為來自所述策略神經(jīng)網(wǎng)絡(luò)的輸出來獲得的,以及ii)由所述代理響應(yīng)于所述訓(xùn)練觀察而執(zhí)行過的所述訓(xùn)練動作;

根據(jù)在所述連續(xù)域中以下二者之間的所確定的距離生成對響應(yīng)于所述訓(xùn)練觀察而執(zhí)行的所述訓(xùn)練動作的優(yōu)勢估計:i)位于所述連續(xù)域上的所述所有可能動作集中的所述輸出動作,所述輸出動作是通過處理所述訓(xùn)練觀察而作為來自所述策略神經(jīng)網(wǎng)絡(luò)的輸出所獲得的,以及ii)由所述代理響應(yīng)于所述訓(xùn)練觀察而執(zhí)行過的所述訓(xùn)練動作;以及

通過組合對響應(yīng)于所述訓(xùn)練觀察而執(zhí)行的所述訓(xùn)練動作的所述優(yōu)勢估計和所述第一值估計來生成響應(yīng)于所述訓(xùn)練觀察而執(zhí)行的所述訓(xùn)練動作的Q值,所述第一值估計是在所述環(huán)境處于由所述訓(xùn)練觀察表征的所述訓(xùn)練狀態(tài)的情況下所得到的預(yù)期回報的估計,與響應(yīng)于所述訓(xùn)練觀察而執(zhí)行哪一動作無關(guān);

使用所述值神經(jīng)網(wǎng)絡(luò)來處理所述后續(xù)觀察以生成所述后續(xù)狀態(tài)的新值估計,所述新值估計是在所述環(huán)境處于所述后續(xù)狀態(tài)的情況下所得到的預(yù)期回報的估計;

將所述獎勵和所述新值估計組合以生成所述訓(xùn)練動作的目標(biāo)Q值;

使用以下二者之間的誤差來確定對所述策略神經(jīng)網(wǎng)絡(luò)的參數(shù)的當(dāng)前值和所述值神經(jīng)網(wǎng)絡(luò)的參數(shù)的當(dāng)前值的更新:i)使用所述輸出動作與所述訓(xùn)練動作之間的距離來生成的所述訓(xùn)練動作的Q值,以及ii)所述目標(biāo)Q值;以及

在所述訓(xùn)練之后,提供所訓(xùn)練的策略神經(jīng)網(wǎng)絡(luò)以用于控制與現(xiàn)實世界環(huán)境交互的機(jī)械代理。

2.如權(quán)利要求1所述的系統(tǒng),其中根據(jù)位于所述連續(xù)域上的所述所有可能動作集中的、能夠作為來自所述策略神經(jīng)網(wǎng)絡(luò)的輸出所獲得的所述輸出動作與由所述代理響應(yīng)于所述訓(xùn)練觀察而執(zhí)行過的所述訓(xùn)練動作之間的所確定的距離生成對響應(yīng)于所述訓(xùn)練觀察而由所述代理執(zhí)行過的所述訓(xùn)練動作的所述優(yōu)勢估計包括:

將具有狀態(tài)依賴性參數(shù)的函數(shù)應(yīng)用于位于所述連續(xù)域上的所述所有可能動作集中的、能夠作為來自所述策略神經(jīng)網(wǎng)絡(luò)的輸出所獲得的所述輸出動作與由所述代理響應(yīng)于所述訓(xùn)練觀察而執(zhí)行過的所述訓(xùn)練動作之間的所述距離。

3.如權(quán)利要求2所述的系統(tǒng),其中所述方法還包括:

由所述強(qiáng)化學(xué)習(xí)系統(tǒng)的函數(shù)參數(shù)神經(jīng)網(wǎng)絡(luò)處理所述訓(xùn)練觀察以生成定義所述狀態(tài)依賴性參數(shù)的值的輸出。

4.如權(quán)利要求3所述的系統(tǒng),其中所述優(yōu)勢估計滿足:

其中,A表示所述優(yōu)勢估計,x表示所述訓(xùn)練觀察,u表示所述訓(xùn)練動作,θ表示參數(shù),

第一項是位于所述連續(xù)域上的所述所有可能動作集中的所述輸出動作與響應(yīng)于所述訓(xùn)練觀察而執(zhí)行過的所述訓(xùn)練動作之間的所述距離的轉(zhuǎn)置,μ表示所述策略神經(jīng)網(wǎng)絡(luò),

P是具有由所述狀態(tài)依賴性參數(shù)值定義的條目的狀態(tài)依賴性參數(shù)矩陣,并且

第三項是位于所述連續(xù)域上的所述所有可能動作集中的所述輸出動作與由所述代理響應(yīng)于所述訓(xùn)練觀察而執(zhí)行過的所述訓(xùn)練動作之間的所述距離。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于谷歌有限責(zé)任公司,未經(jīng)谷歌有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.17sss.com.cn/pat/books/201780015574.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
成人午夜免费剧场| 黄色精品一二区| 国产视频自拍一区| 天天操天天爱天天爽| 久久综合九色综合97婷婷女人| 2022国产精品| 成 人 黄 色 片 在线播放| 久久久精品美女| 黄色av片三级三级三级免费看| 在线观看免费成人| 日本熟妇人妻中出| 日本一区二区三区四区| 四虎永久国产精品| 韩国成人在线视频| 91影院未满十八岁禁止入内| 午夜精品无码一区二区三区| 97国产精品视频| 国偷自拍第113页| 亚洲图片欧美日产| 亚洲最大的黄色网址| 国产偷国产偷精品高清尤物 | 五月婷婷激情网| 精品一区二区av| 成人久久久久久久| 蜜桃视频在线观看www| 91精品国产91久久| 少妇一级淫片日本| 欧美国产第二页| 日韩免费观看一区二区| 日韩精品在线第一页| 丁香激情五月少妇| 精品奇米国产一区二区三区| 色呦呦一区二区| 精品国产一区二区三区忘忧草| 美女又爽又黄视频毛茸茸| 9191精品国产综合久久久久久| 喷水视频在线观看| 欧美va天堂va视频va在线| 久久国产柳州莫菁门| 亚洲国内高清视频| 青青草原在线免费观看视频| 中文字幕亚洲一区二区三区五十路| 欧美成人精品激情在线视频| 久久精品青青大伊人av| 欧美超碰在线观看| 日产精品久久久一区二区福利| 精品久久久中文字幕人妻| 国产精品亚洲第一区| 日韩电影免费在线看| 久久久久免费网| 99精品久久久久久| 好吊妞无缓冲视频观看| 亚洲国产va精品久久久不卡综合| 不卡中文字幕在线观看| 欧美精品在线观看一区二区| 国产熟妇久久777777| 亚洲久久久久久久久久| 男人的天堂一区| 欧美怡春院一区二区三区| 日本久久一级片| 久久99精品久久久久久水蜜桃| 成人一道本在线| 国产一区二区三区乱码| 五月婷婷激情综合| mm131美女视频| 国产香蕉精品视频一区二区三区| 毛片在线免费视频| 欧洲精品毛片网站| 久久精品国产亚洲高清剧情介绍| 色一情一区二区三区四区| 亚洲国产精品精华液2区45| 一区二区xxx| 日韩欧美专区在线| www.国产高清| 亚洲一区二区三区久久| 国产欧美一区二区三区视频 | 欧美在线你懂的| 国产成人精品亚洲日本在线桃色| www.日本三级| 国产熟女一区二区三区四区| 日韩不卡一二三区| 久久成人免费观看| 欧美极品少妇xxxxⅹ裸体艺术| 日韩一区二区电影在线| 潘金莲一级淫片aaaaa| 欧美电影免费观看完整版| 国产极品在线播放| 国产日本欧美在线观看| 成人精品视频一区| 国产精品v日韩精品v在线观看| 精品国产电影一区二区| youjizz在线视频| 99蜜桃在线观看免费视频网站| 久久人人超碰精品| 性活交片大全免费看| 伊人一区二区三区久久精品| 亚洲乱码国产乱码精品精软件| 亚洲精品在线免费看| 精品久久久久久久久久久久久久 | 久久久久久国产精品mv| 国产精品久久夜| 极品白嫩的小少妇| 欧美成人免费全部观看天天性色| 日韩精品欧美精品| 可以在线看的av网站| 日韩一区二区中文字幕| 中文字幕第2页| 欧美日韩电影一区二区| 欧美午夜精品久久久久久久| 欧美伊人久久久久久久久影院 | 日韩精品黄色网| 久久久久成人精品| 免费在线观看一区二区三区| 日韩五码在线观看| 欧美mv日韩mv亚洲| 精品人妻少妇AV无码专区| 亚洲永久激情精品| 欧美中文字幕一区二区三区亚洲 | 成人情趣片在线观看免费| 久久久五月婷婷| 女尊高h男高潮呻吟| 97成人超碰免| 久久久久国产精品人| 少妇按摩一区二区三区| 国产伦精品免费视频| 亚洲欧洲av在线| 91视频青青草| 国内成+人亚洲| 欧美午夜精品久久久久久孕妇| 男人天堂2024| 超碰超碰超碰超碰超碰| 欧美sm美女调教| 天堂久久久久va久久久久| 国产三级三级看三级| 欧美另类xxx| 久久久久久9999| 亚洲 欧美 国产 另类| a级国产乱理论片在线观看99| 精品国产鲁一鲁一区二区张丽| 特黄视频免费看| 秋霞在线一区二区| 精品小视频在线| 国产一区二区三区不卡在线观看| 国产性生活毛片| 成人日韩在线电影| 狠狠干狠狠久久| 亚洲综合免费视频| 99热自拍偷拍| 色综合老司机第九色激情| 99re这里只有精品6| 69xxx免费| 免费久久久一本精品久久区| 91麻豆精品久久久久蜜臀| 欧美视频xxx| 不卡的一区二区| 成人妇女淫片aaaa视频| 欧美性猛交xxxx偷拍洗澡| 国产欧美综合视频| 在线观看免费不卡av| 日韩美女中文字幕| 欧美日韩在线视频一区| 亚洲精品一区二区三区四区| 成人精品视频一区二区| 97成人精品区在线播放| 亚洲成人综合视频| 亚洲精品网站在线| 男女无套免费视频网站动漫| 日韩av快播网址| 色综合久久九月婷婷色综合| 免费看黄色一级视频| 国产免费a级片| 国产精品99久久久久久久| 日韩欧美aaaaaa| 国产成人午夜精品5599| 免费人成年激情视频在线观看| 26uuu成人| 久久久久久久久亚洲| 五月天中文字幕一区二区| 日韩永久免费视频| 中文字幕一区二区三区人妻不卡| 日韩区国产区| 久久久av免费| 午夜亚洲福利老司机| 免费的黄色av| 人与嘼交av免费| 亚洲欧美一二三| 性亚洲最疯狂xxxx高清| 欧美性猛xxx| 久久精品噜噜噜成人av农村| 在线免费看视频| 91精品国产91久久久久麻豆 主演| 91禁国产网站| 欧美精品丝袜久久久中文字幕| 国产精品1024久久| 国产做受高潮漫动| 国产精品久久a| 成人3d动漫一区二区三区91| 亚洲免费视频网站| 一区二区三区免费观看| 日韩av午夜在线观看| 三级影片在线看| 狠狠热免费视频| 国产麻豆日韩| 久久av中文字幕| 欧美少妇性性性| 久久综合狠狠综合久久激情| 国产精品永久久久久久久久久| 国产精品久久AV无码| 91免费视频黄| 国产精品久久久久久久久男 | 国产精品初高中害羞小美女文| www.久久伊人| 一本色道久久88| 精品久久久久久久免费人妻| 国产精品区一区二区三在线播放 | 日韩中文字幕免费看| 精品国产户外野外| 亚洲精品久久区二区三区蜜桃臀| 久久精品电影一区二区| 日韩欧美精品网站| 成人激情免费电影网址| 一二三区在线播放| 久久久久久久久久久久| 青青青免费在线| 国产一区二区视频在线免费观看| 日韩最新av在线| 欧美色偷偷大香| 中文一区在线播放| 蜜桃一区二区三区在线| 日本丰满少妇做爰爽爽| 伦理片一区二区| 免费成人在线视频网站| 精品免费国产| 国产成人精品免费久久久久| 亚洲全黄一级网站| 欧美图区在线视频| 一区精品在线播放| 国产成人啪免费观看软件| 国产福利第一页| 亚洲欧美在线视频免费| 性欧美一区二区| 亚洲精品永久视频| www成人免费| 欧美性大战久久久久| 国产精品视频精品| 蜜臀久久99精品久久久无需会员 | 国产99在线|中文| yw.139尤物在线精品视频| 欧美高清一级片在线| 亚洲一区在线电影| 久久精品视频一区二区| 国产一区二区三区四| 亚洲AV午夜精品| 精品人妻一区二区三区潮喷在线 | 国产成人精品一区二区三区四区| 精品国产va久久久久久久| 国产无遮挡又黄又爽| 国产综合精品在线| 潘金莲一级淫片aaaaa| 少妇激情一区二区三区| 欧美日韩视频免费| 视频三区二区一区| 国产精品视频一区二区三区经| 国产成人精品国内自产拍免费看| 欧美老女人在线视频| 中文字幕在线国产精品| 精品一区二区三区三区| 欧美一区二区三区系列电影| 一本一道久久a久久精品| 亚洲一区在线观看免费观看电影高清 | 色婷婷亚洲一区二区三区| 亚洲精品综合在线| 国产精品久久久久久一区二区三区| 成人夜色视频网站在线观看| 国产美女精品人人做人人爽| 日韩成人精品视频| 日本不卡视频一二三区| 亚洲欧美丝袜| 天天操天天射天天舔| 在线观看www91| 天天干天天做天天操| 狠狠躁夜夜躁人人爽视频| 国产在线播放一区二区| 久久精品99北条麻妃| 欧美精品123区| 成人国产一区二区三区精品| 久久99精品国产麻豆婷婷洗澡| 手机在线精品视频| 色婷婷综合视频| 色屁屁草草影院ccyycom| 99久久精品无免国产免费| 国产乱码精品一区二区| 在线观看国产黄| 91欧美日韩麻豆精品| 国产视频一区二区三| 精品人妻无码一区二区 | 中文字幕一区二区久久人妻| 久久久久久无码午夜精品直播| 中文字幕视频网站| 中文字幕日韩经典| 99在线观看精品视频| 国 产 黄 色 大 片| 熟妇人妻av无码一区二区三区| 欧美一区二区公司| 日本中文在线一区| 久久成人羞羞网站| 国产91高潮流白浆在线麻豆| 99久久久久久| 日本一区二区三级电影在线观看 | jizz日本免费| 波多野结衣久久久久| 欧美日韩在线观看免费| 日本一区二区欧美| 亚洲一级黄色大片| 免费观看国产精品| 国内一区二区在线| av电影在线观看不卡| 亚洲欧美一区二区视频| 五月激情综合网| 欧美顶级少妇做爰| 日韩成人av在线| 美女精品视频一区| 国产精品色婷婷视频| 精品久久久久久综合日本| 亚洲第一精品区| 一区二区三区国产免费| 又黄又色的网站| 中文字幕无码日韩专区免费| 奇米777在线视频| 中文字幕一区二区三区不卡| 国产精品免费视频xxxx| 国产精品探花在线播放| 久久影院视频免费| 免费观看成人鲁鲁鲁鲁鲁视频| 国产成人免费在线视频| 亚洲欧洲另类国产综合| 91九色最新地址| 日韩成人激情视频| 51色欧美片视频在线观看| 51成人做爰www免费看网站| 视频一区免费观看| 日韩精品免费播放| 在线观看国产精品一区| 国产精品xxxx喷水欧美| 色网站免费观看| 久久日一线二线三线suv| 欧美小视频在线| 亚洲区一区二区| 国产精品一区久久久| 亚洲 国产 日韩 综合一区| 男人的天堂日韩| 东方伊人免费在线观看| 一区二区美女视频| 高清不卡在线观看| 黄色成人av网| 国产亚洲精品久久久| 国产日韩视频在线观看| 中文字幕第50页| 欧美激情 亚洲| 国产又黄又猛又粗又爽| 日韩成人dvd| 亚洲综合色自拍一区| 亚洲精品av在线| 成人xxxxx| 国产精品无码av在线播放| 国产 中文 字幕 日韩 在线| 在线免费黄色av| 国产成人午夜片在线观看高清观看| 亚洲午夜私人影院| 亚洲丝袜在线视频| 999国产视频| 美女一区二区三区视频| 曰本女人与公拘交酡| 午夜av入18在线| 中文字幕一区二区三区av| 欧美精品一区二区三区蜜桃视频 | 91精品国产精品| 视频一区二区三区免费观看| 黑人巨大猛交丰满少妇| 国产黄网在线观看| 不卡一二三区首页| 欧美日韩亚洲丝袜制服| 91精品国产91久久久久久| 亚洲精品在线观看免费| 插吧插吧综合网| 国模私拍视频在线| 亚洲三级在线免费观看| 亚洲人成毛片在线播放| 国产精品久久亚洲7777| 日韩av在线中文| 亚洲大尺度在线观看| www亚洲一区| 日韩av在线直播| 福利视频一区二区三区| 欧美精品 - 色网| 国产一区二区自拍视频| 国产拍揄自揄精品视频麻豆| 亚洲国产精品久久久久秋霞不卡| 91亚洲精品久久久| 欧美一级免费在线| 国产老妇伦国产熟女老妇视频| 国产精品美女久久久久高潮| 一区二区三区国产视频| 精品麻豆av| 国产精品1000部啪视频| 天天色天天操天天射| 五月天视频一区| 热久久免费国产视频| 污污视频网站免费观看| 中文字幕无码乱码人妻日韩精品|