[發明專利]強化學習的電子突觸有效
| 申請號: | 201180063280.5 | 申請日: | 2011-10-18 |
| 公開(公告)號: | CN103282919A | 公開(公告)日: | 2013-09-04 |
| 發明(設計)人: | D·S·莫德哈;張立倫;R·K·蒙托耶 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063 |
| 代理公司: | 北京市中咨律師事務所 11247 | 代理人: | 于靜;張亞非 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 強化 學習 電子 突觸 | ||
背景技術
本發明一般涉及神經形態(neuromorphic)及突觸器(synapatronic)系統,特別是涉及在突觸交叉式數組中產生脈沖時間相依可塑性。
神經形態及突觸器系統,還稱作人造神經網絡,是允許電子系統以實質類似于生物腦部的方式運作的運算系統。神經形態及突觸器系統一般不利用控制0與1的傳統數字模型。反之,神經形態及突觸器系統產生功能上大致等效于生物腦部神經元的處理組件間的連接。神經形態及突觸器系統可包含以生物神經元作模型的許多電子電路。
在生物系統中,突觸是指一神經元的軸突與另一神經元的樹突間的連接點,對突觸而言,二個神經元分別稱為前突觸(pre-synaptic)及后突觸(post-synaptic)。我們個人經驗的本質存儲于突觸的傳導中。突觸傳導隨著時間以每個脈沖時間相依可塑性(spike-timing?dependent?plasticity,STDP)的前突觸及后突觸神經元的相對脈沖時間的函數而改變。若后突觸神經元在前突觸神經元發射后才發射,則STDP規則增加此突觸的傳導,若二個神經元發射的順序顛倒,則STDP規則降低突觸的傳導。
發明內容
本發明具體實施例提供配置為強化學習的電子突觸。在一具體實施例中,電子突觸配置為互連前突觸電子神經元及后突觸電子神經元。電子突觸包含配置為存儲電子突觸的狀態以及存儲用以更新電子突觸的狀態的元信息的存儲器組件。電子突觸還包含更新模塊,其配置為基于元信息更新電子突觸的狀態,以響應針對強化學習的更新信號。更新模塊配置為基于元信息更新電子突觸的狀態,以響應基于學習規則的針對強化學習的延遲更新信號。
在另一具體實施例中,本發明提供一種系統,其包含多個電子神經元以及配置為互連多個電子神經元的交叉式數組。交叉式數組包含多個軸突及多個樹突,使得軸突與樹突彼此橫貫。交叉式數組還包含多個電子突觸,其中每一電子突觸位于耦合于樹突及軸突間的交叉式數組的交叉點,每一電子突觸配置為互連前突觸電子神經元及后突觸電子神經元。
本發明的優選實施例提供空分多重存取電子突觸,包含六端裝置,其中兩端用于讀取、兩端用于設定、以及兩端用于重設。
本發明的這些及其它特征、方面及優點可參考以下的詳細說明、后附的權利要求書、以及所附隨的附圖而了解。
附圖說明
圖1A根據本發明一具體實施例顯示具有電子突觸的交叉式數組的神經形態及突觸器系統的示意圖;
圖1B根據本發明一具體實施例顯示在前突觸路徑及后突觸路徑的交叉點的電子突觸的示意圖;
圖2根據本發明一具體實施例顯示在涉及讀取操作的交叉點的電子突觸的示意圖;
圖3根據本發明一具體實施例顯示在涉及STDP-設定操作的交叉點的電子突觸的示意圖;
圖4根據本發明一具體實施例顯示在涉及STDP-重設操作的交叉點的電子突觸的示意圖;
圖5根據本發明一具體實施例顯示在涉及STDP-設定操作的交叉點的電子突觸的示意圖;
圖6根據本發明一具體實施例顯示包括交叉點數組的電子突觸的示意圖;
圖7根據本發明一具體實施例顯示涉及R位的STDP操作的電子突觸的示意圖;
圖8根據本發明一具體實施例顯示涉及G位的STDP操作的電子突觸的示意圖;
圖9根據本發明一具體實施例顯示涉及B位的STDP操作的電子突觸的示意圖;
圖10根據本發明一具體實施例顯示電子突觸的交叉式數組的示意圖;
圖11根據本發明一具體實施例顯示電子突觸的示意圖;
圖12根據本發明一具體實施例顯示基于靜態隨機存取存儲器(static?random?access?memory,SRAM)的電子突觸的示意圖;
圖13根據本發明一具體實施例顯示基于動態隨機存取存儲器(dynamic?random?access?memory,DRAM)的電子突觸的示意圖;以及
圖14顯示適用于實施本發明一具體實施例的信息處理系統的高階方塊示意圖。
具體實施方式
本發明具體實施例提供配置為供強化學習(reinforcement?learning,RL)的電子突觸。本發明具體實施例還提供利用此用于RL的電子突觸的神經形態及突觸器系統,其包含實施脈沖時間相依可塑性(spike-timing?dependent?plasticity,STDP)的交叉式數組。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201180063280.5/2.html,轉載請聲明來源鉆瓜專利網。





