[發明專利]通過中間潛在空間控制神經網絡在審
| 申請號: | 202011410602.6 | 申請日: | 2020-12-03 |
| 公開(公告)號: | CN113298226A | 公開(公告)日: | 2021-08-24 |
| 發明(設計)人: | S·P·帕里斯;E·A·哈爾科南;A·P·赫茨曼 | 申請(專利權)人: | 奧多比公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 馬明月 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 通過 中間 潛在 空間 控制 神經網絡 | ||
本公開的實施例涉及通過中間潛在空間控制神經網絡。一種生成式神經網絡控制系統通過修改生成式神經網絡中的中間潛在空間來控制生成式神經網絡。生成式神經網絡包括分別生成激活值的集合的多個層。初始層(且可選地附加層)接收輸入潛在向量,并且最終層輸出基于輸入潛在向量而被生成的圖像。被輸入至每一層(除了初始層以外)的數據被稱為中間潛在空間中的數據。中間潛在空間中的數據包括(例如由先前層生成的、或使用各種技術修改的)激活值,并且可選地包括潛在向量。生成式神經網絡控制系統修改中間潛在空間以在生成新圖像時實現各種不同效果。
技術領域
本公開的實施例涉及神經網絡,更具體地涉及通過中間潛在空間控制神經網絡。
背景技術
隨著計算機技術的發展,已經逐漸形成了計算機的各種用途和應用。一個最新進展是可以根據通常為隨機的初始輸入生成圖像的生成式神經網絡(generative neuralnetwork),諸如生成式對抗網絡(GAN)。這些生成式神經網絡可以被提供作為各種數字內容創建應用的一部分,并且提供許多益處,諸如生成可能難以與由相機捕獲的圖像區域分開的圖像。
盡管具有這些益處,但生成式神經網絡并非沒有其問題。一個這種問題在于,可能難以控制生成式神經網絡的輸出。用于控制生成式神經網絡的輸出的常規嘗試包括:提供指示要生成的圖像類別(class)的類別向量作為對生成式神經網絡的初始層的輸入的一部分、提供將用作對初始層的輸入的至少一部分的附加數據等。然而,這些嘗試產生了有限結果。提供類別向量允許控制生成何種圖像類別(例如狗、貓、風景),但不提供任何其他控制(例如查看狗的方向、圖像的背景)。因為獲得附加數據可能很困難且使用這種附加數據的結果受到限制,所以提供將用作對初始層的輸入的至少一部分的附加數據可以是存在問題的。例如,用戶可以獲得從特定方向看著狗(例如看著狗的側面)的附加圖像,并且提供該附加圖像作為對生成式神經網絡的初始層的輸入的一部分,該初始層可以生成如同附加圖像中一樣稍微轉頭的狗。
因此,常規解決方案提供了對由生成式神經網絡生成的圖像的有限控制,從而導致用戶對其計算機和圖像生成系統的不滿和失望。
發明內容
為了減少常規圖像生成系統的繪圖,描述了一種生成式神經網絡控制系統以通過中間潛在空間控制神經網絡。在一種或多種實現中,用于生成式對抗網絡(GAN)的生成器網絡的第一數據被接收,生成器網絡包括多個層。這些多個層包括初始層、第一層和第二層。針對由生成器網絡生成的新圖像的第一效果的輸入選擇被接收。第二數據通過基于該輸入選擇修改第一數據而被生成。修改包括:將分解向量應用于由第一層生成的激活值。第二數據被提供給第二層,第二層是生成器網絡中的比第一層更后面的層。使用生成器網絡,具有第一效果的新圖像利用第二數據而被生成。
在一種或多種實現中,用于生成式對抗網絡(GAN)的生成器網絡的第一數據被接收,生成器網絡包括多個層。這些多個層包括初始層、第一層和第二層。針對由生成器網絡生成的新圖像的第一效果的輸入選擇被接收。第二數據基于第一數據和輸入選擇而被生成。第二數據基于修改由第一層生成的激活值和修改被輸入至初始層的潛在向量而被生成。第二數據被提供給第二層,第二層是生成器網絡中的比第一層更后面的層。使用生成器網絡,具有第一效果的新圖像利用第二數據而被生成。
該發明內容以簡化形式介紹對于在下面的詳細說明中進一步描述的構思的選擇。因而,該發明內容不旨在標識所要求保護的主題的基本特征,也不旨在用作對確定所要求保護的主題的范圍的輔助。
附圖說明
參考附圖描述了詳細描述。圖中所表示的實體可以指示一個或多個實體,且因此,在討論中可以互換地參考單數或復數形式的實體。
圖1是對示例實現中的數字媒體環境的圖示,該示例實現可操作以采用通過本文中所描述的中間潛在空間控制神經網絡。
圖2是對生成式神經網絡控制系統的示例架構的圖示。
圖3圖示了示例生成式神經網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于奧多比公司,未經奧多比公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202011410602.6/2.html,轉載請聲明來源鉆瓜專利網。





