[發明專利]基于人工智能的圖像風格處理方法、裝置及電子設備在審
| 申請號: | 202010833104.6 | 申請日: | 2020-08-18 |
| 公開(公告)號: | CN112819686A | 公開(公告)日: | 2021-05-18 |
| 發明(設計)人: | 聶士偉;黃飛;石世昌 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06T3/00 | 分類號: | G06T3/00;G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 崔曉嵐;張穎玲 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 圖像 風格 處理 方法 裝置 電子設備 | ||
本申請提供了一種基于人工智能的圖像風格處理方法、裝置、設備及計算機可讀存儲介質;方法包括:通過風格生成網絡對第一圖像樣本進行風格變換處理,得到第二圖像樣本;獲取所述第二圖像樣本圖像進行風格分類時對應的風格分類損失函數、以及對所述第二圖像樣本進行內容分類時對應的內容分類損失函數;根據所述風格分類損失函數和所述內容分類損失函數訓練所述風格生成網絡;通過訓練后的所述風格生成網絡對第一圖像進行風格變換處理,得到第二圖像。通過本申請,能夠實現準確圖像風格遷移。
技術領域
本申請涉及人工智能技術,尤其涉及一種基于人工智能的圖像風格處理方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
人工智能(AI,Artificial Intelligence)是利用數字計算機或者數字計算機控制的機器模擬、延伸和擴展人的智能,感知環境、獲取知識并使用知識獲得最佳結果的理論、方法和技術及應用系統。
隨著深度學習的發展,圖像識別技術應用到越來越多的領域以及產品中,針對于圖像風格變換領域,將對抗生成網絡應用于圖像風格變換領域時,僅依靠判別網絡監督生成網絡進行訓練所得到的生成網絡無法滿足具有多樣性的圖像風格遷移需求,例如,個人用戶具有多樣性的手寫字圖像等等,基于判別網絡監督生成網絡訓練得到的生成網絡無法按照預期實現圖像風格變換。
發明內容
本申請實施例提供一種基于人工智能的圖像風格處理方法、裝置、電子設備及計算機可讀存儲介質,能夠實現更準確的風格遷移。
本申請實施例的技術方案是這樣實現的:
本申請實施例提供一種基于人工智能的圖像風格處理方法,包括:
通過風格生成網絡對第一圖像樣本進行風格變換處理,得到第二圖像樣本;
獲取對所述第二圖像樣本進行風格分類時對應的風格分類損失函數、以及對所述第二圖像樣本進行內容分類時對應的內容分類損失函數;
根據所述風格分類損失函數和所述內容分類損失函數訓練所述風格生成網絡;
通過訓練后的所述風格生成網絡對第一圖像進行風格變換處理,得到第二圖像。
在上述方案中,對所述第二圖像樣本進行風格分類是通過風格分類網絡實現的,對所述第二圖像樣本進行內容分類是通過內容分類網絡實現的;
獲取對所述第二圖像樣本進行風格分類時對應的風格分類損失函數、以及對所述第二圖像樣本進行內容分類時對應的內容分類損失函數之前,所述方法包括:
通過所述內容分類網絡對第三圖像樣本進行內容分類處理,得到所述第三圖像樣本的內容分類預測結果,并根據所述內容分類預測結果與所述第三圖像樣本的標記內容分類結果之間的誤差,更新所述內容分類網絡的參數;
通過所述風格分類網絡對所述第三圖像樣本進行風格分類處理,得到所述第三圖像樣本的風格分類預測結果,并根據所述風格分類預測結果與所述第三圖像樣本的標記風格分類結果之間的誤差,更新所述風格分類網絡的參數;
其中,所述第三圖像樣本是通過圖像采集得到的、與所述第一圖像樣本包括相同字符且具有待模仿風格特征。
在上述方案中,所述通過N個級聯的殘差網絡中的第n殘差網絡,對所述第n殘差網絡的輸入進行特征提取處理,包括:
通過所述第n殘差網絡的卷積層對所述第n殘差的輸入進行卷積處理,將得到的對應所述第一圖像的第n卷積處理結果作為特征提取結果;
所述根據所述待模仿風格特征對所提取的對象特征進行風格遷移處理,包括:
通過所述第n殘差網絡的歸一化層對所述第n卷積處理結果以及所述待模仿風格特征進行歸一化處理,得到所述第n殘差網絡輸出的第n歸一化處理結果;其中,所述歸一化處理包括縮放處理以及平移處理;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010833104.6/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





