[發(fā)明專利]音頻指紋編碼方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請?zhí)枺?/td> | 202010199768.1 | 申請日: | 2020-03-20 |
| 公開(公告)號(hào): | CN111428078B | 公開(公告)日: | 2023-05-23 |
| 發(fā)明(設(shè)計(jì))人: | 繆暢宇 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號(hào): | G06F16/683 | 分類號(hào): | G06F16/683;G06F16/65;G06F18/24;G06N20/00 |
| 代理公司: | 北京三高永信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11138 | 代理人: | 祝亞男 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 指紋 編碼 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲(chǔ) 介質(zhì) | ||
本申請是關(guān)于一種音頻指紋編碼方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。該方法包括:在對音頻信號(hào)的初始頻譜圖進(jìn)行特征點(diǎn)提取之前,首先通過權(quán)重矩陣對初始頻譜圖進(jìn)行處理,得到處理后頻譜圖,然后在處理后的頻譜圖上進(jìn)行特征點(diǎn)對的提取和編碼,由于該權(quán)重矩陣是通過音頻樣本以及用戶針對該音頻樣本的實(shí)際的用戶行為特征訓(xùn)練得到的,而當(dāng)訓(xùn)練樣本足夠時(shí),用戶行為特征可以體現(xiàn)不同音頻受用戶關(guān)注的情況,相應(yīng)的,通過訓(xùn)練得到的權(quán)重矩陣對初始頻譜圖進(jìn)行處理后,得到的處理后頻譜圖可以突出音頻中用戶可能重點(diǎn)關(guān)注的部分,得到的音頻指紋能夠更準(zhǔn)確的體現(xiàn)出用戶可能關(guān)注的特點(diǎn),從而提高音頻指紋的編碼準(zhǔn)確性。
技術(shù)領(lǐng)域
本申請實(shí)施例涉及人工智能技術(shù)領(lǐng)域,特別涉及一種音頻指紋編碼方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
如今,隨著網(wǎng)絡(luò)音頻服務(wù)的不斷發(fā)展,越來越多的音頻類應(yīng)用向用戶提供音頻匹配服務(wù)。音頻匹配是指將兩個(gè)音頻的音頻指紋進(jìn)行匹配,而音頻指紋可以根據(jù)音頻的頻譜圖進(jìn)行編碼得到。
在相關(guān)技術(shù)中,在對音頻進(jìn)行編碼得到音頻指紋時(shí),可以首先獲取音頻的頻譜圖,從頻譜圖中提取頻譜數(shù)值較大的特征點(diǎn),再從提取的特征點(diǎn)中篩選出處于預(yù)設(shè)頻率范圍內(nèi)的特征點(diǎn),然后對篩選出的特征點(diǎn)進(jìn)行匹配和編碼,得到該音頻的音頻指紋。
然而,相關(guān)技術(shù)中的音頻指紋的編碼過程僅在頻率范圍上做了限制,對于不同的音頻無法做適應(yīng)性的調(diào)整,編碼得到的音頻指紋無法準(zhǔn)確的體現(xiàn)不同音頻的特點(diǎn),導(dǎo)致音頻指紋的編碼準(zhǔn)確性較差。
發(fā)明內(nèi)容
本申請實(shí)施例提供了一種音頻指紋編碼方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),可以在對音頻進(jìn)行編碼時(shí),針對不同的音頻做適應(yīng)性的調(diào)整,從而提高音頻指紋的編碼準(zhǔn)確性。該技術(shù)方案如下:
一方面,提供了一種音頻指紋編碼方法,所述方法包括:
對目標(biāo)音頻信號(hào)進(jìn)行頻譜提取,獲得所述目標(biāo)音頻信號(hào)的初始頻譜圖;
通過權(quán)重矩陣對所述目標(biāo)音頻信號(hào)的初始頻譜圖進(jìn)行處理,獲得所述目標(biāo)音頻信號(hào)的處理后頻譜圖;所述權(quán)重矩陣是通過訓(xùn)練樣本進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練得到的,所述訓(xùn)練樣本包括音頻信號(hào)樣本,以及所述音頻信號(hào)樣本實(shí)際的用戶行為特征;所述用戶行為特征用于指示對應(yīng)的音頻信號(hào)接收到的用戶操作行為;
從所述目標(biāo)音頻信號(hào)的處理后頻譜圖中提取所述目標(biāo)音頻信號(hào)的特征點(diǎn)對;
對所述目標(biāo)音頻信號(hào)的特征點(diǎn)對進(jìn)行編碼,獲得所述目標(biāo)音頻信號(hào)的音頻指紋。
另一方面,提供了一種音頻指紋編碼裝置,所述裝置包括:
第一頻譜圖獲取模塊,用于對目標(biāo)音頻信號(hào)進(jìn)行頻譜提取,獲得所述目標(biāo)音頻信號(hào)的初始頻譜圖;
第二頻譜圖獲取模塊,用于通過權(quán)重矩陣對所述目標(biāo)音頻信號(hào)的初始頻譜圖進(jìn)行處理,獲得所述目標(biāo)音頻信號(hào)的處理后頻譜圖;所述權(quán)重矩陣是通過訓(xùn)練樣本進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練得到的,所述訓(xùn)練樣本包括音頻信號(hào)樣本,以及所述音頻信號(hào)樣本實(shí)際的用戶行為特征;所述用戶行為特征用于指示對應(yīng)的音頻信號(hào)接收到的用戶操作行為;
特征點(diǎn)對提取模塊,用于從所述目標(biāo)音頻信號(hào)的處理后頻譜圖中提取所述目標(biāo)音頻信號(hào)的特征點(diǎn)對;
音頻指紋獲取模塊,用于對所述目標(biāo)音頻信號(hào)的特征點(diǎn)對進(jìn)行編碼,獲得所述目標(biāo)音頻信號(hào)的音頻指紋。
在一種可能的實(shí)現(xiàn)方式中,所述裝置還包括:
第三頻譜圖獲取模塊,用于在第二頻譜圖獲取模塊對目標(biāo)音頻信號(hào)進(jìn)行頻譜提取,獲得所述目標(biāo)音頻信號(hào)的處理后頻譜圖之前,對所述音頻信號(hào)樣本進(jìn)行頻譜提取,獲得所述音頻信號(hào)樣本的初始頻譜圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010199768.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置
- 體征碼及其編碼方法
- 編碼裝置和編碼方法以及解碼裝置和解碼方法
- 聲音信號(hào)編碼方法、聲音信號(hào)解碼方法、編碼裝置、解碼裝置、聲音信號(hào)處理系統(tǒng)、聲音信號(hào)編碼程序以及聲音信號(hào)解碼程序
- 用于下一代視頻的編碼/未編碼的數(shù)據(jù)的內(nèi)容自適應(yīng)熵編碼
- 編碼光符號(hào)編碼
- 一種可變幀率的編碼方法及裝置
- 一種物聯(lián)網(wǎng)編碼方法及系統(tǒng)
- 點(diǎn)陣編碼及解碼方法
- 一種視頻編碼方法、裝置和存儲(chǔ)介質(zhì)
- 視頻編碼方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





