[發明專利]一種將語音轉換為文字的方法、裝置及系統在審
| 申請號: | 201711386363.3 | 申請日: | 2017-12-20 |
| 公開(公告)號: | CN109949813A | 公開(公告)日: | 2019-06-28 |
| 發明(設計)人: | 王群 | 申請(專利權)人: | 北京君林科技股份有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26 |
| 代理公司: | 北京弘權知識產權代理事務所(普通合伙) 11363 | 代理人: | 逯長明;許偉群 |
| 地址: | 100107 北京市朝陽區天朗*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征參數 目標特征參數 準確率 校驗 匹配度 語音轉換 目標語音信號 語音數據庫 裝置及系統 突出顯示 預設 匹配 輸出 保證 發現 | ||
本發明實施例公開了一種將語音轉換為文字的方法以及裝置,該方法包括:提取目標語音信號的第一特征參數;將第二特征參數與語音數據庫中的第三特征參數進行匹配,確定N個目標特征參數,N≥2,N個目標特征參數是第三特征參數中與第二特征參數匹配度最大的N個,所述第二特征參數為所述第一特征參數中的一部分,確定與第二特征參數匹配度最大的一個目標特征參數對應的文字,并輸出該文字;利用N個目標特征參數的匹配度確定文字的準確率;如果準確率低于預設閾值,對文字進行突出顯示標記。本發明實施例能夠使校驗人員很容易地發現準確率較低的文字并判斷該文字的正誤,在方便校驗的同時,還能夠提高校驗效率以及保證文字的準確率。
技術領域
本發明實施例涉及語音識別技術領域,尤其涉及一種將語音轉換為文字的方法、裝 置及系統。
背景技術
目前,隨著智能語音文字轉換技術的發展,將語音轉換為文字的效率得到了大大提 高。智能語音文字轉換技術可以應用于會議記錄、培訓記錄或采訪記錄中。在對語音信號進行文字轉換時,首先提取語音信號的特征參數,再將該特征參數與語音數據庫中文 字對應的特征參數進行匹配,從而得到匹配度最高的文字并輸出。對于在安靜環境下的 標準普通話語音的文字轉化,準確率較高。但是,在現實場景下,發言者無可避免地會 帶有一定的地方口音,并且無法保證在安靜的環境下進行錄音,所以無法保證語音文字 轉換的準確率。。
利用現有的智能語音文字轉換技術得到的文字無法保證100%的準確率,所以需要人 工對轉換后的文字進行校驗。通常的校驗方法是,校驗人員通篇進行閱讀,以找到轉換 錯誤的文字,但是這種校驗方式比較費時費力。而且,由于人工校驗容易出現失誤,有些錯誤不易被發現,從而導致文字錯誤率較高。
發明內容
本發明實施例提供了一種將語音轉換為文字的方法及終端,以提供一種能夠提高文 字校驗效率以及降低文字錯誤率的方法。
本發明實施例提供了一種將語音轉換為文字的方法,包括:
提取目標語音信號的第一特征參數;
將第二特征參數與語音數據庫中的第三特征參數進行匹配,確定N個目標特征參數, 所述N個目標特征參數是所述第三特征參數中與所述第二特征參數匹配度最大的N個,N≥2,所述第二特征參數為所述第一特征參數中的一部分,;
確定與所述第二特征參數匹配度最大的一個目標特征參數對應的文字,并輸出所述 文字;
利用所述N個目標特征參數的匹配度確定所述文字的準確率;
如果所述準確率低于預設閾值,對所述文字進行突出顯示標記。
進一步地,利用所述N個目標特征參數的匹配度確定所述文字的準確率,包括:
確定所述N個目標特征參數對應的匹配度之和;
確定所述文字對應的匹配度占所述匹配度之和的比重,所述比重為所述文字的準確 率。
進一步地,如果所述準確率低于預設閾值,對所述文字進行突出顯示標記,包括:
如果所述準確率低于預設閾值,對所述文字進行顏色標記。
進一步地,所述方法還包括:
獲取語音信號;
如果所述語音信號中語句停頓信號的延續時間超過預設時間,在所述語句停頓信號 處對所述語音信號進行斷句,形成語音信號片段;
對所述語音信號片段標記時間戳,所述語音信號片段為目標語音信號。
進一步地,所述方法還包括:
利用所述語音信號片段的時間戳標記所述語音信號片段對應的文字段。
進一步地,所述方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京君林科技股份有限公司,未經北京君林科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201711386363.3/2.html,轉載請聲明來源鉆瓜專利網。





