[發明專利]基于智能創作算法的融媒體采編發系統有效
| 申請號: | 202010143738.9 | 申請日: | 2020-03-04 |
| 公開(公告)號: | CN111353077B | 公開(公告)日: | 2022-01-11 |
| 發明(設計)人: | 崔巖松;陳科良;張曉歡;任維政;黃建明;楊泰岳;董曉靜 | 申請(專利權)人: | 北京郵電大學;北京歡科科技有限公司 |
| 主分類號: | G06F16/903 | 分類號: | G06F16/903;G06F16/951;G06F16/958 |
| 代理公司: | 北京慕達星云知識產權代理事務所(特殊普通合伙) 11465 | 代理人: | 曹鵬飛 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 智能 創作 算法 媒體 編發 系統 | ||
1.一種基于智能創作算法的融媒體采編發系統,其特征在于,包括業務終端、用戶終端以及業務處理平臺;所述業務處理平臺包括,
內容采集與智能處理模塊,用于對原始資源進行預處理和語義處理形成語料庫,并接收所述業務終端采寫的文本序列,從語料庫中智能檢索與文本序列語義相匹配的文本序列,并輸出至所述業務終端;所述內容采集與處理模塊包括,語義處理模塊,用于根據所述業務終端采寫的文本序列提取關鍵詞,并使用基礎資源庫中存儲的HowNet語料庫進行語義擴展和關鍵詞概念關聯,得到模板文本序列,存儲至語料庫;所述語義處理模塊根據所述業務終端采寫的文本序列提取關鍵詞具體過程包括:
對采寫的文本序列采用如下關鍵詞提取算法,
其中f(i)代表詞語i出現的詞頻,ni代表詞語i在輸入文本序列中出現的次數,xi代表詞語所在句子的標簽權重,V(i)代表詞語i的關鍵詞權重值,M代表用一個完整標簽包裹的輸入文本序列總個數,Mi代表包含詞語i的用一個完整標簽包裹的文本序列總個數;
將關鍵詞按照V(i)從高到低進行排序,然后從高到低進行關鍵詞抽取;
所述語義擴展是在提取關鍵字后,使用關鍵字和HowNet語義網進行概念擴展,將多個相同的概念指向同一段文字;
所述關鍵詞概念關聯是根據文本上下文,分析多個概念之間的關聯度,在用戶檢索時,不僅給用戶提供相同概念的文本,也給用戶提供相關概念的文本;
多渠道整合發布與運營模塊,利用爬蟲算法提取多種類型的融媒體資源,并在多個所述用戶終端進行認證多渠道融合發布。
2.根據權利要求1所述的一種基于智能創作算法的融媒體采編發系統,其特征在于,還包括統一內容資源管理平臺,用于對所有資源內容進行統一管理與調取,所述資源內容包括文本內容、HowNet語料庫、圖片以及音視頻。
3.根據權利要求1所述的一種基于智能創作算法的融媒體采編發系統,其特征在于,還包括運營支撐平臺,用于用戶管理、產品管理以及集成與接口管理,集成與接口管理包括對所述用戶終端和所述業務終端提供認證數據交互接口。
4.根據權利要求1所述的一種基于智能創作算法的融媒體采編發系統,其特征在于,還包括多媒體編輯模塊,所述多媒體編輯模塊用于稿件內容的智能潤色、修改痕跡的記錄;其中,通過選中編輯器中的文本進行智能潤色,完成之后在界面呈現潤色推薦結果列表;修改痕跡記錄包括在用戶修改、保存的過程中自動對標題、副標題、稿件主要內容的修改進行核對、保存。
5.根據權利要求1所述的一種基于智能創作算法的融媒體采編發系統,其特征在于,所述內容采集與處理模塊包括,
資源預處理模塊,用于對原始資源進行預處理,包括去除干擾信息、資源拆分、分詞、元數據補全的處理流程,得到若干詞句片段,存儲到基礎資源庫中;
查詢模塊,用于根據所述關鍵詞在所述語料庫中采用中文字符串模糊匹配算法進行匹配檢索,得到與所述關鍵詞相匹配的模板文本序列,并輸出至所述業務終端。
6.根據權利要求5所述的一種基于智能創作算法的融媒體采編發系統,其特征在于,所述資源預處理模塊的具體處理過程包括:
去除干擾信息,原始資源的文檔以XML格式輸入,XML標簽為原始資源的文本在所屬書籍中的位置,每個XML標簽對應一個標簽權重,采用高通濾波器原理對給定標簽權重范圍內的XML標簽進行篩選;
資源拆分,對篩選的文檔按段落或按斷句拆分為多個文本片段;
分詞,將文本片段按照詞語最大長度匹配法和/或拆分詞組最少匹配法和/或最小詞方差匹配法進行拆分,得到若干詞句片段。
7.根據權利要求6所述的一種基于智能創作算法的融媒體采編發系統,其特征在于,所述資源預處理模塊的具體處理過程還包括:
元數據補全,將原始資源所述書籍的元數據存儲至所述基礎資源庫中,所述元數據包括中圖分類、內容摘要、作者信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學;北京歡科科技有限公司,未經北京郵電大學;北京歡科科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010143738.9/1.html,轉載請聲明來源鉆瓜專利網。





