[發(fā)明專(zhuān)利]一種合同段落標(biāo)注模型的訓(xùn)練方法、裝置及設(shè)備有效
| 申請(qǐng)?zhí)枺?/td> | 201811590119.3 | 申請(qǐng)日: | 2018-12-25 |
| 公開(kāi)(公告)號(hào): | CN110046637B | 公開(kāi)(公告)日: | 2023-08-08 |
| 發(fā)明(設(shè)計(jì))人: | 梁山雪 | 申請(qǐng)(專(zhuān)利權(quán))人: | 創(chuàng)新先進(jìn)技術(shù)有限公司 |
| 主分類(lèi)號(hào): | G06F18/214 | 分類(lèi)號(hào): | G06F18/214;G06F16/35;G06F18/2411 |
| 代理公司: | 北京博思佳知識(shí)產(chǎn)權(quán)代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 開(kāi)曼群島大開(kāi)曼島*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 合同 段落 標(biāo)注 模型 訓(xùn)練 方法 裝置 設(shè)備 | ||
1.一種合同段落標(biāo)注模型的訓(xùn)練方法,包括:
獲取訓(xùn)練樣本集合,每一訓(xùn)練樣本中包括由同一合同拆分得到的多個(gè)具有結(jié)構(gòu)標(biāo)簽的合同段落,和,按照合同段落順序組合得到的真實(shí)結(jié)構(gòu)標(biāo)簽序列,其中,所述結(jié)構(gòu)標(biāo)簽包括標(biāo)題、條款內(nèi)容和合同聲明內(nèi)容,所述合同聲明內(nèi)容包括對(duì)條款內(nèi)容的使用聲明和對(duì)標(biāo)題的解釋聲明;
針對(duì)任一訓(xùn)練樣本,確定該訓(xùn)練樣本中各合同段落的段落特征向量,并按合同段落順序組合得到段落特征向量序列,其中,所述段落特征向量序列和真實(shí)結(jié)構(gòu)標(biāo)簽序列所包含的元素?cái)?shù)量等同于合同段落數(shù)量;
其中,確定各合同段落的段落特征向量,包括:
選取任一合同段落,確定該合同段落中每個(gè)字符的字符表征向量,按被選取的合同段落中的字符順序,拼接字符表征向量得到被選取的合同段落的特征表征矩陣;
從所述特征表征矩陣提取出全局語(yǔ)義特征向量和局部字符組合特征矩陣,以及,確定被選取的合同段落的長(zhǎng)度特征向量;
根據(jù)所述全局語(yǔ)義特征向量、局部字符組合特征矩陣和長(zhǎng)度特征向量生成被選取的合同段落的段落特征向量;
以所述段落特征向量序列作為訓(xùn)練樣本的特征值,以所述真實(shí)結(jié)構(gòu)標(biāo)簽序列作為訓(xùn)練樣本的標(biāo)簽,采用有監(jiān)督學(xué)習(xí)訓(xùn)練得到目標(biāo)標(biāo)注模型;
其中,所述目標(biāo)標(biāo)注模型以合同的段落特征向量序列作為輸入值,以預(yù)測(cè)結(jié)構(gòu)標(biāo)簽序列作為輸出值,所述預(yù)測(cè)結(jié)構(gòu)標(biāo)簽序列中的結(jié)構(gòu)標(biāo)簽按順序?qū)?yīng)于各合同段落。
2.如權(quán)利要求1所述的方法,在針對(duì)任一訓(xùn)練樣本,確定各合同段落的段落特征向量之前,還包括:
采用同一字符串替換合同段落中的實(shí)體名稱(chēng),所述實(shí)體名稱(chēng)包括人名、地名或者組織名。
3.如權(quán)利要求1所述的方法,根據(jù)所述全局語(yǔ)義特征向量、局部字符組合特征矩陣和長(zhǎng)度特征向量生成被選取的合同段落的段落特征向量,包括:
將所述局部字符組合特征矩陣進(jìn)行矩陣重排列,生成局部特征向量;
拼接所述全局語(yǔ)義特征向量、局部特征向量和長(zhǎng)度特征向量,生成一維的段落特征向量。
4.一種基于權(quán)利要求1至3任一項(xiàng)所述的合同段落標(biāo)注模型的合同段落標(biāo)注方法,包括:
獲取合同文本內(nèi)容,所述合同文本內(nèi)容包括多個(gè)合同段落;
確定各合同段落的段落特征向量,按順序組合生成段落特征向量序列;
所述確定各合同段落的段落特征向量,包括:
選取任一合同段落,確定該合同段落中每個(gè)字符的字符表征向量,按被選取的合同段落中的字符順序,拼接字符表征向量得到被選取的合同段落的特征表征矩陣;
從所述特征表征矩陣提取出全局語(yǔ)義特征向量和局部字符組合特征矩陣,以及,確定被選取的合同段落的長(zhǎng)度特征向量;
根據(jù)所述全局語(yǔ)義特征向量、局部字符組合特征矩陣和長(zhǎng)度特征向量生成被選取的合同段落的段落特征向量;
以所述段落特征向量序列作為所述合同段落標(biāo)注模型的輸入值,以使得所述合同段落標(biāo)注模型輸出對(duì)于所述合同文本內(nèi)容的預(yù)測(cè)結(jié)構(gòu)標(biāo)簽序列,并按照合同段落的順序確定各合同段落的預(yù)測(cè)結(jié)構(gòu)標(biāo)簽;
其中,所述段落特征向量序列和預(yù)測(cè)結(jié)構(gòu)標(biāo)簽序列所包含的元素?cái)?shù)量等同于合同段落數(shù)量,所述結(jié)構(gòu)標(biāo)簽包括標(biāo)題、條款內(nèi)容和合同聲明內(nèi)容。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于創(chuàng)新先進(jìn)技術(shù)有限公司,未經(jīng)創(chuàng)新先進(jìn)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201811590119.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 一種基于元數(shù)據(jù)的合同管理系統(tǒng)及方法
- 在線(xiàn)談判簽署電子合同的方法及系統(tǒng)
- 一種在線(xiàn)合同文檔的生成方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 合同數(shù)據(jù)的獲取方法、設(shè)備、存儲(chǔ)介質(zhì)及裝置
- 電子合同簽訂方法、電子裝置及可讀存儲(chǔ)介質(zhì)
- 基于區(qū)塊鏈的合同磋商方法及裝置、電子設(shè)備、存儲(chǔ)介質(zhì)
- 一種合同自動(dòng)生成方法及裝置
- 一種電子合同的管理方法、裝置、設(shè)備和介質(zhì)
- 一種合同履約信息管控系統(tǒng)
- 一種合同簽署方法、裝置和電子設(shè)備
- 一種目錄更新方法及裝置
- 變量離散化的方法及裝置
- 一種文檔密級(jí)自動(dòng)識(shí)別方法
- 一種目錄生成方法及裝置
- 一種聊天數(shù)據(jù)分段方法、裝置及存儲(chǔ)介質(zhì)
- 段落層級(jí)的構(gòu)建方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文本中關(guān)鍵段落的檢測(cè)方法及裝置
- 目標(biāo)段落的確定方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備
- 電子文檔中段落順序的處理方法、裝置、存儲(chǔ)介質(zhì)和設(shè)備
- 目標(biāo)文本的摘要提取方法及裝置、電子設(shè)備、存儲(chǔ)介質(zhì)
- 標(biāo)注信息生成裝置、查詢(xún)裝置及共享系統(tǒng)
- 一種圖像分割標(biāo)注方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)標(biāo)注方法
- 一種基于群智的語(yǔ)料庫(kù)數(shù)據(jù)標(biāo)注方法及系統(tǒng)
- 一種圖像標(biāo)注方法和裝置
- 一種樣本標(biāo)注方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備
- 數(shù)據(jù)標(biāo)注管理方法及裝置、電子設(shè)備和可讀存儲(chǔ)介質(zhì)
- 標(biāo)注的更新方法、裝置、存儲(chǔ)介質(zhì)、處理器以及運(yùn)載工具
- 數(shù)據(jù)的標(biāo)注方法和裝置
- 一種智能標(biāo)注平臺(tái)的方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)





