[發(fā)明專利]漢字漢語拼音與漢語語音碼雙向可逆轉(zhuǎn)換方法無效
| 申請?zhí)枺?/td> | 200610029672.0 | 申請日: | 2006-08-02 |
| 公開(公告)號: | CN101118540A | 公開(公告)日: | 2008-02-06 |
| 發(fā)明(設(shè)計(jì))人: | 苗玉水 | 申請(專利權(quán))人: | 苗玉水 |
| 主分類號: | G06F17/28 | 分類號: | G06F17/28;G06F3/023 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200093上海市*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 漢字 漢語拼音 漢語 語音 雙向 可逆 轉(zhuǎn)換 方法 | ||
一、所屬技術(shù)領(lǐng)域
本發(fā)明是一種漢字漢語拼音雙向可逆地轉(zhuǎn)換成一種用且僅用26個(gè)拉丁字母以詞為單位的漢語語音碼的方法,屬于計(jì)算機(jī)漢字和漢語信息處理技術(shù)領(lǐng)域。
二、背景技術(shù)
二十世紀(jì)四十年代起,計(jì)算機(jī)的飛速發(fā)展在全球范圍內(nèi)引起了一場以電子計(jì)算機(jī)為中心的第三次技術(shù)革命,它把人類從繁重的腦力勞動(dòng)中解放出來,開創(chuàng)了人類智力解放的新紀(jì)元。
眾所周知,計(jì)算機(jī)是通過處理各種符號,特別是通過處理128個(gè)ASCII碼的方法來進(jìn)行各種字符信息處理的,由于26個(gè)拉丁字母包含在128個(gè)ASCII碼的碼符集內(nèi),因此,使用26個(gè)拉丁字母以英文為代表的的拼音文字的國家能夠順利地進(jìn)行這次新技術(shù)革命,從飛躍發(fā)展的經(jīng)濟(jì)中得到好處。
由于我國記錄漢語使用的是方塊表意漢字或漢語拼音,眾所周知方塊表意漢字的計(jì)算機(jī)機(jī)內(nèi)碼不在128個(gè)ASCII碼的碼符集內(nèi),而漢語拼音還存在幾個(gè)不便于計(jì)算機(jī)信息處理的弊病,比如:第一拼式太長,第二五個(gè)聲調(diào)(含一個(gè)輕聲)沒有字母化且不在ASCII碼的范圍內(nèi),第三漢語單詞音節(jié)的聲、韻、調(diào)沒有便于計(jì)算機(jī)信息處理的從左到右的一維線性排列,而是上下排列,第四如果沒有非字母化的漢語拼音隔音節(jié)符號的隔音節(jié)幫助,漢語拼音在以詞為單位連寫時(shí),音節(jié)和音節(jié)之間往往容易發(fā)生混淆,產(chǎn)生混音現(xiàn)象。所有這些都不便于計(jì)算機(jī)對漢語信息的處理。由于自身的這些不足,它們不能作為一種拼音文字,這就給計(jì)算機(jī)的漢語信息處理帶來很大的麻煩。
為此,眾多專家,學(xué)者在這方面進(jìn)行了研究和探索,但是由于漢語是一種有聲調(diào)的非常特別的語言,要想用且僅用26個(gè)拉丁字母,就能夠?qū)Π瑵h語的22個(gè)聲母(含一個(gè)零聲母),38個(gè)韻母,5個(gè)聲調(diào)(含一個(gè)輕聲)進(jìn)行編碼,而且為了讓任意多的音節(jié)被連寫在一起后,音節(jié)與音節(jié)之間不能發(fā)生混淆,產(chǎn)生混音現(xiàn)象,每一個(gè)音節(jié)里還必須隱含一個(gè)隔音節(jié)符號,這樣就使得該技術(shù)方案的難度非常大,這也是長期以來這個(gè)問題一直沒得到有效解決的根本原因。
據(jù)了解,目前只有歷史上的中國的文字改革方案用過阿拉伯?dāng)?shù)字表示漢語音節(jié)的聲調(diào),在通過計(jì)算機(jī)漢字與“拼音碼”自動(dòng)轉(zhuǎn)換中,大部分軟件只能將漢字轉(zhuǎn)換成非字母化的聲調(diào)標(biāo)在韻母上的傳統(tǒng)漢語拼音,而且大部分不分詞,像交大銘泰出的《東方快車》翻譯軟件等,美國微軟公司的word有將漢字的拼音自動(dòng)標(biāo)注在漢字上面的功能,目前看到的拼音是非字母化的聲調(diào)標(biāo)在韻母上的傳統(tǒng)漢語拼音,過去還看到它與歷史上的中國的文字改革方案用阿拉伯?dāng)?shù)字表示漢語音節(jié)的聲調(diào)像類似的方法,將五個(gè)聲調(diào)轉(zhuǎn)換成1、2、3、4、5五個(gè)阿拉伯?dāng)?shù)字標(biāo)注在音節(jié)的韻母后面,這樣做是比目前的漢語拼音聲調(diào)寫在韻母上面有進(jìn)步,解決了上面提到的《漢語拼音方案》本身還存在以下幾個(gè)方面的不足中的其中一個(gè)不足,即漢語單詞音節(jié)的聲、韻、調(diào)沒有便于計(jì)算機(jī)信息處理的從左到右的一維線性排列,但上面提到的《漢語拼音方案》本身還存在其它幾個(gè)方面的主要不足還是未能解決,從漢語信息的編碼技術(shù)角度看,其實(shí)質(zhì)是未能發(fā)明出用且僅用26個(gè)碼元,特別是用且僅用26個(gè)拉丁字母作為碼元,對包含漢語的22個(gè)聲母(含一個(gè)零聲母),38個(gè)韻母,5個(gè)聲調(diào)進(jìn)行編碼的技術(shù),更不要說發(fā)明出解決由于僅用26個(gè)拉丁字母作為碼元,漢語按詞連寫后的音節(jié)和音節(jié)之間的隔音節(jié)技術(shù)。同時(shí)微軟的兩種轉(zhuǎn)換方法中都是對顯示的漢字進(jìn)行注音而沒有直接單獨(dú)用來表達(dá)漢語信息,更主要的不足是包括微軟在內(nèi)的所有轉(zhuǎn)換方法只有漢字轉(zhuǎn)換成漢語拼音,而沒有一種方法是解決漢語拼音如何轉(zhuǎn)換成漢字,更不要說有一種從以26個(gè)拉丁字母作為碼元的漢語語音碼轉(zhuǎn)換成漢字或漢語拼音的方法。
三、發(fā)明內(nèi)容
本發(fā)明的目的是提供一種全新的,將漢字漢語拼音可逆地轉(zhuǎn)換成一種用且僅用26個(gè)拉丁字母以詞為單位的漢語語音碼的方法來解決以上存在的弊端。
具體來說本發(fā)明方法所采用的漢語語音碼,它用且僅用26個(gè)拉丁字母作為碼元,以詞為單位采用按詞連寫的方式對組成詞的每一音節(jié)的聲、韻、調(diào)先進(jìn)行編碼轉(zhuǎn)換,再依照“聲碼+介碼+韻碼+調(diào)碼兼隔音節(jié)符號”的順序進(jìn)行編碼,由于26個(gè)拉丁字母屬于128個(gè)ASCII碼碼符集范圍內(nèi),因此一旦傳統(tǒng)用于表示漢語信息的漢字漢語拼音轉(zhuǎn)換成該種漢語語音碼后,世界上一切用于處理西碼的所有軟硬件資源都可以不加改造地用于處理漢語語音碼所表達(dá)的漢語信息。
四、具體實(shí)施方式
下面結(jié)合實(shí)施例對本發(fā)明的具體實(shí)施方式作進(jìn)一步的說明。
(一)所采用的語音碼的每一音節(jié)聲、韻、調(diào)的編碼方法可以采用類似以下的方法:
(注:括號內(nèi)的符號均為漢語拼音符號,不帶括號的字母為本發(fā)明的漢語每一音節(jié)聲、韻、調(diào)的編碼,以上以下敘述均同。)
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于苗玉水,未經(jīng)苗玉水許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/200610029672.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)





