[發(fā)明專利]一種ceph集群中監(jiān)視器的管理方法及裝置有效
| 申請?zhí)枺?/td> | 201811204207.5 | 申請日: | 2018-10-16 |
| 公開(公告)號: | CN109495543B | 公開(公告)日: | 2021-08-24 |
| 發(fā)明(設(shè)計)人: | 王彥斌;顧雷雷 | 申請(專利權(quán))人: | 新華三技術(shù)有限公司 |
| 主分類號: | H04L29/08 | 分類號: | H04L29/08;H04L12/24;H04L12/26 |
| 代理公司: | 北京博思佳知識產(chǎn)權(quán)代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 310052 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 ceph 集群 監(jiān)視器 管理 方法 裝置 | ||
本申請公開了一種ceph集群中監(jiān)視器的管理方法,ceph集群的監(jiān)視器包括若干主用監(jiān)視器和若干備份監(jiān)視器,并針對每一監(jiān)視器維護(hù)有對應(yīng)的穩(wěn)定度量值,方法包括:在監(jiān)測到任一監(jiān)視器的網(wǎng)絡(luò)狀態(tài)由UP變?yōu)镈OWN時,將該任一監(jiān)視器的穩(wěn)定度量值累加一個增量;若該任一監(jiān)視器為主用監(jiān)控器,則判斷該任一監(jiān)控器的穩(wěn)定度量值是否大于等于第一設(shè)定閾值;若判定結(jié)果為是,則從若干備份監(jiān)視器中選擇一個穩(wěn)定度量值小于等于第二設(shè)定閾值的備份監(jiān)視器作為主用監(jiān)視器,并將該任一監(jiān)視器作為備份監(jiān)視器。采用上述方法,根據(jù)各監(jiān)視器的穩(wěn)定度量值,調(diào)整各監(jiān)視器的角色,選擇更穩(wěn)定的監(jiān)視器作為主用監(jiān)視器,從而提升ceph集群的穩(wěn)定性。
技術(shù)領(lǐng)域
本申請涉及數(shù)據(jù)存儲技術(shù)領(lǐng)域,尤其涉及一種ceph集群中監(jiān)視器的管理方法及裝置。
背景技術(shù)
Ceph是一種為優(yōu)秀的性能、可靠性和可擴(kuò)展性而設(shè)計的統(tǒng)一的、分布式文件系統(tǒng)。在Ceph集群中,由若干個監(jiān)視器(monitor)共同負(fù)責(zé)管理、維護(hù)和發(fā)布集群的狀態(tài)信息;在若干個monitor中會選出一個領(lǐng)導(dǎo)者(leader),這些monitor中的其它普通參與選舉成員(peon)在該leader的領(lǐng)導(dǎo)下,生成集群圖(cluster map)的最新版本,然后將該最新版本發(fā)送至Ceph集群中的全體對象存儲設(shè)備(Object-based Storage Device,OSD)以及客戶端(Client)。OSD使用cluster map進(jìn)行數(shù)據(jù)的維護(hù),而Client使用cluster map進(jìn)行數(shù)據(jù)的尋址。一般來說Monitor可單獨部署在物理主機(jī)上,也可以將Monitor和存儲節(jié)點均部署在該物理主機(jī)上。
在進(jìn)行l(wèi)eader選舉時,先由monitor共同形成一個委員會(quorum),然后委員會的成員在內(nèi)部選出leader。每個monitor作為quorum的一員,用于維護(hù)整個ceph集群的健康狀況,維護(hù)著ceph集群中各項重要的信息,是ceph集群中的關(guān)鍵角色,Monitor的健康狀況將直接影響整個ceph集群的穩(wěn)定。
在leader選舉期間,Ceph是無法對外提供服務(wù)的,直到選舉出leader,并在leader的帶領(lǐng)下形成cluster map的master版本。若quorum中存在monitor重啟、網(wǎng)絡(luò)中存在震蕩、延時等不穩(wěn)定因素,會造成quorum中反復(fù)發(fā)起leader選舉。那么,整個monitor集群會一直處于選舉狀態(tài),浪費資源,不利于ceph集群的穩(wěn)定,并且無法對外提供服務(wù)。
發(fā)明內(nèi)容
本申請?zhí)峁┮环Nceph集群中監(jiān)視器的管理方法及裝置,用于解決相關(guān)技術(shù)中存在的由于監(jiān)視器頻繁出現(xiàn)異常而導(dǎo)致quorum中反復(fù)發(fā)起leader選舉,從而導(dǎo)致ceph集群不穩(wěn)定,無法對外提供服務(wù)的問題。
為實現(xiàn)上述目的,本申請實施例采用的技術(shù)方案如下:
第一方面,本申請實施例提供了一種ceph集群中監(jiān)視器的管理方法,上述ceph集群的監(jiān)視器包括若干主用監(jiān)視器和若干備份監(jiān)視器,并針對每一監(jiān)視器維護(hù)有對應(yīng)的穩(wěn)定度量值,上述方法包括:
在監(jiān)測到任一監(jiān)視器的網(wǎng)絡(luò)狀態(tài)由UP變?yōu)镈OWN時,將上述任一監(jiān)視器的穩(wěn)定度量值累加一個增量;
若上述任一監(jiān)視器為主用監(jiān)控器,則判斷上述任一監(jiān)控器的穩(wěn)定度量值是否大于等于第一設(shè)定閾值;
若判定結(jié)果為是,則從上述若干備份監(jiān)視器中選擇一個穩(wěn)定度量值小于等于第二設(shè)定閾值的備份監(jiān)視器作為主用監(jiān)視器,并將上述任一監(jiān)視器作為備份監(jiān)視器,其中,上述第一設(shè)定閾值大于上述第二設(shè)定閾值。
可選地,在將上述任一監(jiān)視器的穩(wěn)定度量值累加一個增量之后,上述方法還包括:
啟動上述任一監(jiān)視器對應(yīng)的衰減定時器,并在當(dāng)前衰減周期內(nèi)按預(yù)設(shè)的衰減函數(shù)對上述任一監(jiān)視器的穩(wěn)定度量值進(jìn)行衰減。
可選地,上述在當(dāng)前衰減周期內(nèi)按預(yù)設(shè)的衰減函數(shù)對所述任一監(jiān)視器對應(yīng)的穩(wěn)定度量值進(jìn)行衰減的步驟包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于新華三技術(shù)有限公司,未經(jīng)新華三技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201811204207.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種通過Zabbix監(jiān)控Ceph集群的方法
- 一種實現(xiàn)Ceph集群融合的方法及裝置
- 一種Ceph分布式存儲系統(tǒng)的資源限制及分配方法
- 數(shù)據(jù)處理方法和裝置
- 一種基于Ceph的跨數(shù)據(jù)中心Oracle高可用實現(xiàn)方法
- 一種基于librbd庫測試rbd上傳速度的方法
- 管理ceph集群的方法及云本地存儲協(xié)調(diào)器
- 一種單機(jī)KVM虛擬化下快速部署多節(jié)點Ceph集群的方法和系統(tǒng)
- 一種分布式存儲集群的自動化部署方法
- 一種OpenPOWER平臺上CEPH系統(tǒng)的使用方法及相關(guān)組件
- 一種集群調(diào)度呼叫業(yè)務(wù)中主叫終端信息顯示方法
- 更新網(wǎng)絡(luò)流量管理設(shè)備同時維持有效性
- 與集群調(diào)度系統(tǒng)進(jìn)行通信的方法、群集接入網(wǎng)關(guān)及系統(tǒng)
- 一種管理集群通信系統(tǒng)資源的方法
- 基于Kubernetes和OpenStack容器云平臺多集群構(gòu)建方法、介質(zhì)、設(shè)備
- 一種容災(zāi)系統(tǒng)、容災(zāi)處理方法、監(jiān)控節(jié)點和備份集群
- 一種ETCD集群恢復(fù)方法、系統(tǒng)、設(shè)備及計算機(jī)介質(zhì)
- 混合云場景下保證可用集群數(shù)量的方法、裝置及系統(tǒng)
- 一種集群拓?fù)涓路椒?、系統(tǒng)、設(shè)備及計算機(jī)存儲介質(zhì)
- 集群切換方法、集群切換裝置、電子設(shè)備及可讀存儲介質(zhì)





