GBase新聞
GBase 8s監(jiān)控平臺(tái)系列之安裝簡(jiǎn)介
平臺(tái)簡(jiǎn)介
統(tǒng)一數(shù)據(jù)平臺(tái)監(jiān)控與運(yùn)維系統(tǒng)是南大通用數(shù)據(jù)技術(shù)股份有限公司開(kāi)發(fā)的數(shù)據(jù)庫(kù)配套工具。為用戶提供了可視化的數(shù)據(jù)庫(kù)節(jié)點(diǎn)監(jiān)控?cái)?shù)據(jù),及時(shí)的報(bào)警功能,直觀的數(shù)據(jù)庫(kù)節(jié)點(diǎn)狀態(tài)和性能趨勢(shì)展示,可靠的數(shù)據(jù)分布視圖和數(shù)據(jù)庫(kù)節(jié)點(diǎn)會(huì)話、系統(tǒng)日志等展示。
統(tǒng)一數(shù)據(jù)平臺(tái)監(jiān)控與運(yùn)維系統(tǒng)主要包含采集代理、采集中心和監(jiān)控網(wǎng)站三大部分功能模塊:
Agent:監(jiān)控?cái)?shù)據(jù)采集代理,部署到所有待采集數(shù)據(jù)的數(shù)據(jù)庫(kù)節(jié)點(diǎn)。
Center:數(shù)據(jù)采集中心,用于統(tǒng)一協(xié)調(diào)各個(gè)Agent的數(shù)據(jù)采集,并對(duì)采集到的數(shù)據(jù)進(jìn)行邏輯運(yùn)算處理,存儲(chǔ)到資源庫(kù)。
Website:監(jiān)控網(wǎng)站,提供監(jiān)控界面,與用戶進(jìn)行交互,完成數(shù)據(jù)庫(kù)節(jié)點(diǎn)監(jiān)控功能。
安裝與初始化
解壓自動(dòng)安裝包
本平臺(tái)支持多個(gè)操作系統(tǒng),以Linux操作系統(tǒng)為例,其他操作系統(tǒng)使用相應(yīng)的安裝包。假設(shè)安裝包為GBase8sV8.8Monitor_1.0.0_1_Linux_x86_64.tar,并將其放置到/opt/gcm_install目錄下,并解壓該壓縮包。
啟動(dòng)服務(wù)與連接配置
在部署web端的時(shí)候采用全局的統(tǒng)一配置,就可以實(shí)現(xiàn)web端的部署和啟動(dòng)。簡(jiǎn)化流程,從而實(shí)現(xiàn)安裝部署的易用性,并實(shí)現(xiàn)了再web端進(jìn)行采集中心以及采集代理的頁(yè)面化安裝配置,減化了各自安裝的繁瑣步驟。
步驟一,進(jìn)入解壓好的安裝包,進(jìn)入tomcat的bin目錄,執(zhí)行./ startup.sh命令啟動(dòng)tomcat(文檔中使用tomcat)。
步驟二,啟動(dòng)tomcat服務(wù)后,訪問(wèn)http://[ip]:[port]/gcmonitor頁(yè)面,
點(diǎn)擊“配置”按鈕進(jìn)行全局配置頁(yè)面。
步驟三,根據(jù)提示填寫配置頁(yè)面中的相關(guān)參數(shù),如下圖所示:
步驟四,填寫后點(diǎn)擊“連接”保存配置,后臺(tái)保存信息并校驗(yàn)配置項(xiàng)的可用性。
步驟五,根據(jù)配置的參數(shù),后臺(tái)程序修改應(yīng)用中的properties配置文件。
即可完成數(shù)據(jù)庫(kù)的初始化的配置。
在瀏覽器中輸入統(tǒng)一監(jiān)控網(wǎng)站地址,如:http://[ip]:[port]/gcmonitor,進(jìn)入用戶登錄界面,如下圖所示:
輸入用戶名、密碼后(默認(rèn)admin:admin),單擊回車或者點(diǎn)擊“登錄”按鈕,系統(tǒng)將進(jìn)行用戶校驗(yàn),如果用戶名和密碼校驗(yàn)正確,則進(jìn)入統(tǒng)一監(jiān)控主界面;否則提示錯(cuò)誤信息:登錄失敗,請(qǐng)檢查用戶名和密碼!
在成功登錄監(jiān)控網(wǎng)站后,將進(jìn)入到網(wǎng)站主界面,如下圖所示:
當(dāng)初始化登錄監(jiān)控平臺(tái),目前尚未配置采集中心和采集代理,所以提示采集中心不可達(dá)。也并未采集到任何數(shù)據(jù)。若此時(shí)采集中心與采集代理都能正常連通,則可以顯示:數(shù)據(jù)庫(kù)節(jié)點(diǎn)名稱,數(shù)據(jù)最后更新時(shí)間,版本信息,報(bào)警信息,數(shù)據(jù)庫(kù)空間利用率,VP繁忙率,數(shù)據(jù)庫(kù)節(jié)點(diǎn)模式,會(huì)話數(shù),DB Page R/W ,虛擬內(nèi)存使用率。
新增GBase 8s監(jiān)控
新增一個(gè)GBase 8s的監(jiān)控,分為3個(gè)步驟:新增8s集群、初始化采集中心、初始化采集代理,這三個(gè)步驟通過(guò)監(jiān)控平臺(tái)管理來(lái)完成。
平臺(tái)管理
平臺(tái)管理主要用于提供數(shù)據(jù)庫(kù)節(jié)點(diǎn)監(jiān)控的基礎(chǔ)數(shù)據(jù)維護(hù)。平臺(tái)管理包括了用戶、角色、數(shù)據(jù)庫(kù)節(jié)點(diǎn)、采集中心、監(jiān)控策略、報(bào)警級(jí)別、監(jiān)控日志、監(jiān)控歷史數(shù)據(jù)管理八大功能模塊。
用戶可以通過(guò)在主頁(yè)導(dǎo)航中點(diǎn)擊“平臺(tái)管理”進(jìn)入到平臺(tái)管理界面,如下圖所示:
新建8s集群
選擇平臺(tái)管理后,可以新建8s集群,如下圖所示:
在彈出框中填寫對(duì)應(yīng)的信息,并選擇是否新建策略,即可完成新建集群的工作。
新建集群后,即可在右側(cè)操作欄,進(jìn)行初始化采集中心和采集代理的工作。
初始化采集中心
步驟一,頁(yè)面中進(jìn)入采集中心管理;
步驟二,輸入相關(guān)的配置信息,如下圖所示:
步驟三,保存成功后進(jìn)行自動(dòng)化安裝(安裝前需要用戶輸入服務(wù)器的連接密碼);
步驟四,安裝成功后,點(diǎn)擊“啟動(dòng)”按鈕啟動(dòng)center;
步驟五,查看列表中的狀態(tài),確保安裝啟動(dòng)完成;
初始化采集代理
步驟一, 首先進(jìn)入采集代理服務(wù)管理頁(yè)面,點(diǎn)輸入相關(guān)的配置信息,如下圖所示:
步驟二,保存成功后進(jìn)行自動(dòng)化安裝(安裝前需要用戶輸入服務(wù)器的連接密碼);
步驟三,點(diǎn)擊服務(wù)狀態(tài)和監(jiān)控狀態(tài)的“啟動(dòng)”按鈕,啟動(dòng)采集代理;
采集中心和采集代理正常工作下,等待一個(gè)采集周期的數(shù)據(jù)回傳,在集群狀態(tài)頁(yè)面就可以顯示采集信息了。
監(jiān)控展示
數(shù)據(jù)庫(kù)整體狀態(tài)監(jiān)控
在集群監(jiān)管頁(yè)面中,我們可以監(jiān)管本平臺(tái)所有類型實(shí)例的集群,并展示各個(gè)集群當(dāng)前的狀態(tài),單獨(dú)選擇某個(gè)集群,可以查看其下所有采集中心與采集代理的節(jié)點(diǎn)情況。
數(shù)據(jù)庫(kù)節(jié)點(diǎn)監(jiān)管
點(diǎn)擊數(shù)據(jù)庫(kù)節(jié)點(diǎn)監(jiān)管主界面的8s數(shù)據(jù)庫(kù)節(jié)點(diǎn)名稱,進(jìn)入該數(shù)據(jù)庫(kù)節(jié)點(diǎn)的節(jié)點(diǎn)概要信息界面,左側(cè)顯示8s數(shù)據(jù)庫(kù)節(jié)點(diǎn)監(jiān)控導(dǎo)航欄,界面顯示如下:
本界面包括三部分功能,
節(jié)點(diǎn)概要信息:數(shù)據(jù)庫(kù)當(dāng)前狀態(tài),以及基本信息;
趨勢(shì)圖信息:系統(tǒng)信息趨勢(shì)圖,以及數(shù)據(jù)庫(kù)信息趨勢(shì)圖;
Top Busy Session列表信息。
會(huì)話監(jiān)控概要信息
會(huì)話監(jiān)控中的會(huì)話監(jiān)控概要信息,會(huì)向趨勢(shì)圖中實(shí)時(shí)加載當(dāng)前會(huì)話活躍的sql,數(shù)據(jù)庫(kù)事務(wù)以及鎖請(qǐng)求。
Top Lock Table
本功能展示top50的lock table的鎖情況,如下圖所示:
報(bào)警信息
報(bào)警信息展示了所選時(shí)間范圍內(nèi),不同類型的報(bào)警信息以及具體報(bào)錯(cuò)信息,包含報(bào)錯(cuò)所在的ip以及對(duì)應(yīng)的指標(biāo)。可以通過(guò)該頁(yè)面進(jìn)行錯(cuò)誤信息的一覽,以便及時(shí)有效的根據(jù)報(bào)警級(jí)別,進(jìn)行報(bào)警的歸類以及處理。
性能分析報(bào)告
性能分析報(bào)告通過(guò)選擇性能分析包括的分析時(shí)段,以及選擇需要分析的子項(xiàng),系統(tǒng)會(huì)自動(dòng)給出一個(gè)分析報(bào)告。
可以查看執(zhí)行數(shù)據(jù)庫(kù),指定時(shí)間段,指定子項(xiàng)的分析報(bào)告,點(diǎn)擊“結(jié)果分析”,在結(jié)果分析下方展示具體的分析報(bào)告,還有對(duì)應(yīng)的指標(biāo)的趨勢(shì)圖表。
如上圖,選擇CPU使用情況趨勢(shì)圖后,分析出當(dāng)前數(shù)據(jù)庫(kù)活動(dòng)最高的表還有對(duì)應(yīng)的cpu平均繁忙率,數(shù)據(jù)庫(kù)繁忙率和操作系統(tǒng)平均加載情況的趨勢(shì)圖,更加清晰的了解過(guò)去某一段時(shí)間內(nèi)的情況。
本平臺(tái)還支持將所選分析報(bào)告導(dǎo)出Word已經(jīng)pdf文檔。
總結(jié)
統(tǒng)一數(shù)據(jù)平臺(tái)監(jiān)控與運(yùn)維系統(tǒng)支持對(duì)單個(gè)或多個(gè)數(shù)據(jù)庫(kù)節(jié)點(diǎn)的監(jiān)控,通過(guò)對(duì)數(shù)據(jù)庫(kù)節(jié)點(diǎn)系統(tǒng)資源利用情況、網(wǎng)絡(luò)通訊情況、進(jìn)程運(yùn)行情況和數(shù)據(jù)庫(kù)節(jié)點(diǎn)運(yùn)行狀態(tài)等信息的采集,并根據(jù)用戶設(shè)定的報(bào)警策略進(jìn)行計(jì)算,如有報(bào)警,及時(shí)通知用戶報(bào)警信息,以避免數(shù)據(jù)庫(kù)節(jié)點(diǎn)出現(xiàn)故障。支持采集信息持久化到數(shù)據(jù)庫(kù)中,并提供從多個(gè)維度對(duì)數(shù)據(jù)庫(kù)節(jié)點(diǎn)的性能進(jìn)行分析、展示,大大方便用戶對(duì)數(shù)據(jù)庫(kù)節(jié)點(diǎn)進(jìn)行調(diào)優(yōu)或排查問(wèn)題。