云鷹平臺(tái)是光大科技打造的面向云原生的全鏈路可觀察性平臺(tái)。支持?jǐn)?shù)據(jù)中心可視化、拓?fù)鋭?dòng)態(tài)發(fā)現(xiàn)、調(diào)用鏈路與物聯(lián)網(wǎng)追蹤、監(jiān)控日志系統(tǒng)對(duì)接等功能;提供全鏈路可視化、指標(biāo)分析、異常告警、全鏈路壓測(cè)、輕量混沌工程、時(shí)光機(jī)等服務(wù)。平臺(tái)旨在為開(kāi)發(fā)運(yùn)維人員全面掌握系統(tǒng)的工作原理、快速發(fā)現(xiàn)與分析業(yè)務(wù)應(yīng)用的故障與性能瓶頸,提升開(kāi)發(fā)效率和服務(wù)穩(wěn)定性提供強(qiáng)大助力。
關(guān)聯(lián)多種監(jiān)控?cái)?shù)據(jù)并深度融合告警、指標(biāo)、日志和追蹤服務(wù),基于可觀察性理念,提供從告警到鏈路追蹤層層深入的完整故障排查工作流,步步引導(dǎo)直達(dá)問(wèn)題核心,全面提升監(jiān)控體驗(yàn)與問(wèn)題處理效率。
基于代理與網(wǎng)絡(luò)探針實(shí)現(xiàn)的鏈路追蹤服務(wù)。可以為各個(gè)平臺(tái)各種開(kāi)發(fā)語(yǔ)言的應(yīng)用與數(shù)據(jù)庫(kù)、MQ、NoSQL等服務(wù)提供無(wú)侵入的鏈路追蹤服務(wù)。提高分布式應(yīng)用、微服務(wù)體系中問(wèn)題定位和架構(gòu)性能優(yōu)化的效率。
基于鏈路信息與指標(biāo)數(shù)據(jù)動(dòng)態(tài)發(fā)現(xiàn)并自動(dòng)完成服務(wù)調(diào)用的可視化拓?fù)洹R杂脩粲押玫姆绞骄_及時(shí)地展示服務(wù)調(diào)用關(guān)系和關(guān)鍵請(qǐng)求數(shù)據(jù)。
支持界面展示信息的高度可定制化??梢愿鶕?jù)具體需求突出展示重點(diǎn)關(guān)注目標(biāo)、或忽視一些不重要不關(guān)心的數(shù)據(jù)。不同的數(shù)據(jù)也可以通過(guò)方法的面板靈活選擇不同的呈現(xiàn)形式。
支持對(duì)接并聚合指標(biāo)、日志、追蹤等多種監(jiān)控?cái)?shù)據(jù)。主流數(shù)據(jù)系統(tǒng)均提供對(duì)接支持,最大化兼容現(xiàn)有監(jiān)控架構(gòu)。通過(guò)對(duì)多維度數(shù)據(jù)的聚合分析快速定位問(wèn)題,進(jìn)一步提升排查效率。
開(kāi)發(fā)者可以通過(guò)GraphQL、RESTAPI獲取云鷹平臺(tái)中鏈路數(shù)據(jù),并將其集成在監(jiān)控告警系統(tǒng)、大數(shù)據(jù)分析、彈性伸縮等場(chǎng)景中。
通過(guò)自定義追蹤指標(biāo),可以對(duì)實(shí)例中的各類指標(biāo)進(jìn)行收集,如鏈路延遲、JVM堆大小、實(shí)例GC次數(shù)、數(shù)據(jù)庫(kù)慢查詢等;也可以為不同的指標(biāo)設(shè)置不同的預(yù)處理方式,如收集一定時(shí)間內(nèi)某參數(shù)的百分位數(shù)等。更好地幫助開(kāi)發(fā)者定位問(wèn)題所在。
對(duì)于常見(jiàn)場(chǎng)景提供了相應(yīng)的數(shù)據(jù)探針插件,同時(shí)提供基于各類語(yǔ)言開(kāi)發(fā)的SDK工具,可以為各種場(chǎng)景開(kāi)發(fā)定制合適的日志指標(biāo)與追蹤數(shù)據(jù)上報(bào)方式。
平臺(tái)支持多租戶和RBAC等多種安全特性。在面板配置,數(shù)據(jù)源等多個(gè)維度提供高可定制化的數(shù)據(jù)隔離和訪問(wèn)控制策略,通過(guò)靈活的授權(quán)認(rèn)證機(jī)制避免數(shù)據(jù)泄露,確保信息安全。
以可視化方式為指標(biāo)度量自由設(shè)置告警閾值,閾值被突破后將自動(dòng)觸發(fā)告警,告警可發(fā)送到諸如郵箱、企業(yè)微信、釘釘?shù)榷喾N內(nèi)置通知器或者其他告警平臺(tái)。
支持對(duì)接豐富的外部系統(tǒng),如物聯(lián)網(wǎng)、數(shù)據(jù)中心CMDB、網(wǎng)絡(luò)監(jiān)測(cè)系統(tǒng)、CI/CD流水線、IaaS平臺(tái)、PaaS平臺(tái)、統(tǒng)一日志與監(jiān)控系統(tǒng)等,持續(xù)收集各系統(tǒng)特定數(shù)據(jù)并進(jìn)行實(shí)時(shí)追蹤與展示,幫助開(kāi)發(fā)和運(yùn)維人員更加清晰直觀地了解系統(tǒng)信息,全面掌控系統(tǒng)整體狀態(tài)。
云鷹平臺(tái)提供了強(qiáng)大的數(shù)據(jù)采集能力與優(yōu)秀的可視化界面。在進(jìn)行全鏈路壓測(cè)時(shí)可以通過(guò)云鷹平臺(tái)輕松的觀測(cè)整個(gè)系統(tǒng)中各個(gè)鏈路的響應(yīng)時(shí)間,各個(gè)實(shí)例、端點(diǎn)、服務(wù)的壓力變化。而云鷹平臺(tái)本身帶來(lái)的性能損耗非常的小,可以讓開(kāi)發(fā)者得到盡可能接近實(shí)際場(chǎng)景的測(cè)試結(jié)果,進(jìn)而更加精確的進(jìn)行容量評(píng)估。
通過(guò)時(shí)刻動(dòng)態(tài)生成的網(wǎng)絡(luò)拓?fù)?,開(kāi)發(fā)者可以觀察到系統(tǒng)中各個(gè)應(yīng)用之間依賴關(guān)系。而在進(jìn)行混沌工程實(shí)踐的情況下,開(kāi)發(fā)者可以輕松的發(fā)現(xiàn)導(dǎo)致應(yīng)用不可用的因素都包括哪些位置。從而能夠針對(duì)性的修復(fù)并提高系統(tǒng)在故障環(huán)境下的穩(wěn)定性。
通過(guò)云鷹平臺(tái),可以精準(zhǔn)的發(fā)現(xiàn)微服務(wù)調(diào)用拓?fù)潢P(guān)閉和潛在架構(gòu)的風(fēng)險(xiǎn),為運(yùn)維人員和架構(gòu)師提供可靠的輔助信息,以便于快速修復(fù)問(wèn)題和架構(gòu)性能優(yōu)化。結(jié)合日志可以做到業(yè)務(wù)關(guān)聯(lián)的追蹤可視化,幫助運(yùn)營(yíng)人員在特定場(chǎng)景下做到更明確的調(diào)整和優(yōu)化。
通過(guò)云鷹平臺(tái),開(kāi)發(fā)者可以追蹤到一個(gè)應(yīng)用從編譯到上線的每一個(gè)過(guò)程。及時(shí)的確認(rèn)問(wèn)題所在環(huán)節(jié),并快速的為其做出響應(yīng)。對(duì)于開(kāi)發(fā)語(yǔ)言多,機(jī)器多,實(shí)例多的云原生應(yīng)用來(lái)說(shuō),云鷹平臺(tái)提供了一個(gè)統(tǒng)一的、穩(wěn)定的、快速的監(jiān)控平臺(tái)。為云應(yīng)用提供全方面不間斷的采集監(jiān)控能力。