創立于1929年的周大福,是全球著名的珠寶集團,零售網絡遍及中國、日本、韓國、東南亞與美國等。周大福信息部支撐著集團內外幾千節點、數十套系統的穩定運行。
按流程,當業務發生故障后,由店員先上報分公司IT人員,再上報總部的服務臺轉給信息部門,總部運維同事收到通知時往往已是緊急狀態,只能放下手頭的工作立即處理。讓IT人員工作非常被動。
處理的過程也并非一帆風順。過往的監控系統僅支持主機監控,覆蓋不全面,也沒有應用資源拓撲,很難第一時間定位到引起故障的節點,通過人工排查的方式解決故障經常會耗費數小時之久。
周大福有四個分布在不同城市的數據中心,互不相通,各區自行管理建設,集團總部難以進行統一的規劃和管理。使用的運維工具功能單一,僅能解決某些方面的問題;集成打通難度大成本高,無法覆蓋從預防問題到解決問題的全流程,類似報障延時的情況時有發生。而隨著新技術的應用、業務規模的發展,對運維管理也提出了更高的要求。
周大福信息部希望改變這種局面,化被動為主動,及時發現甚至提前發現故障,將風險扼殺,保障業務更穩定運行。
WeOps助力開啟運維數字化轉型之路
在評估調研了市面上的運維廠商后,周大福最終決定采用進嘉為科技旗下的嘉為藍鯨WeOps一站式運維平臺。
WeOps功能齊備,一套平臺即具備CMDB、監控告警、故障自愈、自動化操作、工單、大屏等覆蓋運維全過程的功能,互相聯動不割裂,且平臺支持接入以往各區域自建的運維工具,做到統一納管。底層采用騰訊藍鯨PaaS架構,具備靈活的可擴展性,運維系統可以持續建設;內置開發框架提升運維開發能力,真正實現自主可控。
不到一個月,WeOps在周大福正式上線,一期接入600多節點,效果立現:
1、以業務為中心構建配置管理平臺,統一納管四地數據中心,自動生成應用拓撲;支持自動發現和采集、手動導入等,后續其他運維場景調用配置管理數據時自動回寫,確保數據的實時性和準確性。
2、透過大屏的直觀展示,可以清晰看到資源和業務的實時情況。過往報障延時的情況得到妥善解決。
WeOps上線后,除了主機監控,監控范圍增加了操作系統、數據庫、中間件、虛擬化、云平臺、基礎應用等維度,運維人員可以主動針對影響業務的關鍵指標設置發現和解決問題的流程。當指標超過告警閾值后,自動觸發后臺自愈流程:通過郵件和短信發送至對應責任人,對應人員立即進行評估決策,點擊同意處理后,平臺即按照設置自動化修復故障,響應效率提升90%以上。
同時,通過平臺統一告警中心,對比從前每天上千條告警信息有效收斂至幾十條,運維人員擺脫告警風暴,能更為聚焦定位問題和解決問題。
除此之外,運維自動化程度也得到了顯著提升。以往,部門DBA每天7點就需要到公司,耗費1個小時依次登錄到數據庫系統服務器逐個進行巡檢,排除隱患,以保證業務系統在工作時間的正常運行。WeOps上線后,DBA在運維平臺中創建周期任務,每天7點30分,系統自動按照設定對所有數據庫作業完成情況進行檢查,并將巡檢結果匯總發送到郵箱,DBA只需要使用1分鐘查看報告即可。
類似的場景還有很多,以前只能通過人工完成的重復性工作,現在可以通過WeOps自動完成。
公司內部IT人員表示:“WeOps的上線,讓我們有更多的精力投入到更有價值的工作中去。”
訂閱分期,讓運維升級變得簡單
采用訂閱制的方式,讓運維轉型的成本不再高昂。如果按照傳統方式,逐一建設全面的運維系統,不付出幾百萬很難見到成效。WeOps上線周期短、訂閱制分期付費,見效快、試錯成本低,運維場景功能可以隨著使用逐步加深和豐富。
而企業對于產品功能的改進建議也得到很好的反饋,經研判后列入產品自然迭代排期中,無需繁重的定制開發。例如遠程管理功能,周大福信息部希望在收到服務器告警后,能直接通過WeOps作為統一入口一鍵進入對應服務器進行管理。WeOps產品部收到此需求后討論決定列入產品自然迭代中,如今新功能已經上線使用。
WeOps穩定高效地支撐周大福遍布全球的零售網絡、蓬勃發展的智慧零售業務,自動化僅是開始。未來,周大福信息部將基于平臺,通過能力與數據的沉淀,進一步深化智能運維場景應用,升級運維組織和管理模式,更加從容面對來自新技術、新業務的挑戰!
本文為企業推廣,本網站不做任何建議,僅提供參考,作為信息展示!
推薦閱讀:葉紫網
網友評論
請登錄后進行評論|
0條評論
請文明發言,還可以輸入140字
您的評論已經發表成功,請等候審核
小提示:您要為您發表的言論后果負責,請各位遵守法紀注意語言文明