背景和挑戰
隨著(zhu)保險業務(wu)(wu)的(de)(de)不斷發展、規模逐漸壯(zhuang)大,應用(yong)逐步微服(fu)務(wu)(wu)化、核心業務(wu)(wu)系統(tong)相繼上云,以(yi)及(ji)業務(wu)(wu)系統(tong)上線的(de)(de)高頻次需求(qiu),給IT運維(wei)支撐帶(dai)來(lai)了(le)非(fei)常大的(de)(de)挑戰。同時,傳統(tong)豎(shu)井的(de)(de)專(zhuan)業組、點對點式(shi)運維(wei)模式(shi),對如何保障應用(yong)的(de)(de)高質(zhi)量(liang)穩定性、業務(wu)(wu)的(de)(de)高度連續(xu)性、應對新技術(shu)棧的(de)(de)管(guan)理等都帶(dai)來(lai)了(le)巨(ju)大的(de)(de)壓力。
技術壓力
云化后技術架構復雜、技術棧驟增,導致運維難度成倍增加。故障發現/定位/解決能力的覆蓋全面性及深度愈發困難。
管理壓力
不同監控告警系統同時分散運行,形成數據孤島,無法及時有效地發現和定位問題。各部門人員獨自為戰,橫向管理成本過高。
業務壓力
業務上線的“高發布率、高穩定性”給運維人員帶來巨大挑戰,對于業務運行的連續性提出了更高的要求。
人員壓力
原有運維人員技能無法滿足云化后的運維開發需求,運維操作技能單一、運維思維固化,人力成本逐年上升。