1、基础运维平台的演进应该逐步涵盖环境部署、监控、云管理平台、域名带宽管理平台、集群管理、安全审计、采购平台和工单信息。
2、关于机器的管理,应该从单台机器到整个集群,都纳入集中管理的范围,相关的日常维护操作也应该在平台上统一执行。
3、进程与日志管理也是运维平尊怠哉砑台需要具有的核心功能之一,快速安全的进行进程启停的处理,及时获取相关日志信息,对于提升运维效率至关重要。
4、监控应该提供用户视角的黑盒监控,支持多种监控插件,能进行灵活的语义控制,能保存完整的现场快照。
5、此外,监控系统还应该具备系统视角的白盒监控能力,能支持灵活的语义定制,同时可以设置灵活的报警策略。
6、资源的全流程管理也应该纳入运维平台:从资源鲱牮编讨申请、审批,到资源的分配、部署,以及后续的扩容、上线、费用结算等环节都应纳入。
7、优化是运维工作亮点的来源,因此,运维平台要能够持续的为系统优化提供支撑,包括基础数据层面的以及资源调度方面的。