随着云计算和互联网的高速发展,大量应用需要横跨不同网络终端,并广泛接入第三方服务(如支付、登录、导航等),IT系统架构越来越复杂。快速迭代的产品需求和良好的用户体验,需要IT运维管理者时刻保障核心业务稳定可用,因此,企业运维中的痛点和难点也急需解决。海天应市场需求,研发了HTM运维管理系统,鼎力支撑企业IT运维管理。
痛点分析:国内的IT运维还处于紧急救火的阶段,运维人员疲于应对。网络中断、应用卡顿、响应速度慢,服务器宕机等各种突发故障都可能导致业务成交失败,而查找系统运行日志又特别费时费力,发现故障如同大海捞针,而目前的一些运维监控工具普遍存在实用性差、使用效率低、在被监控端安装agent或插件,增加资源额外消耗和部署风险等问题。 那么,面对新的架构和应用场景,如何做运维管理系统呢?
海天观点:
1、管理谁?
运维监控管理的主体对象:从面向单点IT资源转为面向业务。特别是整个业务系统的健康状态。
2、需要具备的核心功能:
• 监控每个API接口和模块化应用性能变化情况和指标;
• 用监控大屏的方式显示核心监控对象,直观展示给运维主管及企业管理层;
• 按周、月等周期查看运维报告并进行趋势分析,解决传统运维工具数据导出困难的问题;
• 快速发现故障节点,以减少业务中断带来的损失。
3、拥有生态、高效、优化等优异特性:不在被监控端安装任何agent或插件,降低资源额外消耗和部署风险。
实际上,海天之所以提出这样的观点还是基于目前的运维管理应用场景的特点:欲从根本上解决重大节日得运维压力问题,主要在于做好平日的运维工作,降低重保期间出问题的概率。通过HTM平日运维人员就可以透彻地了解系统的情况,直观地界面和按周期导出的运维报告,查看服务器负载、网络流量等,有隐患的硬件设备重保前赶紧更换,性能问题提前优化,内存不够就提前加内存等等,这样一来重保期间只需要处理突发事件就可以了。即便出现了重大问题,系统恢复的也会容易得多。这也是HTM产品线价值所在。
海天起点将一如既往地鼎力支撑企业IT运维,做企业业务系统健康的守护者,管理并提升客户体验。