在企业的云迁移清单中,几个重要步骤可以确保实现云中运营的业务价值和应用程序的可靠性。其中一个关键步骤是为云计算的基础设施建立整体监控策略,其中包括网络、安全性、计算和存储以及应用程序、数据库和服务。添加监控功能可提供意外问题的早期警告,这对于管理容量、成本、长期可靠性至关重要。
不同的云迁移策略以不同的方式推动业务敏捷性,但投资于监控(特别是应用程序监控)是云迁移清单中列出的这些方案的首要任务:
˙适用于将应用程序直接转换为云计算基础设施的提升和转移策略。监视可以指示意外的性能问题。
˙针对云中转换,其中应用程序经过重新设计和优化以在云中运行。添加的监控可以提醒用户注意新的事件类型和无法预料的容量问题。
˙将应用程序部署到多个云平台时。增加的监控功能可以报告延迟问题,并帮助确定跨多个微服务的复杂事务的根本原因。
监控云计算应用程序和服务可能需要新工具
不幸的是,添加新的监控功能可能并不容易。对于开始采用云计算的组织来说,需要考虑一整套新的监控工具和警报类型。已经投资和运营数据中心的组织可能会发现,用于虚拟化系统和私有云的内部部署工具可能无法用于公共云应用程序、服务以及无服务器计算。即使组织采用多云策略,他们也可能希望利用每个云计算供应商的内置监控功能。这实质上意味着任何云迁移都可能引入新的监控工具。
云迁移的另一个因素是,新用户通常需要参与配置监控工具和响应警报。例如,新的云原生应用程序可能有开发人员、DevOps工程师和业务所有者的参与,他们是关于监控什么和发生事件时应该向谁发出警报的主题专家。新成员可能使用不同的工作流工具:新的云优先团队可能使用JIRA和Slack,而数据中心团队可能使用ServiceNow和Skype for Business。
最重要的是,即使有很好的理由将监控添加到云迁移清单中,也会增加复杂性。当集中监控策略作为云迁移或多云策略的一部分执行时,这可以实现最小化。
实施集中监控策略
通过查看过去如何部署和配置监控工具,企业可以更好地了解集中监控解决方案的需求和功能。
大多数IT运营团队都从一些基本的监控工具(如Nagios和Perfmon)或平台(如Solarwinds、Whatsup Gold和OpManager)开始报告网络和基础设施。这就是运营团队应该在响应基础设施问题方面更强大的原因,但在应对最终用户、应用程序或数据库性能问题时历来表现不佳。
除基础设施监控工具外,运营团队更常见的是根据需要添加监控工具。在某些情况下,添加工具是为了响应一系列重复出现的问题,例如,监视不可靠的数据库是否存在容量和性能问题。在其他情况下,监控与添加新的基础设施(如新的数据中心位置、网络、企业系统或存储设备)紧密相连。添加云计算基础设施属于第二类。
在添加新的监控工具时,分配给工程师的工程师通常会配置该工具以设置报告和警报,以便直接发送给其团队。这可能是快速配置报告和警报的最简单方法,但从长远来看,它创建了对信息的孤立访问,以及多个团队从不同工具接收警报的可能性。
更好的方法是集中监控。每个监控解决方案都会收集数据,并具有对诊断问题有用的专有报告。但这些相同的监视数据随后被聚合到一个集中的监视程序中,该监视程序随后可以在更广泛的数据范围内集中执行许多功能。这种集中化有几个好处:
˙可以从多个监控工具对逻辑事件进行逻辑分组。来自独立监测工具的警报不再盲目地向独立团队发送。相反,警报在逻辑上整合为事件,使用更广泛的数据集进行分析,并智能地路由到正确的团队进行响应。
˙中央系统可以分析可能指示容量、安全性或应用程序可用性问题的不断变化的趋势。
˙通过集中监控工具可以更有效地实现与工作流工具的集成,而不是在点对点集成中进行连接。
首先通过集中数据和与工作流工具的集成来实现智能化。当组织实施自主操作,并利用开放式机器学习将警报智能分组为可管理的事件时,真正的好处成为现实。
云迁移是实施集中监控的最佳时机
创建集中式监控解决方案的理想时机是将应用程序和服务迁移到云端。企业仍然必须在基础设施、应用程序和服务级别完成配置监控的过程。但是,企业没有在这些解决方案中配置升级,而是采取步骤将监控数据和警报集成到中央系统中。这将使工作从在单个监控工具中实现升级转移到了集中化的工具中。最后,IT运营团队可以轻松获得集中化带来的所有好处。
但这也取决于实施集中监控所采取的方法,并且有几种策略。实现专有的数据湖和报告工具可能提供最大的灵活性,但它确实需要在开发数据湖或数据仓库、构建报告、配置警报以及与工作流工具集成方面进行投资。BigPanda等公司通过内置集成、机器学习、自主操作和统一分析提供集中监控。
集中监控功能非常强大,尤其是当机器学习正确地将多个警报关联到单个事件时,可以更快、更轻松地识别根本原因。这就是在核对清单中包含云迁移中的集中监控的原因。它通过提供更丰富的监控措施来平衡添加基础设施新功能的风险,而且它可以比在多个监控工具中配置警报更有效地实现。