通常情况下,企业或团队的首席财务官或主管需要对最终产生的所有财务成本负责。而在IT部门,IT负责人需要掌握应用程序使用和代码开发资源所产生的成本。而很多企业已将部分或全部项目和应用程序迁移到公共云,而且从生产的角度来看,事情似乎运行得很顺利,因为大多数公司都对迁移和转换感觉非常好。
也许很多企业被迁移到云端可以降低成本这一承诺所吸引,但当收到云计算提供商高昂的账单之后可能会大吃一惊。
很多人想从预留实例、按需成本、混合费率等因素来理解云计算成本账单,但这让人们无法更深入地了解在哪里可以优化其支出。
这甚至需要企业的会计部门来理解定价结构,服务本身的情况也同样令人难以置信。事实上,仅在AWS公司的云平台中就至少有500000个库存量单元(SKU)的价格组合。此外,谁可以在什么时候启动任何特定的资源,企业团队对此可能并没有限制,其本质上将使问题复杂化,特别是当继续运营时,这显然将会产生大量费用。
事实上,解决这个复杂且不断变化的问题并不是一件简单的事情,它需要一种全面而密切的方法,从了解成本和性能优化的各种机会开始。这就是云计算成本优化的六大支柱所起到的作用。
(1)预留实例(RI)
AWS保留实例、Azure保留虚拟机实例,以及谷歌云承诺使用折扣,这些使云计算资源的使用时间变得短暂,允许企业提前估计将要使用的内容。这也使企业有权在预先计划时享受大幅折扣,这最终会成为一个巨大的财政激励。
大多数云计算成本优化错误地开始和结束,为企业提供了并不理想的解决方案。估计预留实例(RI)购买的资源可通过云计算提供商直接和第三方优化工具获得。例如,VMware公司的CloudHealth可根据企业当前的云平台使用情况,在几个月内提供有关购买预留实例(RI)的详细信息,并将帮助企业管理预留实例(RI)生命周期。
这里要考虑的两个主要因素是风险容忍度和集中式预留实例(RI)管理组合。
·风险容忍度是指确定企业愿意预先支出多少费用,以增加未来收益或收回利润的可能性。例如,企业是否可以承担风险,并使用预留实例(RI)覆盖70%的工作负载?或者是否担心消费,因此希望将其限制在20%~30%左右?此外,企业能在未来几年内预测多久?当然,一年是风险最小的,但是如果是三年,这也是一个更大的财务承诺,会节省更多的成本。
·集中式预留实例(RI)管理组合允许跨组织单元更深入地预留实例(RI)覆盖,从而带来更大的节约机会。例如,单个应用程序团队可能拥有有限的现金池来购买预留实例(RI)。或者根据企业的目标,集中的整个组织方法将涵盖所有工作负载的所有部门和团队。当然,这种方法还需要与不同的小组进行持续的沟通,以了解创建和执行成功的预留实例(RI)管理计划所需的当前和未来资源。
一旦确定了风险承受能力,并将企业的方法集中到预留实例(RI),企业就可以利用这个优化选项。但是,仅限预留实例(RI)的优化策略是短视的。它只允许企业利用云计算供应商提供的定价选项。将预留实例(RI)购买与其他5个优化支柱叠加在一起非常重要,可以实现最有效的优化。
(2)自动停放
云计算的一个好处是能够根据需要启动或减少资源。然而,这种即时技术的缺点是,团队成员在完成这些流程时终止的动机很小。自动停放是指在非工作时间关闭运行的资源,这对于开发和测试环境来说是一个特别有用的工具。通过强大的标记策略识别企业的闲置资源是第一步;这使企业可以精确定位可以更有效地停放的资源。第二步涉及自动化上升/下降过程。 ParkMyCloud、AWS Instance Scheduler、Azure Automation和Google Cloud Scheduler等工具可以帮助企业管理整个自动停放流程。
(3)调整规模
适当的规模可以确保企业正确使用需要的资源,而不是太少或太多。当企业开始使用云计算环境时,立即“启用正确的规模”似乎是明智的选择。但是,如果没有分析消耗资源或启用计费的能力,适当的规模就变成了毫无意义的概念。云计算应用程序的性能和容量要求通常会随着时间的推移而发生变化,这不可避免地导致资源使用不足和闲置。
许多云计算提供商分享了正确调整规模的最佳实践,尽管他们花费更多时间来解释云迁移之前存在的正确规模选项。保持适当的规模是一项持续的活动,需要实施政策和保护以减少过度配置,标记资源以启用部门级别的计费,并正确监控CPU、内存和I/O,以便真正有效。
适当的规模调整还必须考虑自动停放的资源和可用的预留实例(RI)。那么是否看到了优化支柱的趋势?