关键字: [Amazon Web Services re:Invent 2023, Turbonomic, Resource Optimization, Cost Optimization, Finops, Automation, Elasticity]

本文字数: 1300, 阅读完需: 6 分钟

视频

如视频不能正常播放,请前往bilibili观看本视频。>> https://www.bilibili.com/video/BV1qw411h7n9

导读

随着规模的不断扩大和技术部署的日益多样化,云环境正变得日益复杂,需要采取规范的方法来防止浪费的积累。在本讲座中,将探讨与优化混合云、容器化基础架构、传统 IaaS 和托管服务中的工作负载有关的独特挑战。了解亚马逊云科技客户如何将挑战分解为五个不同的优化类别,并采用责任分工明确的针对性策略,从而取得成果。在单位成本测算的基础上,了解这些努力如何引导企业为其整个云足迹实现卓越的成本效益。本讲座由亚马逊云科技合作伙伴 Apptio Cloudability 为您带来。

演讲精华

以下是小编为您整理的本次演讲的精华,共1000字,阅读时间大约是5分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。

在会议开始时,Andrew Midgley欢迎观众并介绍了他的共同演讲者——Ovid Khaira和Sam Keller。他表示,演讲的主要目的是提升资源优化技巧至更高水平。

Andrew强调,过去的两年里,在场的FinOps从业者已将优化云成本作为最大的挑战。他概述了FinOps周期的三个阶段:Inform、Optimize和Operate。当前的讨论将集中在Optimize阶段,特别关注提高云计算资源使用效率以降低每单位业务价值交付的成本。

接着,Ovid Khaira上台并表示,无论是处理内部基础设施、Kubernetes还是公共云,优化资源的问题都是相似的。他强调,尽管有关于弹性性和实用主义消费的承诺,但公共云客户仍然容易出现超额支出。讽刺的是,从内部部署到云和Kubernetes的转变并未从根本上改变调整资源大小以应对波动需求的需求。

Ovid解释道,FinOps包括两个部分——FIN方面关注将花费分配给利益相关者,而OPS方面负责优化资源使用。他指出,像Turbonomic和Cloudability这样的解决方案相辅相成,提供实现持续优化所需的分析能力和自动化能力。

Andrew展示了一个框架,用于思考私人云、Kubernetes和公共云之间的优化。他解释说,在私人云和Kubernetes中,工作负载放置、大小调整和调度是需要解决的关键领域。而在公共云中,EC2实例和卷的正确大小调整最具影响力。Ovid插话表示,该框架似乎暗示你需要不同的工具来处理每个环境。实际上,所需的操作——移动、启动、停止、调整大小——在本质上是相同的,不论对象是什么。需要的指标和自动化逻辑可能发生变化,但根本问题仍然是统一的。

奥维德首先通过一个实际案例探讨了运用Turbonomic优化其VMware环境的客户经验。该解决方案实现了工作负载放置和资源调整的自动化,从而提高了主机上的资源利用效率。这使得客户能够减少并避免不必要的资本支出。奥维德强调了如何将优化建议与应用程序团队共享,以增强信心并促使他们采取更多行动。所采用的阶段方法包括:工作负载放置、防止基础设施即代码工具撤销更改、无中断扩展、在维护窗口中谨慎地进行缩放以及最后删除完全空闲的资源。

接下来,来自Highland的Sam Keller分享了他们的环境和实践经验。他们解释了为何Highland从传统的反应式IT管理转向了自动化优先的方法。这是因为资源过度分配和问题解决延迟(由手动流程导致)的问题日益严重。

Sam详细阐述了Highland如何运用Turbonomic优化其私有云环境的过程。他们从工作负载放置开始,实现了更高的主机资源利用效率。接着,他们阻止了Terraform脚本撤销资源更改。基于此,他们能够在无人为干预的情况下自动扩展13,000多个虚拟机。这种无中断的运营方式为他们进行计划内缩放操作提供了信心。总体而言,这种自动化节省了超过4000个小时的手动工作时间,并带来了显著的成本节约。Highland目前正在寻求类似的方法,以便在将更多工作负载迁移到Kubernetes时采用自动化优先的策略。

安德鲁强调,在向公共云过渡的过程中,调整EC2实例和卷的大小是一种低成本优化方法,但在大规模情况下并不简单。关键在于给工程师提供正确的建议和行动信心。例如,Cloudability等工具可以自动化票务工作流程或基础设施更改等政策驱动的操作。他建议在开始处理非破坏性操作(如存储扩展)以建立信任和信誉之前,先解决破坏性的实例调整问题。

奥维德·凯拉也认为,从存储操作开始优化是最简单的途径。他提倡从删除未附接的卷开始,这是一种低风险、高回报的操作。在非工作时间安排开发资源是另一个简单的优化方法。关键是先发现机会,然后手动执行操作,最后在大规模上实现自动化。在整个环境中这样做可以实现重大节省。

山姆·凯勒详细讲述了Highland公司公共云优化工作的具体情况。他们采用了类似于私有云优化的分阶段方法。首先删除未使用的EBS卷,然后调整卷的大小,最后是实例大小调整。这种自动化已经为他们节省了300万美元。他建议工程师采用FinOps原则,并利用AIOps来推动下一层次的优化。

安德鲁·米吉尔在总结会议时强调,FinOps专家有很大的机会影响效率和可持续性。他提供了一些有用的资源,包括FinOps基金会网站、Mike Fuller和J.R. Storment的《FinOps》一书以及来自Turbonomic和Cloudability的内容。最后,他感谢山姆提供了宝贵的实际客户观点,并强调自动化是在混合云环境中扩大FinOps规模的关键。

总之,该会议讨论了如何通过跨云的工作负载放置、大小调整和调度来显著提高资源效率。利用自动化和经济单元使FinOps团队能够扩大其影响。演讲者敦促听众采用爬行、行走、奔跑的方法,专注于在自动执行破坏性操作(如实例缩小)之前建立信誉。有了正确的愿景和工具,FinOps可以改变企业的云交付经济学。

下面是一些演讲现场的精彩瞬间:

领导者与两位FOPS领域的专家共同探讨了一个重要议题。

在过去的两年里,领导者一直强调对PHIN OPS社区而言,资源优化是一项巨大挑战。

他们特别强调了在实现初始节省之后,进一步优化云成本的重要性,这包括分配每美元支出、检测异常以及实现弹性。

领导者还分享了他们在VMware上如何使用Turbo系统进行高效管理的经验,该系统可以完全自动化,支持管理20,000台虚拟机。

Turbo是一个动态优化基础设施工作负载的系统,通过持续监控和调整资源分配来实现。

Turbonomic技术已经帮助亚马逊云科技实现了自动扩展资源,并通过自动化节省了数千小时的工作票。

建议参与者在参观re:Invent后查看分享链接,了解更多关于亚马逊云科技的信息。

总结

FinOps专注于优化云计算资源,旨在提高效率和降低成本。据演讲者所述,其方法包括根据实时利用率数据自动调整工作负载的大小。他们提倡采用一种渐进式的自动化策略,即所谓的“爬行、行走、奔跑”法,从非破坏性操作开始,例如存储扩展以建立信任。针对私有云,目标是通过对智能的虚拟机放置和权限调整来提高工作负载密度。在Kubernetes中,优化pod放置和容器大小至关重要,因为过大的容器请求会导致资源浪费。在公共云中,未使用的存储、过大的实例和闲置资源都是节省成本的潜在机会。借助Turbonomic和Cloudability等工具,可以获取关于利用率的可见性,并在环境中自动执行缩放操作。最终目标是降低单位成本——例如每用户或交易的商务输出成本。通过自动化实现效率的大幅提升,FinOps专家使得组织和环境受益。

演讲原文

https://blog.csdn.net/just2gooo/article/details/134819609

想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站!

2023亚马逊云科技re:Invent全球大会 - 官方网站

点击此处,一键获取亚马逊云科技全球最新产品/服务资讯!

点击此处,一键获取亚马逊云科技中国区最新产品/服务资讯!

即刻注册亚马逊云科技账户,开启云端之旅!

【免费】亚马逊云科技“100 余种核心云服务产品免费试用”

【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”

亚马逊云科技是谁?

亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者,自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 31 个地理区域的 99 个可用区,并计划新建 4 个区域和 12 个可用区。全球数百万客户,从初创公司、中小企业,到大型企业和政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本,加快创新,提升竞争力,实现业务成长和成功。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐