关键字: [Amazon Web Services re:Invent 2023, Granulate, Optimize Cloud Costs, Reduce Cloud Spend, Improve Slas, Runtime Optimization, Kubernetes Optimization]

本文字数: 1100, 阅读完需: 6 分钟

视频

如视频不能正常播放,请前往bilibili观看本视频。>> https://www.bilibili.com/video/BV1Ka4y1Z7AX

导读

如果从不同的角度来看待云战略的运作方式,会发生什么?在这个由 Snap 行业专家主持的综合会议中,您将了解他们如何利用应用程序性能优化解决方案来扩展亚马逊云科技上的 Kubernetes 工作负载。他们通过解释 Snap 如何在其企业组织中成功实施 Granulate 解决方案,提供了有关部署最佳实践和降低云成本的有效技术的宝贵真实见解。请参加本次会议,聆听值得信赖的专业人士的意见,了解优化以数字为中心的公司云计算基础架构的可行策略。本讲座由亚马逊云科技合作伙伴 Intel 为您带来。

演讲精华

以下是小编为您整理的本次演讲的精华,共800字,阅读时间大约是4分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。

英特尔Granulate解决方案工程经理Keegan在一次主题为关于Snap公司如何利用Granulate解决方案和亚马逊云科技服务优化其云计算基础设施并降低成本的讨论会上,热情欢迎观众的到来。他在Granulate公司工作了两年,期间致力于帮助企业在其虚拟机、Kubernetes和部署在亚马逊云科技上的大数据环境中优化应用程序,以提高性能并降低成本。Keegan表示,非常荣幸能够与Snap公司的Tom一起讨论他们在亚马逊云科技上的优化历程,因为Snap一直是他最喜欢的客户之一。

接着,Keegan请Tom分享一些背景信息。Tom是一名在Snap公司工作了近四年的资深软件工程师。他简要介绍了Snap作为全球最大社交媒体平台之一的市场地位,拥有7.5亿每月活跃用户。Snap致力于开发实用、创新的产品,以改善人们的互动和娱乐方式。

由于Snap拥有如此庞大的用户群,Keegan指出其在亚马逊云科技上运行时必须应对独特的挑战。因此,他请Tom分享一下Snap的工程价值观和指导原则。Tom解释说,Snap的工程团队为全球数百万的用户社区开发复杂且有趣的产品,他们非常重视全球社区的幸福,并将这些价值观融入到工作中。他们的执行目标是精准且迅速,始终将最终用户体验放在首位。

在进一步的探讨中,Keegan询问了Tom的具体职责。Tom概括地说,他们的软件工程团队使用了亚马逊云科技服务,如EKS和S3,负责设计、实施并运营Snap最关键、可扩展的服务,如身份识别、朋友关系、消息传递和分析。他还提到了他们在可用性、运营和成本控制方面的权衡,以及如何提供创新解决方案和应用最佳实践。

凯根了解到,据汤姆表示,汤姆不仅需要对应用程序的开发负责,还需要对支持这些应用的FinOps和DevOps负责,而这些应用都在亚马逊云科技上运行。他指出了一种新兴的责任模糊趋势。汤姆认同这一观点,并解释了Snap是如何在他们的平台上每天拥有3.97亿活跃用户的,这都要归功于亚马逊云科技的支持,展示出了巨大的规模和波动性。他认为他们的挑战在于在控制亚马逊云科技的云成本的同时应对庞大的使用量和动态行为。

接下来,汤姆介绍了Snap的主要关注点,首先是隐私问题,他强调了像消息服务这样的服务在亚马逊云科技上保持可靠和可用的重要性。可扩展性是另一个关键领域,它允许他们在不牺牲庞大用户群(每月有7.5亿活跃用户)性能的情况下进行创新。最后,汤姆强调了在亚马逊云科技上降低成本以最小化浪费和不必要支出的问题。

当凯根询问Snap如何运用亚马逊云科技时,汤姆分享了亚马逊云科技如何支持他们跨越Amazon EKS的Go和JVM工作负载。他们广泛利用Amazon S3进行存储需求。汤姆提到了EKS的自动扩展、容错和自动化容器编排作为Snap的主要优势。他还提到了EKS如何帮助确保Snap在亚马逊云科技上是弹性和可靠的,这对于避免停机至关重要。

凯根承认EKS非常受欢迎,但他注意到由于规模和时间因素,它可能导致亚马逊云科技的云成本急剧上升。汤姆同意这一点,所以他们将成本控制作为重点,以减少EKS在亚马逊云科技上的不必要开支。他概述了他们的优化措施,包括PGO、容器调整、折扣、手动代码优化、可观察性和标签管理。然而,在亚马逊云科技上,手动优化超过35万个vCPU的微服务规模是一个具有挑战性的任务。

这一挑战促使Snap寻求在亚马逊云科技基础设施之上使用Granulate的解决方案。凯根简要介绍了一下Granulate,解释了他们如何在运行时级别上进行独特的持续自主优化。他讲述了他们如何专注于运行时优化、协调和缩放/调度技术,如VMs、Kubernetes和亚马逊云科技上的大数据。

基根(Gavin)描述了一个典型的流程:首先进行一周的分析,接着是两周的学习期,然后持续降低成本。对于Snap公司而言,成果仅在20天内就显现出来。最终,Snap公司在亚马逊云科技(Amazon Web Services)上部署了Granulate,减少了35%的CPU使用率,并消除了1/7的核心,从而实现了巨大的节省。

汤姆(Tom)解释了Granulate如何允许在亚马逊云科技上大规模优化较小的服务,而手动操作只针对最大的服务。这种自动化使得他们的团队能够专注于其他优化工作。汤姆计划扩大Granulate的应用范围,特别是在亚马逊云科技上的大数据工作负载,如EMR。Snap公司认为Granulate与亚马逊云科技的集成以及英特尔的合作关系非常有价值。

总的来说,通过在亚马逊云科技基础上利用Granulate的优化能力,Snap公司在其基础设施中350,000个vCPU上显著提高了性能,并将成本降低了35%。Granulate的自动化为Snap公司的工程资源释放了空间,使其能够专注于进一步优化其全球拥有7.5亿用户的社交媒体平台。

下面是一些演讲现场的精彩瞬间:

Snapchat的产品设计目标是提供一种私密且短暂的通信方式,旨在不留下永久性的记录,体现了公司对于用户隐私的承诺。

亚马逊云科技采用PGO技术,利用实际数据进行代码优化,以避免过度优化导致的效率损失。

代理解决方案能够在不增加额外工程工作量的情况下优化系统运行时间和协调,从而提高服务可用性(SLA)并降低成本。

亚马逊云科技的领导者解释道,Green Lake通过实时监控、优化和协调功能,帮助客户实现成本降低和性能提升。

将Granulate的自适应能力与EKS的自动扩展功能相结合,使得在容器化环境中可以实现显著的成本节约。

总结

在re:Invent的亚马逊云科技活动上,本次演讲探讨了Snap公司如何通过运用Granulate来优化其云计算流程,从而提高服务等级协议(SLA)并降低运营成本的过程。

首先,Snap面临高流量波动、日益增长的云费用以及随着平台规模扩张而需维持严格服务等级协议的挑战。尽管诸如PGO和调整大小等手动优化技术行之有效,但在Snap当前规模下却无法持续采用。

其次,Granulate为Snap的微服务提供了跨规模的自动化运行时级优化。在实现快速投资回报率后,Granulate将35万个vCPU的成本降低了13%,同时提升了服务等级协议。Granulate能够优化以往被忽视的较小服务。

最后,Snap计划将Granulate应用于EMR等大型数据工作负载,以进一步优化成本和性能。通过将优化任务交由Granulate负责,Snap可将工程资源集中投入到其他项目中。总之,Granulate已取得显著成果,使Snap能够在规模上优化其云计算基础设施。

演讲原文

https://blog.csdn.net/just2gooo/article/details/134814901

想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站!

2023亚马逊云科技re:Invent全球大会 - 官方网站

点击此处,一键获取亚马逊云科技全球最新产品/服务资讯!

点击此处,一键获取亚马逊云科技中国区最新产品/服务资讯!

即刻注册亚马逊云科技账户,开启云端之旅!

【免费】亚马逊云科技“100 余种核心云服务产品免费试用”

【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”

亚马逊云科技是谁?

亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者,自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 31 个地理区域的 99 个可用区,并计划新建 4 个区域和 12 个可用区。全球数百万客户,从初创公司、中小企业,到大型企业和政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本,加快创新,提升竞争力,实现业务成长和成功。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐