2025年12月1日,一年一度的AWS re:Invent在拉斯维加斯正式拉开帷幕。

在此次活动的第一天,AWS并没有“急于”举办大规模的主题演讲,取而代之的是面向部分媒体提前披露了不少最新的技术和业务成果。
我们三易生活就在现场与AWS副总裁暨杰出工程师Ali Saidi进行了一次深入的沟通,并由此得知了关于他们最新款自研处理器的相关信息,以及AWS方面在处理器研发思路上的一些细节。
Graviton 5亮相,192核的“性能怪物”
早在2018年,AWS发布第一代自研处理器Graviton。短短7年后,它就已经更新到了第五代。

Ali Saidi透露的信息显示,Graviton 5基于3nm制程打造,单个拥有192颗基于ARM Neoverse V3 IP的CPU核心。同时Graviton 5支持等效频率高达8800MHz的DDR5内存,内置5倍于前代的L3缓存容量,并且还成为了业内首款集成PCIe 6.0控制器的CPU。
据悉,与前代相比,Graviton 5的单核性能上涨了25%-30%,同时单CPU的核心数量更是相比前代直接翻倍。
AWS更看重的是实际性能和性价比
关注近年ARM处理器的朋友可能知道,在苹果和高通的努力下,ARM处理器已经得到越来越多普通消费者的认同。但与此同时,他们其实也造成了一个不太好的影响,那就是促使消费者非常关注处理器架构IP到底是“自研”、还是“授权”。

针对这一点,我们三易生活也对Ali Saidi进行了询问。据他透露,AWS目前似乎并没有自研架构IP的打算,但这并不等于他们在处理器的研发上就“偷懒”了。相反,之所以坚持使用Neoverse IP,一方面是因为AWS与ARM的技术合作至今已有10年,所以他们本身在架构开发上已经拥有很高的“优先级”。
另一方面,与其他家的ARM服务器芯片不同,由于AWS的处理器深度绑定了他们自己的云服务,这就使得Graviton实际上并不需要像NVIDIA、高通等其他竞争对手那样,那么依赖“自研架构”来作为卖点。相反,AWS更看重Graviton在设计上与实际云计算需求之间的强相关性。

比如Ali Saidi就提到了一个细节,那就是部分云计算客户会非常看重计算的延迟表现,按照以往的“行业常识”,这通常需要高功耗、超高主频的云端处理器来实现。但Graviton则正好相反,它并没有很高的主频,却依然凭借着高效的系统整合设计实现了低延迟计算,同时也带来了更低的功耗、更小的发热,以及最重要的、更高的计算实例性价比。
此外Ali Saidi还专门提及,AWS并不急于实现自研处理器的“年年换代”,因为比起频繁的更新,他们更希望确保每一代的Graviton都能带来显著的性能增长。就拿Graviton 5来说,它的单核性能比前代增长了25%,这就意味着客户的业务运行可以更低延迟、更流畅,从而提升效率。

同时这也意味着在升级到新处理器的实例后,Graviton 5的用户实际上可以减少服务器的订阅数量,于是这就又会额外带来省钱的效果。
除了科技平权,AWS其实也有“发烧梦”
正是因为Graviton处理器这种务实的设计思路,使得它如今得到了包括SAP、Adobe、Airbnb、Pinterest等一系列知名头部厂商的一致好评。而且无论是注重性价比的初创企业、还是注重性能的巨头,都更愿意使用AWS的自研处理器满足他们的云计算需求。公开数据显示,在最出色的1000家AWS EC2客户中,有90%都选择了Graviton实例。

那么这是不是意味着AWS搞自研处理器,就纯粹是盯着“性价比”,为了维持自家产品“不断降价”的策略呢?
其实也不是。此次Ali Saidi还谈到了他对于NVIDIA“超级芯片”GB系列的看法。根据他透露的信息,AWS正在开发融合NVIDIA GPU和AWS训练加速器Trainium的“超级芯片”,它将会为AI训练生态带来前所未有的改变。

很显然,尽管从商业模式的层面来说,AWS的处理器与其他ARM服务器芯片有着很大的不同,但他们也并非单纯只会追求降低成本。当想要做出更先进的设计,而且他们的客户已经存在相关需求的情况下,那么AWS就能一次次让大家眼前一亮。
这不只是意味着技术创新,更代表着它可以实际加速我们身边的种种云端服务和现实业务,从而让更多人都能享受到既务实、也先进的技术所带来的好处。
)