七年五次迭代 看浪潮SR4.5如何玩转融合架构
- +1 你赞过了
有数据显示,数据中心正在向规模化、模块化和集约化进行升级和变革。未来五年超过60%的数据中心投资增长将来自超大规模数据中心。而5000台以上的数据中心将占到总体的68%以上,而到2020年将出现50万台容量的单一数据中心。
在这样的背景下,服务器厂商也在谋求变革,比如针对云数据中心的这种需求推出融合架构产品。其中,在笔者认为浪潮是最为典型的代表。为什么这样说呢?因为作为浪潮融合架构的代表SR在七年间完成了五次迭代,而且SR整机柜已累计出货10万节点,在整机柜领域的占有率超过了70%,创造并保持了单日双线并行交付1万节点的业界记录。
目前SR整机柜已经演进到4.5版本,基于融合架构2.0的产品SR4.5整机柜服务器专为云服务供应商、
电信运营商等公有云用户设计,在集中供电、散热和管理的基础上,新增了SAS 、PCIe的交换技术以及BBS(Battery Backup System)后备电池节点,实现从IT外围资源的集中到内部资源的重构和池化。
浪潮整机柜产品因用户需求而生
在浪潮互联网行业部产品总监孙波看来,2009年,浪潮开始研发整机柜产品,开创了整机柜产品新形态。浪潮整机柜产品从一开始产生就是为了解决用户的需求问题。因为随着数据中心的规模化,在空间成本、交付速度、运维压力上面,传统服务器形态已经无法适应。整机柜服务器凭借高密度、一体化交付、集中供电散热和管理的特点,受到了互联网厂商的极大欢迎。
孙波拿互联网厂商对于服务器的采购为例说,我们以年采购量是1万台起,单机房单日交付能力一般是300台,我要把1万台服务器在全年完成交付差不多需要1个月的时间。而如今百度、阿里、腾讯的服务器保有量已经达到50万台,这几个大客户的年采购量规模在10万台以上,10万台按照单日单机房300台的交付能力的话,全年无休了。
所以,如果按照传统服务器形态进行交付,已经无法满足用户的交付需求。当然除了交付外,还有运维的难题。针对这些客户的痛点,浪潮整机柜服务器应运而生。孙波介绍,前四代的SR整机柜主要是针对IT外围资源的池化整合工作,何为IT外围资源?“服务器里的风扇、电源、机箱其他一些跟业务不相关但是服务器又去不掉的这些资源,我们定义它为IT外围资源。”孙波解释说。
前四代SR整机柜所做的主要工作是对IT外围资源的池化,比如怎么把电源从原来的独立电源变成集中电源,怎么把风扇抽出来变成集中散热,怎么把每个节点的BMC整合起来变成一个集中管理单元RMC等等。
总的来看,前四代的SR整机柜都是把焦点聚焦在IT外围资源上,这满足当时用户的需求,极大地提升了服务器的部署和交付速度以及成本节约。但是当我们发展到现在的人工智能以及大数据时代后,企业对于融合架构服务器的要求也随之更新。
浪潮融合架构2.0的进化
“走到今天我们看到新的痛点,IT外围资源的整合已经没有办法解决这个问题,我们需要考虑优化IT资源优化,所以浪潮融合架构2.0诞生了,也就是基于IT资源的池化产品线。”孙波说。
这个变化在SR整机柜4.0版本上体现得最为明显。“SR4.0我们不说它是一个产品,而是一个整机柜产品线,因为我们丰富了节点类型。”孙波说。
SR4.0五个产品系列分别对应五个不同的方向,有针对HPC高性能计算的、有面向高密度计算的、有主打存储的、有耐高温的,可见浪潮对于SR的定位已经不简简单单是服务器之外的产品补充,而将作为一个主打产品来推向更广泛的市场。
也是从4.0开始,浪潮SR整机柜已经成为一种全新的服务器形态。而且,从4.5以后,浪潮融合架构2.0聚焦IT资源的池化。针对公有云、人工智能等新的业务需求,浪潮SR4.5把整个IT资源池化,加入了融合架构2.0最关键的两项技术:SAS 、PCIe的交换技术。
孙波介绍说,利用SAS交换技术将整机柜的存储资源独立出来,形成共享的资源池,再根据业务工作负载的需要,实现任意计算节点或CPU自由访问存储资源,计算存储资源的分配更加灵活。通过SAS Switch,单计算节点连接多个JBOD存储节点,每个JBOD节点可容纳20块3.5/2.5英寸SAS/SATA/SSD,在46U高度单机柜内最大支持容量达6.4PB以上(按每盘8T计算)。
而基于PCIe扩展池化,可以实现基于PCIe协议的协处理计算、高性能存储、温冷数据存储的资源池化,每个计算节点可按需连接扩展BOX,包括GPU/MIC/FPGA的协处理计算资源池(扩展BOX每U高度支持4块GPU/MIC/FPGA卡),或者至少20块NVMe SSD的热数据存储资源池。以42U单机柜为例,最多可支持32块GPU。
可以看到,通过SAS 、PCIe的交换技术,可以实现存储、协处理计算等资源的弹性分配,从而更好地适配日益繁杂的应用场景和业务需求。孙波还介绍了腾讯SAS Switch案例。
腾讯近年来多种业务并行发展,尤其是微信的快速扩张,使得腾讯需要存储和处理的数据量急剧提升,并且由于业务类型繁多,腾讯IT部门需要更具部署弹性的架构,来应对快速变换的业务种类。传统分布式存储集群由于计算和存储紧耦合,一方面无法满足大数据存储的高密度要求,也无法实现快速地改配。
为了解决密度和弹性的诉求,腾讯选用基于浪潮SR的存储弹性扩容节点,并将其用于分布式存储系统。基于成熟的SAS协议,将HDD/SSD池化部署,通过灵活配置带来冷、温、热不同层级的存储解决方案,实现单机柜内,打破冷、热限制,根据业务发展,用户规模,使用习惯动态的调整冷热分布,最大化利用存储资源。
通过存储弹性扩容节点上行链接计算节点,下行链接JBOD节点,实现了计算资源与存储资源的解耦,打造单机柜近4PB的超大存储资源池。并且可以实现单计算节点对应多JBOD、多计算节点对应多JBOD、多计算节点对应同一JBOD等多种配比方式。目前,腾讯采用存储弹性扩容节点,并通过上层存储软件,优化写队列、强化读性能,最大限度地发挥出整个架构的性能,极大提升服务器的能效比和资源的弹性部署。
孙波还介绍说,在热度存储业务的基础上浪潮全新开发了高密度的存储节点SN3116M4S,通过搭载低功耗和高集成度的Xeon D SoC处理器让数据热度实现更精细化的管理。该节点高度1U,支持18块3.5英寸硬盘,单节点可扩展支持单个JBOD,存储密度的提高可进一步降低了存储成本,且支持硬盘休眠从而实现超低闲置功耗。
浪潮整机柜创新不止步
纵观SR整机柜的发展史,我们看到浪潮在融合架构上面的创新从未止步。据孙波介绍,位于济南的浪潮信息化高端装备智能工厂即将正式启用。智能化的新产线,生产效率是传统产线的4倍,让SR整机柜拥有更快的交付速度、更标准化的质量,同时满足大规模可定制需求,更好地服务互联网客户。
而且,浪潮对整机柜产品做了全面的升级和完善,目前形成了2个产品线,CR系列和SR系列。CR就是InCloudRack,更多是针对企业私有云客户,可以在整个机柜里灵活配置双路、4路甚至8路的服务器节点,满足传统企业用户的业务应用诉求。
另外,针对中小规模的企业用户,浪潮推出了I9000刀片系统。I9000创新型刀片处理器继承了传统刀片处理器高密度、低功耗、易维护、易管理的特点,同时在密度和性能之间取得了平衡。支持2/4/8路堆叠,业界唯一实现单刀箱双8路的刀片服务器,支持多种类型节点混插,并配有标准的背部扩展模块,支持无缝迁移至InCloudRack云一体机。针对关键业务、存储类应用、新兴应用以及特种应用进行优化。
综上所述,我们看到浪潮在融合架构上保持了持续的创新,而作为融合架构载体的整机柜产品线也在不断革新。未来IT不断创新,新的需求不断产生,这需要以浪潮为代表的厂商不断超越已有的成绩,所谓创新无止境,期待浪潮的表现。