DCMI如何帮助云计算中心管理计算资源?
- +1 你赞过了
随着互联网和通信行业的飞速发展,特别是云计算成为一种全新的IT服务模式并为越来越多的企业接受后,数据中心就开始一步步朝着云计算中心的方向发展。与此同时,新一代数据中心对服务器数量的要求越来越高,一个数据中心拥有的服务器通常需要达到一千台到一万台以上。伴随着数据中心向云计算中心的过渡,当汇集更多的服务器之后,如何能有效地管理数据中心,以达到高效节能的目的,将是越来越多数据中心主管所面临的问题,为此相关的IT厂商一直在进行着不懈的努力。
智能平台管理接口(IPMI,Intelligent Platform Management Interface)就是英特尔的针对平台管理的重要贡献,不过IPMI相对是一种比较细化的管理,面对未来高密度数据中心的管理规格,面临着实现成本过高的窘境。在这种状况下,英特尔适应技术的发展和客户的需求,推出了DCMI(Data Center Manageability Interface),即数据中心管理接口,来解决上述问题。
DCMI是一套专门针对IPDC(Internet Portal Data Centers,互联网门户数据中心) 和其它高密度数据中心部署的服务器平台管理接口。这一接口标准的制定,对未来数据中心管理成本的降低、运营效率的提高都有着重要的作用。专家认为,在云计算时代,在对高密度服务器集群需求量增加的今天,DCMI标准将会得到长足的发展和充分的应用。
事实上,DCMI并不是最近才制定出的规范,英特尔早在2008年5月1日就发布了正式的1.0版规范。只不过它随着数据中心的角色转变显得益发重要。DCMI的制定也得到Dell、富士通以及惠普等知名IT企业的支持。
DCMI和IPMI的关系
在DCMI推出之前,英特尔已经有了IPMI,用来规范数据中心中服务器的管理。当时的IPMI规范是2.0版本,它是为了覆盖许多种服务器管理场景而制定的,因此许多可选的功能并不能适用于高密度数据中心管理。另外,IPMI规范没有为高密度数据中心量身提供必须的功能集合。简言之,IPMI规范不能满足高密度数据中心的必要需求,而完整的IPMI 2.0功能又超出了这些需求范围。所以,IPMI的实现面临一种尴尬的境地,而且在不同供应商之间也有明显不同。许多高密度数据中心客户在关注基于IPMI 2.0的系统同时拒绝采用其作为普遍的解决方案。
而英特尔在和几个关键的高密度数据中心和门户数据中心客户进行深入讨论后,形成了一套高密度数据中心客户所寻求的共同特性,那就是精简、可互操作、开放、可靠、简单、稳定和低成本。为此,英特尔选择IPMI(智能平台管理接口)2.0规范作为切入点,以IPMI 2.0为基础创建一种清楚定义了一系列数据中心必要功能和接口的规范。紧接着用IPMI规范没有覆盖而高密度数据中心需要的功能领域来对IPMI 2.0进行扩展,从而产生了DCMI 1.0规范。
DCMI咋帮助数据中心管理
DCMI的实现可以利用现有的IPMI管理控制器、固件的架构以及专业经验。在很多情况下,服务器平台硬件对DCMI的支持已经出现,且只有管理控制器的固件需要更改来支持DCMI。
DCMI的功能对本地和远程管理软件都是可用的。这些功能包括:
标准化的本地和远程访问接口:DCMI定义了标准化的接口,用于从本地管理应用程序访问DCMI平台管理子系统,或者从远程通过和系统电源状态或者主机软件独立的局域网和平台管理子系统直接通信。平台管理子系统使用了待机电源,所以该子系统对远程访问随时可用。
平台电源开关和重启控制:独立于主机软件的控制平台电源和重启系统的功能。该功能主要用于支持本机软件失效条件下的系统远程紧急恢复。
基线传感器:DCMI基于客户需求定义了一套基本的传感器,包括入口温度、CPU温度、环境温度和电源读值。
平台识别:DCMI定义了获取系统ID和资产ID的接口,提供了获取被管理系统明确和唯一标识的通用方式。
经过改进的传感器访问:IPMI定义的传感器访问需要管理应用程序大量的命令传输和解析来发现或读取这些传感器。DCMI定义了少数扩展命令来大量减少访问必要传感器的步骤。
认证、集成和机密性:远程会话认证、集成和机密性利用了经过业界验证的哈希和加密算法,并结合了IPMI 2.0协议中定义的RMCP+会话建立协议。
平台事件日志:传感器的“异常”事件和其他平台硬件状态事件都被记录在一块稳定的存储区域,以便本地或者远程获取。该功能使得平台事件的事后验证和非实时分析成为可能。
以电源管理为例,电源的使用不管是对资本性还是操作性的高密度数据中心来讲都是成本的主要部分。在这种场景下,DCMI传感器给出的服务器电源消耗和温度的数据可以用于分析高密度数据中心及其所含的服务器效率。在分析得出服务器或者基于应用程序的电源花费时,成本能够得到最好的控制。
DCMI通过定义传感器来实现这些功能,包括电源提供的用于报告服务器电源利用率的传感器。这种电源可以报告基于每个服务器的电源使用情况。这样可以用来分析在允许已知的应用软件情况下所花费的电能。在电源中的仪器利用了管理控制台和硬件的交互,例如微软系统中心操作管理器(Microsoft Systems Center Operations Manager),电源数据可以任意地或者经过处理后集成其中,来分析多节点应用程序的电源性能比。
总之,DCMI规范针对高密度数据中心服务器的平台管理监控需求定义了一套标准的接口和功能。DCMI利用了IPMI规范中已经被实际应用证明的优势技术,并利用了平台提供商都已具有的IPMI、固件、软件以及管理控制器的开发环境、资源和专业技术来加速基于DCMI的服务器开发。
实际上,英特尔不仅有DCMI,而且从最小的嵌入式芯片到高端服务器,英特尔都能够提供标准、高效I/O部件帮助企业构建标准、开放的云计算平台。而在新一代开放式数据中心层面上,据英特尔公司服务平台产品经理张振宇介绍,基于英特尔至强5600和至强7500以及下一代Sandy Bridge芯片服务器,结合万兆网融合的FCoE技术,同时结合DCMI开放管理标准,实现计算资源的统一管理。
最新资讯
热门视频
新品评测