虚拟化数据中心性能可靠性的诊断和配置
- +1 你赞过了
【天极网服务器频道3月5日消息】在虚拟化之前,对物理服务器进行性能诊断相对简单。在大多数情况下,管理员通过重新配置,升级或者为服务器打补丁能够解决问题。不过虚拟化为性能诊断增加了一个全新的、很复杂的虚拟化层。运行多个工作负载肯定有益于提升服务器的利用率,但是硬件资源共享有时可能会导致不可预见的结果,以意想不到的方式对工作负载的性能产生不良影响。
假定一台数据库服务器和一台多媒体服务器共享同一台主机服务器。服务器有足够多的资源来应对工作负载对资源的需求,而且在正常的使用模式下,这两个工作负载都交付了足够好的性能。现在假定用户一直在抱怨数据库查询性能低下,IT专业人员通常会通过检查数据库服务器虚拟机来应对用户的抱怨,希望发现是配置发生了变化或者资源存在不足。但是检查完数据库服务器后,看起来唯一的问题就是当数据库查询性能低下时本地磁盘的IO过于频繁,但是本地磁盘活动频繁却和数据库虚拟机无关。然而另一名技术人员发现当数据库响应缓慢时多媒体服务器虚拟机在处理大量的视频处理请求。
虚拟化可能会使追踪问题根源变得复杂起来,因为可能不会考虑特定系统上的其他负载情况就对虚拟机的资源进行调整或者迁移虚拟机。为更高效地诊断问题,IT专业人员需要使用能够识别出虚拟机物理路径以及每台虚拟机正在运行的应用的业务服务管理工具。
此外提升虚拟服务器的可靠性可以先从仔细检查服务器硬件及特性开始。让我们先从选择具有冗余电源的服务器开始。企业级服务器将包括两个冗余的电源模块,任意一个电源模块都能够支撑服务器的正常运转。当一个电源模块发生故障时,备份的电源模块将会接管而不会影响系统的正常运行。冗余的电源模块肯定不是个新主意,但在今后的技术升级过程中确保使用冗余的电源取代旧有的单电源系统是非常重要的。
虚拟机运行在服务器内存中,因此IT专业人员可以通过选择具有内存可靠性技术的系统来提升服务器的可用性。其他可靠性技巧通常包括为服务器配置多块网卡。当所有硬件运行正常时,更多的端口能够提供额外的带宽并确保服务器所有工作负载的连通性。如果一个网卡端口发生故障,服务器仍旧能够提供网络连通性,将对虚拟机的影响降至最低。
但是IT专业人员要做的不仅仅是多买一些可靠的机器——当发生错误时采取相应的策略及措施来解决服务器故障是非常重要的。高可用性技术并不能确保服务器不发生错误——当出现错误时这些技术仅仅帮助服务器继续运行。当内存模块或者电源模块发生故障,服务器的可靠性将降低直到技术人员完成维修,因此要考虑告警,故障切换过程以及虚拟服务器的故障诊断需求。
服务器针对关键业务实现可靠性的最为有效的方式之一就是使用服务器集群。集群创建了服务器组,集群中的每台服务器都运行了冗余的虚拟机。当一台服务器发生故障,集群软件将从集群中移除出现故障的服务器,虚拟机的其他副本将会接管业务而不会导致服务中断。集群的主要优势在于集群中的服务器通常会放弃很多的高可用性特性——业务通常会被集群中的其他服务器所接管。
总之,虚拟化使数据中心运维面临新的情况,虽然虚拟化提升了服务器的使用效率。但是当出现问题的时候,诊断过程会变得复杂。所以在数据中心启用虚拟化的时候,软硬件上的冗余变得非常重要。其次是管理工具,如何实现服务器集群的监控和诊断也是至关重要的。