浪潮天梭K1迁移:严密的测试 上线水到渠成
- +1 你赞过了
在完成了评估、计划和验证后,迁移工作将进入最后“攻坚战”——测试。经过前面4步严谨、科学、规范化的操作,系统上线将是一蹉而就,水到渠成的事情。
测试——“诊疗”
测试是对系统上线前的一次全面“诊疗”,其目的在于确保系统割接时的平滑切换,实现新系统运行达到高性能、高可靠和高可用。
测试,从模拟真实环境开始
测试的主要内容是针对升级(替换)的系统进行功能性测试、性能测试和稳定性测试。
测试的目的是模拟在真实上线环境下,让客户直观了解新系统:整体功能是否达到计划要求?系统应用和数据库是否稳定可靠,是否能够正常工作?新系统的整体性能是否得到了优化和提升?是否可以满足未来的业务发展需求?
压力测试+破坏性测试,全方位检验系统
整个测试的内容会按照之前的迁移计划进行,迁移团队首先会先完成一个测试方案初稿,等到具体现场后,浪潮迁移团队会再根据现场实际情况,还会对测试方案做调整,调整内容重点会集中在系统的业务场景测试和系统应急方案切换上。
而对于硬件的高可用等案例,会根据客户运维的需要做出调整,比如:是否增加存储设备的高可用(一般都是客户提供存储设备的时候居多)测试案例。对于测试阶段的操作步骤,特别是涉及到系统配置和运行脚本类的操作,会在测试过程中根据之前的测试脚本模版做调整,直到适合客户现场的运行脚本,做到实际迁移的脚本化和自动化。
在模拟新系统上线的真实环境测试中,浪潮会对新系统实施压力测试和破坏性测试,模拟在最极端环境下,新系统功能的完整性、稳定性和高可靠性。
新旧系统同步互备,确保回退方案
在洛阳银行案例中,浪潮天梭K1系统替换掉了国外的小型机,利用硬件分区技术完成基于Oracle RAC的数据仓库服务器的部署,在应用层使用浪潮的X86服务器建立了虚拟资源池,在虚拟化环境中部署了BI/ETL和Web服务器集群。
在测试阶段,浪潮对搭建RAC集群的K1系统进行压力测试,模拟在超过银行业务高峰的环境下,测试K1系统的运行情况。
测试结果表明:K1搭建的基于Oracle RAC的数据仓库服务器的部署和虚拟资源池,提高了洛阳银行并发访问输出能力,做到了动态负载均衡。同时K1系统的RAC集群设计,确保了新旧两个系统同步互备,当新系统上线与原有系统进行割接时,一旦K1系统无法有效运行时可以顺利回退到原有系统,确保客户业务不中断。
公开测试结果,透明迁移风险
在新疆建行案例中,为了确保客户中间业务平台系统的整体切换成功,实现异构平台的互备运行,项目组制订了分批次系统转换的原则和完善的切换及互备运行方案,即“异构平台两级容错机制”。
第一个层面,是通过接入模块的剥离、灵活的交易配置和异构平台存储共享等技术突破和创新,开发了交易分发控制模块,实现同一应用系统根据运行环境的需要和变化,向天梭K1主机、进口IBM主机异构平台分别进行交易转发,并进行流量控制,在任何一方主机出现故障的情况下迅速将交易转发至另一主机,从而达到异构平台互备运行的目标。
第二个层面,双机HA互备,在K1主机出现异常的情况下,通过HA热备向IBM备机进行切换。
通过上述方案机制,建立起一套异构平台运行环境下的安全备份应急体系,降低了任一主机故障对应用系统安全的影响程度,使得系统运行风险整体可控。
归纳来讲,测试阶段是模拟在系统切换前,提前演练新系统可能会出现的各种切换风险,做好相应预案。需要指出的是,这个过程要让客户充分了解测试结果,透明迁移风险,并优化迁移方案,确保最终系统平滑切换,实现系统高性能、高可靠和高可用。
上线——“康复”
上线前,浪潮迁移团队会根据之前测试结果,出具6份测试报告:基础环境测试报告、系统源代码迁移报告、系统功能测试报告、系统性能测试报告、系统稳定性测试报告和系统上线评估报告。
报告提交客户最终评审通过后,才能执行上线步骤。在严密的前期测试完成后,80%的系统只需要一次例行维护就可以完成迁移。
“大象装进冰箱”
经过了前面四个严密的计划和校验以及测试过程,从客户角度来看,整个系统平台的上线过程就像把“大象装进冰箱”一样简单。
第一步:打开冰箱门,将整个硬件平台部署好,在K1上面安装好操作系统和数据库;
第二步:将大象放入冰箱,将原有数据库的数据导出,再导入到新的数据库中;
第三步:把冰箱门关上,老数据库离线,新数据库割接,完成切换工作。
严谨规范的迁移,上线水到渠成
对于20%的需要移植的业务系统,由于在验证环节都已经对部分代码进行了修改和编译,而且很多移植是可以自动化进行的,所以真正用于上线的时间不超过2小时。浪潮提供原厂本地化服务,浪潮的技术人员会制定好培训计划,在上线前给相关系统负责人做一定的K1平台操作培训,并在培训后提供一段时间的现场支持,帮助客户在短期内上手熟悉K1平台,之后还会以远程服务的方式,全面支持客户在K1平台遇见的各种问题。
在洛阳银行案例中,新系统从方案验证到测试用了4个月的时间,上线仅仅是一次例行运维的时间,系统上线运行至今,实现了主机系统零故障运行,完全满足银行系统对关键应用主机的高可靠、高性能、高可用等要求,可满足未来5年的发展需求。
经过前面4步严谨、科学、规范化的操作,系统上线将是一蹉而就,水到渠成的事情。
最后,总结一下,迁移是一项系统工程,前期大量的准备工作和验证测试,上线就是一蹴而就的过程。在迁移过程中,浪潮所做的任何操作对客户都是公开和透明的,让客户可以清晰了解迁移进度,随时随地掌控迁移风险。