透过大数据一体机看浪潮的大数据观
- +1 你赞过了
目前业界普遍把大数据看作是风口,我们处于一个数据爆炸的时代,数据以指数级增长,于是大数据市场成为厂商争夺的焦点。但是大数据市场又比较复杂,比如基础设施层、应用层等。同时,企业在应对大数据挑战方面捉襟见肘。
在浪潮集团大数据事业部产品经理高亚坤看来,目前企业在处理大数据方面存在三个问题:存不起、扩不了和算不出。存不起也就是企业在存储大数据方面遇到了问题,而扩不了就是在大数据处理的架构扩展方面出了问题,算不出就是在大数据处理的性能计算方面遇到了瓶颈。
在这样的背景下,浪潮围绕大数据的解决方案和服务,推出了自己的大数据玩法。第一是数据的采集,第二是数据的存储,第三是数据的计算,第四是组件能力的服务化。通过这些步骤,浪潮可以帮助企业应对大数据的挑战。
高亚坤介绍说,在底层存储,浪潮会进一步优化存储架构,降低整个存储的价格,并且提升存储的I/O性能。在架构扩展方面,浪潮会采用新的算法改进当前的大数据模型,并通过云的模式实现交付。在数据计算方面,浪潮采用分布式架构解决算不出的问题。
总之,浪潮的大数据产品、技术、解决方案都是围绕这些环节进行部署。简单来说,针对数据采集、数据存储和数据计算,云海Insight大数据处理平台提供支持;针对数据应用于开发,通过云海IOP云支撑平台将组件化的能力进行打包交付,以PaaS服务的形式提供给最终用户及ISV生态圈的开发者;在基础设施层面,通过大数据一体机提供一体化整机柜的大数据平台能力交付,使用户能够便捷快速获得大数据平台的处理能力。
硬功夫的磨练:整机柜、超融合、容器
上面说到的浪潮大数据一体机是软硬一体化、开箱即用的解决方案型产品。功能涵盖浪潮云海Insight大数据套件能力,旨在帮助用户快速构建GB到PB级大数据业务处理平台。
目前浪潮大数据一体机目前主要有两个系列:浪潮云海大数据一体机SDA50000,预装浪潮云海Insight大数据套件的分布式数据仓库模块,以大规模并行处理(MPP)技术,实现高性能的数据库仓库应用;浪潮云海大数据一体机SDA70000,预装浪潮云海Insight大数据套件的分布式计算引擎,以Hadoop技术,高效处理海量结构化、非结构化、半结构化数据。
据高亚坤介绍,浪潮后续会推出采用超融合架构的新一代浪潮云海大数据一体机,并实现基于容器的服务交付。超融合架构和容器技术都是目前的热门,这足以看出浪潮在技术研发上的孜孜不倦。
容器技术目前在企业级生产环境中的应用还有待验证,不过其非常适合互联网厂商的应用交付模式。对于浪潮云海大数据一体机引入容器技术,高亚坤表示,容器技术其实代表了一种新型的交付模式,它其实是解决了虚拟机的效率问题,同时解决了上层应用的打包问题。迁移性和快速复制性是其最大的优势,还有标准化,正因为如此,应用中间件、大数据交付起来可能就会更容易一些,整个交付流程的效率会得到极大提升。
我们看到目前浪潮大数据一体机是一个软硬一体交付的整机柜产品,而浪潮还有另外两个整机柜产品SmartRack和InCloudRack,那么推出云海大数据一体机是如何考虑的呢?
对此,浪潮集团大数据事业部副总经理张立勇解释说,SmartRack差不多占了整个互联网厂商整机柜的半壁江山,其已经被证实是可靠的,而且是高可靠的。浪潮既然已经拥有了如此可靠的产品,为什么不向其他行业拓展呢?对于政府行业和大客户来说,他们需要的不仅仅是一个整机柜的方案,更需要是把大数据产品融合起来进行交付,解决他们在大数据应用场景上的问题。
浪潮云海大数据一体机包含20多项关键组件优化,具有30多项企业级增强特性,其横向扩展能力可高达4000多个节点。产品特性主要是四个:融合高效、敏捷易用、企业级增强、开发支持。
融合高效:采用新型横向扩展分布式并行计算架构,横向扩展节点可达4000+;高效融合架构,计算向数据存储靠拢,多表组合可达13GB/分钟/节点;柜内数据交换,计算、存储和网络集中池化,资源利用率提升40%。
敏捷易用:开箱即用,易于部署,只需插电、连接网络、启动等简单几步即可开始使用,运维效率提升50%;组件化交付,一体化运维。一站完成对大数据软件、计算、网络和存储单元的运维管理,无需频繁切换控制台。
企业级增强:企业级RAS特性,关键部件N+N冗余,二级管理节点维生机制,平台可靠性可达99.999%;30项分布式文件系统特性优化,速度提高20%;整合20项关键组件,适配多种计算场景。
SQL兼容:兼容SQL-92/99/2003、OLAP扩展,PL/SQL兼容度超过92%;提供基于MADLib的高级机器学习和数据挖掘功能;无需数据导入,即可直接访问HDFS、Hive、HBase数据。
具体到浪潮云海大数据一体机的应用场景,高亚坤说,我们总结了四个场景:第一利用分布式技术改善数据查询分析速度;第二做海量异构数据仓库建设;第三互联网+、物联网新型业务;第四是包含大数据服务的PaaS平台建设。
浪潮集团大数据事业部副总经理张立勇补充说,对于浪潮大数据事业部来讲,现在拥有两个产品线,一个是大数据的产品线,另外一个是PaaS平台的产品线,其实都是为了服务大数据。包括浪潮云海大数据一体机,也是为了更好地能够在更短的时间内给客户交付一个更高可靠的大数据产品。
软实力的构建:生态圈、PaaS、服务化
我们知道大数据的构建离不开强有力的硬件基础设施,软实力同样重要。目前浪潮云海Insight大数据组件化能力已经初步成型,包括Insight HD分布式计算引擎、Insight MPP分布式并行数据库模块、Insight MemDB分布式内存数据库模块,涵盖了从GB到PB级数据的各类数据处理场景。
同时云海IOP是一个完整的PaaS平台,可以支持快速应用创新。它可以将大数据产品组件服务化,以组件模块或者服务接口的形式提供给最终用户及ISV生态圈的开发者。
凭借这些,浪潮正在努力构建自己的大数据生态圈。据高亚坤介绍,通过构建云架构设计和数据科学的实验室,浪潮努力最好底层架构,与合作伙伴共同开拓行业市场。
目前浪潮大数据已经在公安、气象、金融等行业落地。我们以金融行业为例,近年来,银行卡中心的发卡量迅速增长。随着业务的迅猛增长,业务数据规模也线性膨胀。银行卡中心在有效地利用客户数据方面,都面临着越来越大的压力:针对传统的BI分析需求,旧系统面临严重的性能瓶颈:针对大数据分析需求,旧系统架构无法实现大数据的快速处理和灵活分析,无法支撑秒级营销、个性化营销等业务需求,业务人员自主调用数据的需求无法满足。
银行通过使用云海分布式并行数据库一体机,搭建银行卡中心数据仓库系统,在总体成本、数据导入速度、查询效率、数据分析挖掘工具等诸多方面优势明显。比如,实现传统BI平台改造,提升系统效率;支撑营销、反欺诈和催收等30多个业务系统的日常业务处理;支持高级分析人员沙盘分析预测需求;结合客户消费习惯,实现秒级营销。
结语
浪潮的优势是雄厚的硬件基础,而浪潮大数据要做就是如何把这种硬件优势融入到自己的产品和服务中,浪潮云海大数据一体机的推出就是这种策略的重要落地。至于这种软件结合策略的效果,还有待市场的检验,让我们拭目以待。