平行论坛查看详情>>
世界级云融合(Cloud Fusion)平台
用友软件股份有限公司技术总监CTO 林大瀚
首先给大家展示的是我上午主会场讲演时谈到的那个小盒子,大家都很有兴趣,怎么把一个五百强企业的数据装到一个小盒子里,只用10秒钟进行各种维度的分析。小盒子就在那边(会场上)。
小盒子里面跑的就是销售明细数据,15个管理维度。我们利用的首先是多核技术,第二是大内存。这两项技术加在一起,内存的模型和传统模型是不一样的,传统的数据库建了索引,基于文件系统,索引有个什么问题呢?索引要发生位移。
我们看(演示)速度有多快,点到一个业务中大一点的省,我们可以看到在这个省的操作行为中,我们取了其中一年的数据,八万多条,汇总出来生成每一种商品的实时分析数据。这些数据不是预先汇总的,因为用过BI系统的都知道,先期建模要遵循什么管理维度,建模的时候如何做预处理。BI有这样的问题,即领导管理思路一变,BI系统一路全要改,BI系统上了被废弃了,上了被废弃了,这样的例子多的很。
我这里要举个上了没被废弃的:大家知道重庆成为直辖市以后,国家烟草总局的一号工程立刻停了三个月,为什么?现在把重庆单独剥离出来,数据很多吗?也就几亿条。直辖市从四川剥离出来,把各种维度的汇总数据放到数据仓库里,三个月这个调整完成了,这就是过去的数据仓库。
新一代的数据仓库是什么技术趋势呢?第一,业务随时提出建模,随时解答问题,不管实施与否。第二,数据仓库和应用系统会联系的更紧密,现在是两张皮,数据仓库是仓库,应用系统是应用,数据仓库分析结果肯定不作用于应用系统,应用系统的结果"T+ 1"或者"T+N"以后会作用于应用层。
近期我和一个朋友讨论,他说我们看到对股指期货的操作大批量,大批量的过来了,因为现在不是基于单一模型进行操作,而是基于多种模型反复取得次高点,然后来进行对冲的交易操作。交易量很大,我怎么样去评估下一分钟带来的行为是什么?这是没法统计的,因为每几分钟都是几十万。所以,为什么我说我们的技术是有场景的,这些场景都是我们的应用场景,传统的BI系统所解决不了的。同时,BI系统产生的结果也无法做到指导销售行为。销售行为的数据"T+N"到了BI系统,BI系统查出结果,分析完了得出的是静态数据。当一个客户打进电话,能不能马上把他的历史交易情况都出来、并通过分析他过去的商品决定他下一步可能会买什么东西?我们没做到,但是美国的沃尔玛做到了。法国的家乐福前期,我听人说也实施了这套系统,能干什么呢?你买完东西我给你打折券,每天打折的商品数千件,我算出来你可能会要哪种打折券,这是一种嵌入型的行为。我们引入两个技术,第一个IBI,把你的交易系统和我们周边的分析引擎和搜索引擎实时的联合在一起,交易的数据发生变化,我能快速捕捉到,基于数据库的日志能够捕捉到。
我们随便点一下(演示数据),这边是37万行相关的的数据全在做实时分析。大家可以看到,这个省一共有130万条数据,可以随便点任何一个角度,如果你的应用系统和BI系统能够做到这样的融合,如果你的计算能力能够提高50倍,现在的应用是什么样?并不是你们现在的样子,现在你们的应用怎么把流程走通,今后关注什么,而今后要关注的是所有发生的行为有个分析的过程,来指导我下一步的业务行为,这就是今后的系统。预计2014年到2015年,全球IT预算有40%花在商业智能上。未来的方向,缺少不了这样的计算力。
就在这个小盒子上装的就是我们的核心技术,就是我们的引擎。
言归正传,今天的主题是云融合平台,上午我向大家许诺我要解密这个小盒子的技术,所以,给大家看了一下小盒子里到底能跑出什么速度来。企业的销售数据一年销售明细有多少,超过一亿的并不多,我敢肯定超过一亿的并不多,取决于行业特性。比如你是超市,一年也就小一个亿。
回到云融合平台上,总有人跟我说云漂在空中,老不落地。前几年你们跟我说的是SOA漂在空中,不落地,结果你们接受了。前两年我们高端产品线一直在说云,2009年云,2010年还是云,2011年多了个基于内存的分析引擎到底是个什么东西,还是云端的一些核心技术。也许到明年,到后年你们就会发现云和SOA一样,都走向落地了。今年如火如荼的我们要做系统间的整合,这个要遵循SOA规范,遵循什么规范,为什么对这个规范都如此认同?前年为什么不认同?IT环境在发生变化,参不参与由不得你一家厂商。
我记得某家软件也说我就不,现在照样老老实实的发布,为什么?大家认为这是个标准环境,你必须符合。就像开放式架构,大型企业不屑一顾,我们用友现在还有主机的客户,证券、医疗,现在为什么觉得开放式架构也陆陆续续服务了,至少在应用服务层,我们用开放式架构PC上的群组。但是在数据处理上,你们仍然沿用小机为主的应用架构。所以,我推出EIA来解决数据层怎么摆脱小机对你们的限制,怎么做到在PC群组上做企业的集中化数据分析。
这幅图,用友的构架就是这样,画的很简单,很多内容没在上面,所以不讲了。
说一下我们新的东西是什么,平台是什么。用友的平台和平常业内理解的平台是不一样的,我们不仅仅是个开发平台,我们是四大平台组成的。开发平台,运行和维护平台,这些就是运行和维护平台的一部分,为什么要关注整个运维平台?因为根据统计,ERP整个生命周期只有28%是用来购买新开发的代码,72%是运维层上,有实施,有维护。
运维平台又多了一员,即自动化安装部署。大家都急急忙忙上私有云架构,上完以后,用一系列国际厂商的解决方案,解决方案不能完全涵盖用友自动化的部署和资源分配过程,所以,我们提供这样的平台,和业内并不相冲突。为什么呢?比如说操作系统的安装这一类的基础IT架构可以用通用的国际上标准的平台,但是真正到了群级环境,你可以用我的平台,把设备选进来,你说这五台设备,明天就加入到这个群体中,一个小时给你把这些设备部署好,加入这个集群。
智能监控系统我们推出来两年了,恒安的朋友已经用了一年半了,我们的软件界面,把你运行在这上面的设备找到,以及上面有没有疑似问题发生,如果你定义财务的应用变慢了叫问题,财务应用变慢的时候它给系统拍个照,在相同时间点对多层架构进行切片,切片之后我们才能准确的诊断原因。虽然是个并发环境,拍照一次,也许三个人一起操作,有一个人导致了问题,我可能捕捉不到,再拍第二次发现还是这个应用,再拍第三次,做个交集,问题是不是出来了?过去每一次都有连接池,过完连接池,你们就找不到谁是谁了,一个终端用户你在数据库层看到能知道是谁吗?但是用友穿透多层架构的连接池,我们从一层数据库知道你跑什么业务,中间件上同理,我们知道从哪个路由过来。有了这套系统,我们变被动为主动。被动式的出现问题,IT中心打电话我这儿出现问题了,机器上查半天,找不出来,把厂商叫过来一起分析,厂商一来这个问题就不出现了,那就拖,一年没解决两年解决,两年没解决三年解决,就这么一个过程。现在把疑似问题拍了照,等我们来的时候,调出这些拍照。比如内存上升一百兆就是一个疑似问题点,拍几次就知道谁做什么操作知道的。结果发现某某员工总是不输入条件查表,这个地方没有内存保护,于是内存总是在波动,很多时候造成宕机。我们的人员来了,我们还可以远程接过来,两种,SKP,我是绕过你的协议。
用友的服务中心同时控制了好多家大型客户,很多大型客户直连到用友服务中心,有什么问题我们的界面上就会反映出你的状况和你的详细问题。这上面还有个故事,有天我们公司另一位高管跑过来说昨天我审批一个报销单,审批了好久,怎么速度这么慢?我说不会,全员报销怎么会这么慢?他说就是我昨天做的。我说不要紧,我给你答案。过去你们的系统上能找到答案吗?昨天审核一个报销单,我们能找到答案。因为我们有智能监控技术。我把统一的分析所有服务器上昨天什么人的操作行为,把某某人输进去,他的操作行为分布在两台服务器上,我们看他的操作,有时间,有一个时间是慢的,这个时候怎么办?看他的服务器在这个时间的切片,服务器上其他业务在上面慢不慢?结果不慢,发现慢是因为从一台服务器调到另一台服务器,这个时候慢,这个时候怎么办?跑到另一台服务器上一切片切出来了,发现这台服务器的内存这个时候出现了风险。为什么呢?当然就在峰值的附近会有你的应用产生,我们一拖马上知道这些调动有多少,有哪些是疑似点,一看有个人不小心把一个五千行数据的凭证从主系统出发往系统里面倒,文件做一个解析,一下把内存弄上去了。这时候我知道昨天某某总裁的审批单据慢了五秒钟就是因为这个。
接下来我要做的事情通知相关人员下一次不要在这个服务器上做,用专业的服务器做。我知道大家的IT环境非常复杂,可能因为部署,有些什么原因导致你们系统很慢。好多人觉得我自己的系统很慢,我说不会,几千人用也不会很慢,你们人也不是很多,我们来几个专家联合采用智能监控系统,关联起来,马上知道我们的问题在哪儿。
下面简单的看一下我们的私有云技术能做什么事情。第一,我们在这个群组上能保证高可用性。这包括两项技术,主服务器上IT漂移技术,它会被迁移过去。我们的监控系统是在这个集群之外的一个集群,它可以反向的控制这个业务集群的行为,能够在发现有异常的时候,把你的业务流重置,重置以后就没问题了。
宅急送公司有60多个节点,我说的是Server节点,系统刚上线,不完善,时不时的出现一些宕机的行为,从来没人管过,因为我们系统自动给他处理了,并且记录下原因。我们现场和他们现场的开发人员会根据这些拍到的信息解决问题。同时,宅急送做了动态资源调配,到月底先是这几个系统包,再是那几个系统包用我们这块做资源调控。比如先让业务系统占35个节点,等到月末的时候,财务系统多占10个结点,业务系统只占25个节点,结完帐让报表系统占25各节点,并行计算。
有人问我云计算到底落不落地,我说不要紧,你们家钱到底是放在床头柜还是银行?放在银行就很好,说明你们喜欢用公共资源,你们和云计算就不排斥。有人问我是私有云还是公有云,之间是什么关系?私有云是不是云?我说很简单,私募基金是不是基金?是基金,一百万起,可以去买,但是私募基金本身很小,我能控制的资金是多少,不像公募资金,五千块钱可以买,但是我这个盘子几十个亿。
为什么有人选择私募基金,为什么有人选择地下钱庄呢?就像私募基金就是基金一样,重要的不是你用不用它,重要的是你想得到的好处从这个体系架构能不能得到,如果能得到就不必争论,这个理念是什么,和你们用什么技术、不用什么技术。想得到的技术还得用。
我不喜欢讲太虚的东西,讲开发平台的大理念,从建模一直到现在,但是我相信大家不关注这些事情,你们是用友的客户,关注的一定是用友新研发了什么东西。在我们的平台,做云计算、云端,是两部分的内容,一部分是内容怎么被处理,云的端是些什么。我们除了平常用的IE浏览器,新一代的轻量级开发平台,同时可以把你们的应用放在Outlook里用,让我登系统,登系统做什么呢?你们天天离不开的就是邮箱手机,在座有没有人不用邮箱的?我看应该没有。你用,邮箱有邮件就会打开,而且不用企业开放协议,我们不是通过在线连到你的应用系统,我们是推动特殊的技术,纯粹走邮件协议,把内容转换到这边来。
能用的应用,比如请假单、薪资查询,查一个发一个这样的页面你点开,我的工资单是这样的,这个月因为什么扣了钱,因为什么扣了钱。我们做人力资源招聘的转岗,我这个系统里查出的招聘过程,我要给这个人发一个聘用书,这个是Word,现在我们开发的是一个平台,U9、NC都有这个技术。Word是个载体,是不同的企业之间,或者不用你的系统的人和你信息沟通的载体,我们也利用Excel,因为我发给你企业不会说我没有Excel,也不会有另外一家企业跟你说我给你个帐号,你来登录看看,信息的协同需要载体。
还有云的另一个端,就是大家的手机,NCV5.7产品的手机应用,昨天已经发布了,智能手机上常见的审批,常见的一些报表都可以上来。当然我认为报表根本不是手机应用,我们归为平板电脑的应用,平板电脑的出货量今年年初已经超过PC了。
移动设备很重要,我们看到在一些二线三线城市很发达,而且费用比大城市低很多,到公园一查都可以随便拿。我到乐山拿平板电脑,随便一查周边有哪几个吃饭的地方,找到一家最好的,人家发现我是外地的,给我另一个菜单,结果价格比较高。这个也是网络上的一个问题。有了这个,大家可以比较好的进行人和人之间的协同。这是我们刚才提供的两项新的内容。
回到SOA上,不用我强调,前三年的技术分析报告上可以看到SOA列在前面,不用我强调重要性,掉到后面就说明快要落地了,在前面说明还离你们有一点点距离,等哪天它从这个榜上消失了,要么是该落地了,要么是这个技术分享不对,该消失了。我这么多年的观察,方向不对的比较少,通常是该落地的比较多。
我们的产品分成业务流程、组织模型、基础信息等几个部分来展开客户应用。我以为自己做的很先进,有一天被雅戈尔总裁一句话当场打击了,他说你们为什么有组织模型?我说我们组织模型可以这样可以那样,什么样的组织模型都可以反映在系统中。这位总裁说你知道美国怕什么吗?怕的不是中国的巨无霸,怕的是敏捷的企业,敏捷的企业每天都在变,你要建模就不能敏捷。能不能发明一个模型,没有组织模型的理念,在平面随时的构建我们的应用,我想了半天没想出答案。当然,他说的也许是中国未来应用的一个方向,我听到他说的不只一次,不管我们用什么组织模型,总有人提出这个组织模型不方便,那个组织模型不方便。越是敏捷的企业越用不了国外的软件。国外28%的是采购,72%的是实施运维,你们的实施运维吃不消,一变动就得重新实施或者重新调整,这个费用实在太高。
SOA已经落地了,没有哪家公司再跳出来说我就不做,只是做到什么程度,唯一的区别是做到什么程度,而不是做与不做的区别,现在没有人跟我说我就不要SOA了,前几年还有朋友跟我讨论这个问题。IT生态环境变成了这样,所以,每家软件公司要想在这个市场上竞争,只要是公平的参与市场竞争,用友如果不能很好为企业提供相关服务,那你们会不会对我们有很大的意见呢?所以,我们新一代的系统基于这个构建。对内我们从业务体开始建,建完业务组建,实现对外接口。内部在用的时候,包括在我们的容器内就是代码,发布在外部是WebSrvice。
与此同时我们提供了MDM产品和ESB产品,为什么提供ESB?因为ESB的标准化形成没有人讨论买不买,中间件很便宜,我们对外销售经常说五十人以下建议使用,其实我们一千人跑的东西大有人在。一千人用自己的中间件的也照样用,这样的标准化可能还需要两三年。SOA相关的规范陆陆续续的起来,规范形成了,这个产品的标准化一旦成立,产品价格会大幅度下降。现在有可能觉得这个价格非常贵,动辄数百万。所以,我们给你提供一个削减协议,这是七种协议,也是有格式转换,遵循标准的规范。市面上买的,我知道IBM支持45种协议,很多协议连听都没听过名字,更不用说企业有没有。那是欧美遗留的系统留下来的协议和标准。协议虽然少了,其他都是一样的,至少价格控制住了。
有了ESB,人和人沟通,系统和系统沟通都是一样的,我们必须说同一种语言,MDM最大的作用是个翻译器,但是它与其在企业里单独画一个MDM,还不如说MDM是个框架,它是个系统产品,其他的要根据你的框架搀杂进来构成一个完整的系统。
我们在北京和南昌构建两个机房,开展云服务,开展托管服务不一定是云服务。云是什么?云运行计算,网格计算、并行计算三种计算方式的商业体现。基于这样一套体系,已经有一批的客户把IT系统委托到用友的这两个机房,要求这些系统的网络条件有所保障。这个是当地网络运营商保障的,网络条件好的客户用这个特别省钱,为什么?IT团队都不要了。本来三个五个维护人员,在一线城市要多少钱?托管给我们才多少钱?反正一个人能管50个系统。
NC截止到V5.7,我们在27个国家有终端用户,有简体中文版,英文版,泰语,我们有泰国分公司。走国际化路线以后,用友的资源配比有一些变化。
商业卫星网,如果你们走出国门,会意识到它的重要性,你们到白宫地区或者安哥拉地区,走互联网你的应用根本转不动,卫星网带宽不一定窄,但是时延总是固定的一点几秒,卫星和赤道之间的距离是相同的,速度是相同的,波长是定的。所以,卫星网上有特殊的要求,我们做过特殊优化。在卫星网上,我们跑这个系统的时候,我们会启用一些优化策略,优化策略带来一个明显的好处,在安哥拉地区,直接用卫星网访问北京的系统,我们走出国门的企业到当地直接连上卫星网,毫无问题。
PC能够支撑企业应用,我们也在主机上跑ERP软件,主机有它的特点,控制器不算作CPU资源,你本来要买16个处理器,现在只需要4个,为什么说主机有时候能省钱,这个时候是省钱的,但是把它做计算资源是不省钱的。
宅急送,三个月开发,3月测试,上线后比原来的系统快多了。动态调拨、智能监控体现的淋漓尽致,在线人数也不少。
时间关系,讲最后一个话题。现在业内有什么变化,十多年前,我们从各种各样的数据库模型和Facebook模型统一到关系式模型上,最近这个形势发生了比较大的变化,关系式模型也好,什么模型也好,都在变,不同的数据库引擎做不同的事情。国外体现的淋漓尽致,国内互联网公司也有所应用,为什么?原因很简单,没有一个通用的解决方案是能解决所有问题的,所以,我们推出新的分析引擎,前面加了SQL的外壳,和大家能兼容。
我们可以看到不同方向的数据库。最后我们把我们的架构变成这样子(PPT图)。
我在搜索所有的东西,把格式化和非格式化进行整合,这个技术都出来两年多了。多维处理,各式各样的图形都具备了,接上我们的分析引擎可以看到最后的架构,就是这个样子的。交易型的数据员,你们还用国际型的厂商,这个地方随你自己定,通过我们RDI技术,分发到不同的引擎上做不同的事情。对上层来说,这是个透明的架构。有了这个架构可以不用买那么多小型机,可以买一个好一点的Server,配一群SQL—Server,九成是写入,为了解决写入的问题,拿几百万又何必呢?有了这个技术,我们走向开放式架构。
最后一句话,拥抱开放式架构,拥抱明天。谢谢大家。



























