拨打热线 020-0000000

汇添富基金刘浩:基金行业大数据业务价值实践的思考

浏览数:407 


3月23日,第十届中国(深圳)金融科技发展论坛在深举行。本文为汇添富基金大数据平台团队负责人刘浩在2019年中国基金业信息技术研讨会(基金业分论坛)的演讲。


汇添富基金大数据平台团队负责人刘浩



今天非常荣幸能有机会在这里跟大家分享一下我们在整个大数据方面的业务价值实践的思考,我觉得数据关键是要有业务价值,对于我个人来说在基金行业是一个新人,加入汇添富不到两年的时间,以前主要在浦发和建行待了很长的时间,见证了银行数字化到人工智能的转型,参与了浦发和建行的信息化建设。


我作为汇添富的架构师,负责整体的数据团队,我们的数据团队与易方达和嘉实有很大的区别,我们进行了组织架构的调整,专门成立了大数据智能团队,现在整个数据中心将近20人,这次在广州、深圳跟同业交流,我们不太敢说我们有多少人,大家都是四五个人在做,我们现在将近20人,已经是数据团队中比较多的了。我们涵盖金融科技人工智能的部分,也涵盖传统的数据仓库,同时也具备投资研究信息化整合的能力,这是我们的定位。


如何体现大数据的业务价值


今天谈业务价值,主要还是结合原来银行的背景跟大家交流一下做数据到底应该怎么体现业务价值,这是我19年从业经验的一点思考。


做数据最后发现是基于一种信任在做,我统管汇添富的数据团队是在2018年6月份,当时诟病非常多,主要是因为来自于人的不信任,或者只是对于我们团队某个人比较信任,但不是对我们整体能力和系统的信任。所以我们非常的痛苦,这次我跟同业交流完以后发现大家都很痛苦,整个数据是人驱动和应用的,用户把数据拿走我们不知道他干什么,另外数据是流动的,从源端到目标端都在流动,每个阶段都需要有信任的机制。数据在交互和互动中才有价值,我们为CRM、现金宝和APP服务,其中的数据很多是由我们产生的,因此数据需要在互动中才能体现价值。用户体验、数据透明、业务融合、服务能力是我们构建数据价值四个核心的方面。



1.用户体验。不管做大数据服务、小大数据服务还是人工智能服务,拿出来的都是数据,拿出来的东西给到用户,他的体验怎么样?这个体验可能是一封邮件,可能是APP的一个页面也可能是一个简单的DEMO,能不能满足他的体验很重要。


体验包括你有什么,你能做到什么,应该有配套的机制,而不是数据提供以后就结束了,这是SLA的要求问题。


2.数据透明。数据透明很重要的一点在于要让用户知道给他的是什么、可能有什么样的问题,我觉得这是对他的一种尊重,但是往往用户收到的是冷冰冰的报表甚至多维分析,都不是那么透明。


3.业务融合。业务融合也很重要,现在为了能把我们的数据作为真正的价值体现出去,我们一直在努力和业务做结合,一直在学习,我们参加他们的晨会甚至包括投资的晨会,甚至跟着投资经理学他们工作的一天,抽象出我们数据的模型,我们在努力做这些事情。


4.服务能力。服务的能力是波动的,如何降低波动也是非常重要的一个点。时效,经常上游出问题,发生很小的波动就会导致下游很大的波动,上游大的波动下游就是更大的波动,甚至影响服务能力,怎么解决这些问题?

既然我原来是做银行的,我想和大家分享一下,为什么在银行对大数据的价值体现是比较困难的,局部可以,但瓶颈明显,当然这是我的一些见解。在银行,数据是跟着组织机构走,有分支机构、开发中心、运维中心、数据分析中心、信息技术部,从这个角度来说,价值可以局部体现,整体上是很难的,组织机构也是,所有的数据都在流动。虽然银行有各种各样的总线、数据仓库甚至各种各样的体系,但数据的流动是不受控的,比较难控制,这是非常大的问题,我从银行到基金公司,认为基金公司有可能实现整个大数据的真正企业级价值。



关于互联网,我们在交流过程中经常听到所谓中台的战略,中台战略我觉得对于基金公司来说其实是比较难实现的,为什么?我们中台的概念是小前台大中台。腾讯的方案都是依托在互联网的体系和机制下,嘉实的王总是有可能实现的,因为他们的组织机构有比较大的变化。像我们这样还是完全依托于信息技术部,想做数据中台是很难的。



我们怎么办?我们有没有优势?我觉得我们是有优势的,因为我们小而精。我觉得首先是时机成熟,现在没有人质疑提升数据价值是对还是不对,当年我在银行,特别是在建设银行做数据仓库的时候,当时应该是全国银行界第一家开始做数据仓库,我们和工行基本上同时起步,别人会质疑你为什么做数据仓库,阻力非常大,当时有一个顺口溜:你为什么要建数据仓库?我说积累数据。为什么积累数据?我要建数据仓库。这是非常非常复杂的过程,当时布道的过程是非常艰难的。另外我们行业的地位,也是非常突出的。在基金公司里除了互联网金融以外,在真正传统的IT体系里是两大体系:一是数据体系;二是投资体系。我认为数据体系在基金行业的地位远远比在银行的地位要高很多。虽然银行业在数字化转型,但是他的数字化不是指人工智能体系是指整个应用的体系,其实这是两个概念。



这是上层的外部环境,内部环境还有数据需求,我们有衍生出来的各种各样的数据,业务部门给出的需求都是数据需求,我觉得这个是大家共识的,为什么?今天中午还在跟京东金融的专家交流,为什么我们拿到的都是数据需求,没有功能需求,或是功能需求很少。我觉得这个问题的关键在于数据需求最容易提,但是我们永远都不知道,他拿了数据以后,比如说做头寸管理,他拿到数据清单、交易清单,他的模型、输出是什么?一般是没有人告诉你的,强有力的能力和机制逐步的了解和完善才能把所谓的模型化应用好,这是一个长期的复杂过程,业务和技术共建的过程。


最后跟银行很大的差别,我们基金行业应该有很多的事情可以做,以数据驱动的方式而不是应用驱动的方式做。最近交流下来我比较深刻的体会是,我们做数据、做大数据一定要赶在业务把需求提出之前,做好数据、做好大数据、做好模型体现出来,这样才能抢得相应的先机,才不会只做出所谓的IT部门中的系统后台,只是提供数据。我觉得现在有很多的地方可以做,很多的业务可以拓展,而不像银行那样,所有的地盘都被瓜分得非常清楚,这是非常重要的点。


构建用户信任我觉得关键还是要能够触及到用户,数据中心有非常多的能力可以满足各种各样的业务需求,比如说反洗钱,人行资管报送,最后这些事情都是压到数据中心的。同时我们还要想办法触及最终用户,否则我们的数据就没有载体、没有输出、没有反馈、就没法做下去。这个时候我们面临的情况是,不管是大数据还是小数据未来都要服务风控系统、APP、CRM、机构服务平台,他给你提的是数据需求而不是应用需求,这些怎么办?对于我来说,我是非常不赞成供数的策略,也就是说把数据加工好以后供出来,这样的话就是干了最脏最累的活,供数最大的弊端是不利于做数据治理。我们都在启动相关数据治理,很多同业都做得非常好,其实数据治理里除了流程制度以外还有一块是要有可控数据治理架构,否则数据给到别人,永远都是你要去解释,这是非常难的事情,路径非常长。



我们从企业级视角解决这个问题,数据服务能力和数据管理能力是非常重要的,下面是指标体系和应用集市、数据资产服务平台、金融数据实验室等。我们现在提供的还是基础的六大能力,由于时间的关系我没有把具体的细节跟大家做非常明晰的分享,这里我简单提一下我能提供的智能服务,我们确实做了非常多的尝试,我们也做了一些人工智能方面的研究,比如高净值客户的流出预测,基金经理评价以及推荐模型等,还是非常准的,同时也得到了研究员和基金经理的认可。



其实现在最难的在于,我们做出来的模型怎么和业务流程做集成,嵌入到业务流程中,能真正影响业务流程的体系。而不是难在这个模型是不是难做,模型嵌入流程自然形成自我循环和完善的过程,这个过程慢慢会使模型越来越重。实时查询服务也是我们非常重要的一块服务,当然现在我们发现,很多同业做的比我们还更好一些,我们后面会把面向于CRM、实时对客的查询全部集成进去。


我们整个指标体系建设方式和传统没有本质上的差别,这里差别在于应用集市的建设,我们主要做两大应用集市:一是投研的应用集市;二是营销类的应用集市,这些和大家没有本质的差别,不管是员工APP还是CRM,必须在我可控的环境下查询数据,不能我把数据给你,变成你的数据,你在上面再做你的东西,这是属于数据治理和管控很重要的部分。



关于数据资产服务管理


简单谈一下数据资产服务管理的想法,我觉得业务在这个过程中主要是责权利的问题,同业交流下来大家觉得非常难推,招银推了三年取得不错的成果,这是非常长期的过程,我们这方面还在刚刚起步的过程中,我觉得我们现在第一要务是要制订一个流程,制订流程是给高层看的,在实际操作、实践过程中怎么办?这是一个关键的问题,所以我认为应该在定义责权利前提下实现所谓共建或是有互动的方式,才能把所谓的责权利明确下来。



我们目前在后面的过程中主要考虑了金融数据实验室的方案,这是我们目前真正想去触客的途径之一,金融实验室的核心就是要解决业务能够快速获取数据并且进行简单数据分析的过程,这件事情其实是在整个数据的业务分析生命周期范围内,我们主要解决第一步,自助式的数据获取和数据的初步分析。这个产品其实严格意义上来说,我们是按照数据产品的方式进行设计,它主要解决的是解放数据团队核心资源的问题。我们都知道所谓的手工数据是非常耗费资源的,我们先进行初步环境的搭建,目标是减少80%的数据提取,让业务用户自己去拿想要的数据。整体架构比较偏技术,核心的特点是满足了不同的用户需求,有专业用户的也有一般用户的,现在关键是先满足一般用户,对于高需用户就是使用工具,这里面有各种各样的工具他都可以用,而且整体是在所谓的虚拟环境下集成各种各样的数据,数据的安全也是相对可控的,不会出现泄露的问题。同时生成好的模型、数据,如果要做类似于固定化的规则,我们也支持纳入到真正的生产环节里,基于生产环节再做进一步的输出和加工。



业务人员的使用步骤是这样的过程,这个过程里基本上技术人员是零干预的,他结合自己的业务特点拖拉相应的字段和属性,可以把数据下载成Excel表,这是未来大数据的分析基础,未来不管什么样的数据,不管非结构化数据还是流数据都可以对接平台让用户快速获取数据进行一些分析,分析完了以后可以想更多的场景。



如何变成企业级的工具?这个工具目前解决的主要是电商业务的需求,电商的需求是非常杂乱的,对于像稽核部门、渠道部门,其实他们也有很多这样数据需求,电商是部门级的,需要权限的控制,包括角色的权限、主题权限、字段的权限,这也是非常难实现的。



目前来看,在电商的使用过程中,它的产品访问量、整体使用效率还是非常好的,从去年的5月份开始,截止到去年12月底,整个的用户访问量、登陆次数每个月都是递增的,尤其是靠近年底的时候,各种报告都不用再找我们提供数据,不像以前所有的人写述职报告都要一个数据,写一个签报要一个数据,数据中心年底考核要做各种各样的数据,非常复杂,节省很大的人力资源,可以投入到其他更有价值的工作,包括外部数据整合、模型的研发工作。




今天大概交流到这儿,通过这次跟各位同业交流完以后收获非常大,衷心希望大家能多交流学习,谢谢大家。