拨打热线 020-0000000

易方达基金唐永鹏:基金公司金融科技应用探索体会

浏览数:633 
文章附图


3月23日,第十届中国(深圳)金融科技发展论坛在深举行。本文为易方达基金金融科技部总经理唐永鹏在2019年中国基金业信息技术研讨会(基金业分论坛)上的演讲。


易方达基金金融科技部总经理唐永鹏


金融科技这个词比较大,今天报告的内容还是围绕着我们在大数据分析、人工智能方面一些工作探索,给大家分享一下我们自己的体会。


发展情况


2015年开始,公司领导层非常支持金融科技的工作,2015年我们就开始建立数据分析小组做大数据的研究、机器学习的研究。2016年开展了基于客户数据的精准营销模型的系统研发。2017年,公司与国内著名大学大学合作,利用机器学习的方法做量化方面的课题研究,同时新设立金融科技部,主要负责大数据、人工智能方向应用的探索。2018年到现在,我们的企业大数据平台上线,持续展开了一些人工智能方面项目的研究。


易方达2017年8月正式成立金融科技部,从部门的职责上讲,主要负责跟踪、研究人工智能、大数据这方面的创新技术,推动这些技术与公司业务的融合以及研究成果在公司的落地。我们这个部门在广州、北京两地设有团队,这方面希望利用两地的优势,特别在北京人工智能发展比较好,我们公司总部在广州,这方面也有很多业务的积累,两地分工合作这方面的工作。


金融科技部设置几类岗位,包括智能算法研究、大数据分析和功能开发,因为目前来看我们人数不是很多,也处于比较初期的阶段,所以我们对部门的员工还是按全栈研究员的方式培养,我们要求每个人员都能具备业务研究的能力,建模分析和代码实现的能力。如果自己的想法不能自己实现需要依赖别人的时候,整个研究的效率就会下降。


易方达有四个科技部门、系统,规划架构部、系统研究部、技术运营部和金融科技部,这些科技部门是在公司统一的IT规划下开展工作。我们也共享IT基础设施和一些通用的技术平台,像我们的研发部门也会为金融科技部的项目提供工程开发方面的能力支持,他们有一个非常强大、非常有经验的开发团队。同时金融科技部的研究成果、形成的技术能力我们也会通过服务、通过接口的方式落地在现有的系统流程中,和原来自主研发比较好的结合在一起。


具体工作


接下来我想向大家报告一下我们所做的具体工作。我们在部门成立之后首先建立自己的工作平台,考虑到金融科技的工作需要依托数据进行研发,有它的特殊性,我们不像原来开发的时候分开开发环境、生产环境的做法,我们在公司的网络里构建了独立的网络环境,从数据收集处理到运算都在这个环境里可以完成。


PPT的图上有很多的模块(PPT略),经过一年多的工作我们把这些模块通过各种方式已经基本落地,也就是说每个方块、每个箭头都有真正的实体在对应,做这个事情的时候我们是在用小步快跑的方式,结合展开的具体项目边做项目边完成技术能力的构建。这个可能跟同行里面的一些公司整体采购商业化的大数据平台、商业化的人工智能平台有些不太一样,最终大家想达到的目标是一致的。


同时在建工作平台的时候我们是用到一些公有云的设施,也大量利用开源软件、公开的算法工具集,同时也利用已有易方达在过往这么多年积累的组件、平台,在这样的基础上,我们很快把自己的工作平台建设起来。


对于金融科技部本身我们也构建了自己的门户,这个门户更多的是对金融科技的发展动态、内部的工作成果整合到平台里做展示和共享。这个平台我们也提供一些搜索的功能,我们的同事可以比较快捷的在门户里找到自己想要的东西,也看到自己小组、别的小组做的工作和成果。


下面是一些例子,跟大家报告一下我们做的事情:


一是数据采集和处理方面,我们首先是建了采集机器人,实际上是一个比较完整的数据采集体系,通过它的爬虫、网络的设定,我们现在已经可以快速、稳定的采集境内、境外、互联网上所需要的数据信息。这些信息会跟采购回来的供应商数据形成互补。截止到2018年我们统计采集的数据量如果转成结构化的记录大概在4700万条,目前为公司十个部门提供数据的服务。


在这个过程中,有很多技术点我们也在通过自主研发进行攻关,比如说网关的验证码、模拟点击的操作,我们自己的团队努力把它给抹平。我们除了自己做的采集之外也引进一些技术方案,总的来讲我们不可能什么都自己做。OCR识别方面我们直接引入了一套业界比较通用的识别方案,在引进方案的时候我们也要求有一个自主可控的能力,结合他们提供的接口,我们还可以优化识别的效果,目前来看对一些比较稳定的表单模板,我们的识别率还是比较高,但对一些比较特别的,我们还需要做进一步的优化。这是数据采集和处理方面的工作。


有了数据,接下来我们会做一些处理、做一些算法上的分析,其中一个例子是我们利用采集到的数据,有4500多家发债主题和3000多家上市公司互联网公开信息,做负面舆情的头条。这些数据商有提供,我们为什么要做这个事情?我们做了一个对比,我们自己采集的数据和业界某个供应商提供的数据做了详细的对比,总的来讲结果可以这么概括,我们的更准、数据商的更快。所以结合这两个情况我们把两份数据合成起来,再运用一些算法进行去重、做一些样本的标注再做一些信息压缩、正负面判断的工作。同时针对股票和债券这两方面的要求不一样,我们采用了不同的训练标准。 得出结果之后,根据每个业务人员关注的主体我们可以实现按需的推送。


二是黑名单需求,我们根据需求下我们利用信息采集的能力,再运用一些智能的算法对黑名单的规则进行分类扩展,形成我们自己的结果集,我们和外部供应商结果进行比较,我们给每天关注的业务人员进行推送。


三是我们针对公司大的需求提供智能的解决方案,去年公司非常重视可持续投资领域,提出来希望建设ESG的研究资源平台,我们接到任务以后以建国际水平的ESG研究资源平台为目标开展工作。ESG的原理大家比较好理解,实际上它的数据是比较难找到的,它的指标体系怎么去跟数据对应是开展工作比较难的地方,在这个时候我们确实利用刚才讲的,我们在数据采集、数据收集方面的优势,同时我们的研究人员也具备ESG研究的基本能力,我们找到国际上第三方机构指标体系进行比对,再结合国内数据的情况,形成我们自己的指标体系,完成了从数据的采集、指标和数据的转化,形成指标后的建模分析,最后实现自动的量化评分,把ESG的数据和系统建立起来。我们在原型开发完成之后给业务部门展示,他们也非常认可这种做法,同时也把他们在ESG研究中所既有的成果、业务角度的观点补充进来,集成到平台里,形成我们自己的研究系统。这是系统的架构图(PPT略),数据的采集到指标的转化、模型的分析最后到展示,全流程通过这种方式把它变成可见、可查、持续运行的平台。


债券智能分析平台,基于分析到的数据,以及我们采购的金融、财务数据,运用我们在机器学习方面的能力和固定收益部门业务研究能力,我们综合起来进行研发。这个平台目前只有几个方向的功能:对债券对发行人违约的预测、发行人财务造假的识别、债券流动性的预测,这几个方向我们在持续的做,有初步的成果,但这个工作还在持续的进行。


信用违约预测分析模型我们叫“乌鸦模型”,我们给出300多家可疑发行人的列表,供研究员重点关注。2018年9月模型正式运行,结果来看,2018年首次违约22家企业,我们的列表里命中19家。2019年首次违约的几家全部在我们的名单里,从运行到现在来看效果还是不错,这种模型本身需要长期检验的过程,后续还要继续跟踪、观察。


以上是通过一些例子向各位领导、各位专家报告一下我们这一两年做的工作。除了刚才提到的这些例子,在投研、合规、风控方面还有一些方向在做研究,因为时间的关系不再展开。


挑战与思考


总的来说整个工作还处于比较起步的阶段,像人工智能这些新技术还在持续的向前发展,仍处于比较初级阶段。我这里引用几个Gartner发布报告的研究数据,Gartner发布的《2019年十大技术发展趋势》中提到三项是直接和人工智能相关;三项是关系比较密切的。这里有一个图表(PPT略)。


这是AI技术发展的曲线(PPT略),Gartner认为人工智能技术持续向前发展,已经达到产品化成熟度的技术还是不多,还有86%的技术可能有回落期,在2022年以前54%的技术可能还不能达到比较稳定、可用的生产率。

企业方面Gartner做的调研,只有46%的企业开始展开人工智能方面的实验,只有11%的企业认为自己已经具备了足够能力开展这方面的能力,大量的企业处于观察,初步尝试的阶段。这也是说明了我们很多工作现在刚刚还处在起步阶段,真正起到应有的价值还有长期的工作需要做。


对于我们自身来讲,对未来金融科技工作有一些思考,和大家做一些探讨和分享。


1.现阶段来看目标还是定得比较务实一些,我们一些智能化的方案辅助人,而不是去替代人,更多的是通过人机结合的方式提升业务当中的分析、决策效益。


落实业务的价值,我们都是商业机构、企业,我们追求投资回报。今天早上很多嘉宾说创新意味着试错、意味着可能失败,我是觉得如果总是错也是不行的,如果总是错以后就看不到我了。我们也非常追求我们做的工作能实现业务的价值,所以我们未来在一些模型结果的稳定性、可解释性,包括数据的质量、数据的隐私保护方面需要做很多的工作。


2.和外界的合作,基金公司现阶段体量不是太大,包括金融科技的队伍也还不大,我们非常希望能够借助外部的力量和我们公司的场景能结合起来,在这方面跟以往我们找一些技术公司直接做项目不一样的是,我们现在做了很多事情都是探索、尝试,甚至没有固定的目标,在这个过程我们合作的形式需要更灵活、更多种方式。


内部有金融科技的团队,我们自身的定位应该怎么样,我们怎么形成自己的价值、自己的优势?这方面也是需要我们长期思考的问题,我们从人力、技术积累上讲,我们没有办法跟一些大的互联网公司、大的技术公司竞争,我们是不是也有自己的优势,是不是能找到自己的差异化发展的方向?我觉得这是非常重要的方面,也是内部金融科技团队未来发展很重要的方向。


3.团队建设和培养机制。我从招聘和这一两年来的工作经验来看,基金行业对科技人才的吸引力不是特别高,从招聘的角度我们遇到这样的问题,人才团队的招聘、培养包括带研究性质的工作怎么形成考核机制这也是我们后续需要做的工作。