金融中的人工智能

978-7-115-57919-5
作者: 吴汉铭
译者: 叶伟民
编辑: 胡俊英

图书目录:

详情

近年来,人工智能在各个领域被广泛应用,但对于很多金融从业人员来说,人工智能仍然给人一种高深莫测的感觉。本书旨在从新技术(如人工智能)的视角给出金融业务的新兴解决方案。 本书内容通俗易懂,不仅揭示了人工智能在金融业中的重要性,还结合机器学习算法和示例给出了一系列的金融科技解决方案,涉及时间序列分析、强化学习、预测分析、自动化投资组合管理、情绪分析、自然语言处理等知识点。此外,本书还结合现实工作总结了相关的注意事项。 本书适合传统金融行业的从业者以及新兴金融科技领域的实践者阅读。读者可从本书深入浅出的知识点和案例中了解到人工智能的魅力,为更好地运用人工智能技术赋能金融业务做好准备。

图书摘要

版权信息

书名:金融中的人工智能

ISBN:978-7-115-57919-5

本书由人民邮电出版社发行数字版。版权所有,侵权必究。

您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。

我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。

如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。

著    吴汉铭

     [印] 苏哈什•沙阿(Subhash Shah)

译    叶伟民

责任编辑 胡俊英

人民邮电出版社出版发行  北京市丰台区成寿寺路11号

邮编 100164  电子邮件 315@ptpress.com.cn

网址 http://www.ptpress.com.cn

读者服务热线:(010)81055410

反盗版热线:(010)81055315

读者服务:

微信扫码关注【异步社区】微信公众号,回复“e57919”获取本书配套资源以及异步社区15天VIP会员卡,近千本电子书免费畅读。


Copyright ©2020 Packt Publishing. First published in the English language under the title

Hands-On Artificial Intelligence for Banking.

All rights reserved.

本书由英国Packt Publishing公司授权人民邮电出版社出版。未经出版者书面许可,对本书的任何部分不得以任何方式或任何手段复制和传播。

版权所有,侵权必究。


近年来,人工智能在各个领域被广泛应用,但对于很多金融从业人员来说,人工智能仍然给人一种高深莫测的感觉。本书旨在从新技术(如人工智能)的视角给出金融业务的新兴解决方案。

本书内容通俗易懂,不仅揭示了人工智能在金融业中的重要性,还结合机器学习算法和示例给出了一系列的金融科技解决方案,涉及时间序列分析、强化学习、预测分析、自动化投资组合管理、情绪分析、自然语言处理等知识点。此外,本书还结合现实工作总结了相关的注意事项。

本书适合传统金融行业的从业者以及新兴金融科技领域的实践者阅读。读者可从本书深入浅出的知识点和案例中了解到人工智能的魅力,为更好地运用人工智能技术赋能金融业务做好准备。


吴汉铭(Jeffrey Ng),特许金融分析师(CFA),注册金融科技师(CFT),毕业于香港理工大学计算机与管理专业,并持有香港中文大学的金融MBA学位。曾任平安壹账通银行(香港)有限公司(Ping An OneConnect Bank (Hong Kong) Limited)金融科技部负责人(head of FinTech solutions)。他致力于推进人工智能在银行和金融生态系统中的应用。在此之前,他曾是法国巴黎银行(BNP Paribas)亚太区数据实验室的领导,为企业构建人工智能和数据分析的解决方案,并担任我国香港地区的法国工商会金融科技委员会(French Chamber of Commerce's FinTech Committee)的副主席。2010年,作为将客户分析应用到投资银行业务的先驱之一,他在银行中建立了分析团队。他曾与普华永道咨询(PwC Consulting)公司和通用电气消费者金融集团(GE Money)合作,在零售银行和商业银行中开展人工智能项目。

我要感谢我的家人和大学导师,感谢他们在我人生中最黑暗的时刻给予我的鼓励。

苏哈什·沙阿(Subhash Shah),在AIMDek Technologies私人股份有限公司担任技术主管(head of technology)。他是一位经验丰富的解决方案架构师,拥有超过12年的相关工作经验。他拥有信息技术学位,是开源代码的倡导者,并擅长利用开源代码以较低成本解决关键业务问题。他的兴趣包括微服务、数据分析、 机器学习、人工智能和数据库。他是优质代码和测试驱动的开发(Test Driven Development,TDD)的崇尚者。他的技能包括但不限于:将业务需求转化为可扩展的架构、设计可持续的解决方案以及项目交付。他是MySQL 8 Administrator's GuideHands-On High Performance with Spring 5两本书的合著者。

阿尼尔·阿曼瓦(Anil Omanwar)是一个充满活力的人,对最新的技术趋势和研究充满热情。他在认知计算领域有超过13年的研究经验,自然语言处理、机器学习、信息可视化和文本分析都是他研究兴趣的一部分。他精通银行、石油和天然气、生命科学、制造业、零售业等多个业务领域的情感分析、基于问卷的反馈、文本聚类和短语提取。他目前在IBM澳大利亚公司担任数据科学平台专家(data science platform specialist),为企业开发和提供人工智能化平台与解决方案。他拥有包括自然语言处理自动化和智能设备在内的多项新兴技术专利。

普亚·贾姆希迪亚(Pouya Jamshidiat)是人工智能、金融科技和生命科学等领域屡获殊荣的产品领导者和战略专家。他是Product School的特邀演讲嘉宾,也是The AI Book一书的合著者。他是Pioneer Minds有限公司的创始人。之前,他曾在劳埃德银行集团(Lloyds Banking Group)担任高级产品负责人(senior product owner),负责人工智能在银行各个部门的应用。他将先进的搜索和知识管理技术引入劳埃德银行集团。他曾在IBM公司担任高级产品设计顾问(senior product design consultant),在Monitise公司担任高级产品负责人。他设计过手机银行并且主张商业价值优先。最近,普亚转战生命科学领域,加入了Eagle Genomics公司,帮助其应用人工智能来解决科学家面临的大难题。


叶伟民,美国海归,曾翻译过《图数据库实战》《.NET内存管理宝典》等图书,目前在研究金融行业的人工智能应用与技术。


有幸和本书的作者吴汉铭共事过一段时间,吴先生在金融科技的应用方面一直是团队翘楚,提出了众多优秀的建议,并能够将其落到实处,其深厚的功力可见一斑。

尽管人工智能已经在金融领域被广泛应用,但对于很多金融从业人员来说,人工智能仍然给人一种高深莫测的感觉。虽然我大学阶段的专业是计算机,但在职业生涯的前20年,大部分时间都在银行或者咨询公司工作。对于金融从业人员的困惑时常感同身受——到底什么是人工智能?我们怎么样用好人工智能?人工智能能够怎么样帮到我?我会不会面临被淘汰的危险?这些问题都能在本书中找到答案。

我强烈向金融机构从业人员推荐本书,希望本书能够帮助大家更早、更快、更好地了解人工智能,学会人工智能,应用人工智能,张开双手迎接人工智能时代的到来。

——费轶明
壹账通金融科技有限公司
副总经理,企业金融CEO,董事会秘书

本书文字通俗易懂,内容饱满有层次,对于从事金融科技工作的读者很友好,读完本书既可以了解到金融业务知识,又可以从技术角度了解人工智能如何在金融业的发展中发挥重要作用。金融科技从业者一定会从中受益良多。

——杜蓉
光大银行总行信息科技部业务副经理

在金融科技赋能银行数字化转型的理念下,越来越多的银行将RPA与AI相
结合,采用OCR、NLP、语音识别等AI技术,优化部门的作业流程。银行不缺技术,缺
的是在业务领域拓展AI技术的方法论,而本书恰如“大旱遇甘霖”般地弥补了这一缺憾。

本书能够帮助银行进一步优化部门的作业流程,减少低价值工作,建立自动化工作思路,充分发掘业务场景中的标准化、规则化内容,帮助银行员工从简单工作劳动者向业务专家管理者升级,从而为员工赋能。

——潘淳
中国邮政储蓄银行信息科技管理部

当前的图书市场上还没有一本能让我满意的描述AI应用于金融业的图书,而本书恰好填补了此空白。本书全面覆盖了金融控股集团的诸多业务,包括信贷业务、投资业务、投行业务、资产组合管理、证券推介业务、零售财富管理业务,并且均给出了充分的介绍,帮助读者建立起认知框架。更难能可贵的是,本书既有业务描述又有技术描述,而且还有基于Python的代码实现,堪称“手把手教学”。而且,本书并未涉及晦涩的数学推导,因此降低了阅读门槛。

我在阅读完本书时大呼过瘾,这是一本绝对的“金融科技式”的著作,感谢叶伟民先生将其翻译出来,也相信读者能从中受益,希望本书能对中国金融业的金融科技进步有所助益。

——曹欣田
国内某股份制银行金融科技子公司

总览全书,如同经历了一场无与伦比的金融领域人工智能之旅!本书用通俗易懂的语言、独特的视角、丰富的用例,阐述了人工智能的重要性及其在金融业的实际应用。同时,本书在建模方法论的基础上,从商业银行、投资银行等业务领域出发,用人工智能技术解决了有关金融业务的问题,这对每一个金融从业者都具有极为宝贵的启发意义。

——陈俊
某标杆农商银行PMO


在新冠疫情的影响下,消费者的行为习惯和心态逐渐发生了改变。疫情形势下,许多银行的分行关闭,网上银行的用户量大幅增长,线上活跃客户的渗透率逐渐增加,网购以及非接触式付款交易的比例亦有所上升。可见疫情作为催化剂推动了消费者更快适应银行数字化的进程,应用人工智能(AI)进行数字化转型已是不可逆转的大趋势。这一切的变化意味着消费者对银行数字化服务的要求会愈来愈高,虚拟银行与传统银行及其他科创行业也正因此争相挖掘科技人才。

我在2017年与金融业界及科技业界的精英联合成立了“亚洲金融科技师学会(IFTA)”,开设金融科技师认证,旨在集结业界精英,培养金融科技人才,建立科研人才储备,推动行业发展。感谢本书的作者吴先生担任IFTA数据分析委员会主席,为推动中国香港金融科技的发展出一份力。他在这方面的资历丰富, 又曾在不少知名学府任教。教学相长,这令他的作品更能适应读者要求。

本书详述了人工智能如何应用于银行业务,结合理论及实战,站在从业人员的角度带你走进人工智能和深度学习的领域,包括利用Python自动处理商业银行业务,以自然语言处理方式预估市场反应并实现数据可视化等。不论你是经验丰富的银行从业人员,抑或是有志投身金融科技行业的毕业生,本书都绝对值得一读。

未来,我们希望通过亚洲金融科技师学会(IFTA)这个平台培养出更多更好的金融科技人才。

——庞宝林
东骥基金管理有限公司董事总经理
亚洲金融科技师学会主席及创办人


我和本书译者叶伟民相识于一个技术微信群,他一直是.NET技术社区的活跃推动者,也是经验老到的译者,翻译过多本大作。后来我们有幸成为同事,他现在是我们公司人工智能团队的一员,可以说就是“人工智能银行业实践”的践行者之一,由他来翻译本书再合适不过。

人工智能的概念在20世纪50年代就提出来了,但是在最近几年才突然爆发,这一切的变化离不开ABC的组合。

A——人工智能自身算法的演进,特别是深度学习的出现;

B——大数据,它是人工智能的精神食粮;

C——云计算,它使计算资源大大丰富,计算成本大大降低。

而在ABC的组合中,有价值的大数据最为重要。

银行业拥有大量真实的决策数据,如果某家银行能利用好这些大数据,它就相当于一家人工智能公司。今天的互联网公司,特别是头部的互联网公司都声称自己是人工智能公司,其核心就是拥有有价值的大数据。

如今,很多人工智能的算法都是公开的,人工智能的技术门槛并不高,AI已经算不上是什么“黑科技”。所以,不管是银行业的技术团队,还是业务团队,都应该认真挖掘所拥有的业务数据的价值,并利用人工智能把它们发扬光大,从而打造出面向未来的新一代金融服务。因此,只要利用好自己的大数据,任何公司都可以成为人工智能公司。在这方面,银行业坐拥海量的高价值数据,自然要当仁不让。

人工智能会改变一些行业的形态。对于银行业,风险管理一直是很
重要的命题。那么像银行业这样对风险敏感的行业,如何在引入人工智能的同时,管理好风险呢?

对于风险管理,当前世界上有两种模式。在欧美国家,通常的做法是,当一种新生事物的萌芽出现时,他们会花很长时间,组织一帮专家,进行各种讨论,并制定相应的法律法规。而我们国家则走了另一条路径,就是先让新生事物自己发展一段时间——“让子弹先飞一会”,然后再从政策层面去规范它,使它能够持续发展。

对于上述两种做法,孰优孰劣呢?也许各有利弊。但是我们确实看到了像人工智能这样的新生事物的活力,人工智能也确实为我们开拓了一种新的发展思路。尽管在目前阶段人工智能在银行业的实践和落地还有一些非技术的障碍,但并非没有出路。

本书除了介绍理念以外,也通过一个个具体的银行业业务场景,给出了实践方法以及可执行的代码,堪称让多数人都可以入门、理解和参考的宝典。

最后想强调一点,我国在人工智能领域已经占有了一席之地,本书的翻译和出版也将为这个领域添砖加瓦,贡献力量。

——刘华
汇丰科技云平台技术主管
《猎豹行动:硝烟中的敏捷转型之旅》《软件交付那些事儿》作者
《图数据库实战》中文译者之一


中国自从改革开放以来经历了天翻地覆的变化,如今已经是世界第二大经济体,占全球GDP的比重超过16%。而中国的经济增长模式也正由过去的要素投入型走向创新驱动型。创新需要金融市场的辅助,更需要科技赋能。

在历经金融大统一、分业经营及综合经营的不同时代后,中国金融业正在迈入金融科技(FinTech)的4.0时代。第三方支付等金融形式的出现,逐渐证明了科技对金融的价值。金融科技正式成为新的市场力量,以大数据、云计算、区块链以及人工智能为首的新兴技术推动了这一场金融科技革命。

近年来,人工智能(AI)的发展和规划得到了国家层面的高度重视和政策支持,逐步确定了人工智能技术在战略发展中的重要性。在过去十年,传统金融不断被新兴互联网金融所挑战,金融科技在优越的用户体验、高效率、低成本、迅速推出新产品以及开拓新市场等方面都体现了巨大的优势。互联网银行的典范——微众银行在成立的第二年就开始盈利,短短数年利润达到100亿元,估值1100亿元,客户数量超过7100万。这些成就的取得少不了良好的策略、科技以及人才的支撑,金融科技在其中发挥了举足轻重的作用。

市面上有许多关于人工智能、数字化转型以及现代金融业务的图书,比较罕有的是专注于人工智能的金融科技书籍。本书从洞察者及实践者的角度描述了数字驱动下的新金融,涉及主流的技术方案、业界流行的金融服务平台以及许多实际案例。希望本书能启发更多金融及IT从业者对金融科技进行思考,从而推动中国金融业改革再上新台阶。

——欧阳超信(Greg Au-Yeung)
资深银行IT高管
上海复旦大学高级顾问
启蒙中国(Inspiring China)YouTube频道主持


你很想学人工智能,但是看到数学就头痛。

你很想学人工智能,但是看了很多概念就是理解不了、记不住。

你看过很多人工智能的书,但是过了一段时间,学过的这些知识都忘记了。

如果从你感兴趣和容易掌握的金融业务知识入手,也许会更加容易。这就是本书和配套讲解视频的目标。

作为.NET高端图书——《.NET内存管理宝典》的译者,我是不会向.NET初学者推荐这本书的,因为入门真的不需要接触这么高端的知识。我会推荐另一本书《C#入门经典——更新至C# 9和.NET 5》。

同样,入门人工智能真的一定需要懂数学吗?

无数的人从拖控件、改配置开始进入编程这一行,慢慢地成为编程专家。这条路就不适用于入行人工智能吗?本书的配套讲解视频将从基于模板改配置开始,慢慢带你了解人工智能领域的编程。

真的需要记住那么多概念和知识吗?

我刚从非金融行业转到金融行业的时候,曾努力恶补金融知识,看了十几本金融方面的书。很可惜,不但很累,而且还没有效果,所学到的知识很快就忘记了。

后来我遇到了这本书,这本书比我之前看过的很多金融书都薄。但是因为知识点少,并且通过动手编程让我把这些知识记得比之前更牢固。我发现,记住关键的知识脉络,然后在实践中遇到问题再根据这些关键词去搜索资料,是一个很不错的学习方法。

除了金融知识之外,这本书的人工智能知识也是这样组织的。也许看完这本书,你就能够同时了解金融和人工智能的知识脉络了。

IT知识和技术的更新远比金融知识快很多。另外,在理解和掌握方面,观看讲解视频的效果比阅读图书好很多。因此我录制了一系列配套讲解视频。

读者可以在异步社区或者在B站搜索“Hands on AI for Banking讲解视频”或者关注UP主“很水的火哥”来找到和观看这一系列配套讲解视频。

十分感谢作者吴汉铭老师,在翻译本书之前,我已经翻译过好几本书了,那时候我的目标是把书翻译好。通过翻译本书,我的目标变成了让读者真真正正学到东西,并且运用到工作上,从而过上更有意义的生活。

然后十分感谢出版社的胡俊英老师,正是因为胡老师的支持,我才能够实现我上面提到的目标。

最后十分感谢过去和将来给我提建议和反馈的朋友们,正是有你们的建议和反馈,我才能持续不断地朝着我的目标前进。

科普性和准确性不可兼得,你不能期望一张地图能够给你带来十分精确的细节。本书的目标是带你进入人工智能的世界,实现从0到1的突破,给你提供搜索资料的关键词。为了实现这个目标,在某些特定情况,我们不得不牺牲专业性和精确性,所以请你注意这方面的风险并通过阅读其他资料来解决这个问题。

译者 叶伟民

2021年9月


本书旨在从新技术(如人工智能)的视角重塑你对金融业务的看法。本书是一本实践指南,它将帮助你在金融业的职业生涯中进步。本书将展示人工智能是如何让你的金融业务更加“顺畅”、成本效益比更高、更容易获得客户的,还将重点从金融服务提供方和客户方的角度来讲述人工智能的应用,而不是仅仅停留在概念层面。

你将从人工智能的重要性开始学习,同时也将深入了解最近在金融业发生的“人工智能革命”。接下来,你将探索如何使用时间序列分析和强化学习来实现自动化客户采购以及金融决策,从而获得机器学习的实践经验。在此之后,你将学习如何实现资本市场决策自动化,使用自动化投资组合管理系统以及预测投资银行业务的未来走势。除此之外,你还将探索诸如构建个人财富顾问机器人以及对客户终身财富进行大规模定制等概念。最后,你将了解在金融业的现实工作中应用人工智能的注意事项。

学完本书,你将掌握利用人工智能来“驾驭”金融业务所需的技能。

金融或IT专业的学生是本书的目标读者。本书旨在提供一个相当有用的用例列表,该列表列出公共领域中常见的用例,并提供易于实现的真实用例代码。本书试图阐述重要的用例,而不只是给你提供第二天就能投入使用的机器学习模型。

对于已经在这一领域工作的银行家,相信本书将从长远角度帮助你构建自己的服务。如果你曾经创过业,本书将能够鼓励你去尝试一些与创业公司运作方式明显不同的东西。改变需要从内到外、从外到内全方位进行。对于银行内部的IT经理来说,本书将为你提供具体的代码基础,告诉你如何应用这些技术,以及可以使用哪些开源代码库。如果你还没有信心在内部开始一切以生产为目的的开发,本书可以作为你想要启动的任何实验的代码基础。

对于投资者、有抱负的创业者或MBA学生,本书与你分享了行业参与者们经历过的问题与正面临的挑战。请创造出更适合的产品来满足大家的需求,让金融业变得更好。希望你的投资之路一帆风顺。

对于在这一领域开展业务的金融科技创业者,本书为你提供了参考,鼓励你通过开源和合作来应对全行业范围内的挑战,而不是闭门造车。

对于监管机构,本书可以作为了解金融业发展的指南。你的工作对于金融业应用人工智能起着重要的作用。同时,欢迎你指出本书模型和决策的不足,以及开放更多数据让大家分析以鼓励大家研究。

CFA的职责之一是通过应用人工智能让投资更加有效和高效。要做到这一点,较好的方法就是对技术有亲身体验,掌握技术的具体实践知识。

对于关注金融业的研究分析师和管理顾问,本书可以引导你自下而上地了解人工智能是如何改变金融业的,从而能够更好地经营,以获得更高的股本回报率。

对于人工智能硬件和软件开发人员以及研究人员,本书或许可以帮助你发掘研究课题(如果你需要灵感的话,也许真的会有帮助)。

第1章 人工智能在金融业中的重要性,阐述什么是人工智能,并讨论人工智能在金融业的应用。本章还会详细介绍金融业务流程的复杂性以及职能的多样化。

第2章 时间序列分析,介绍时间序列分析。本章通过示例详细说明时间序列分析,并说明机器对机器(M2M)的概念如何有助于时间序列分析的实施。

第3章 使用强化学习自动化商业银行贷款融资,涵盖强化学习的内容。此外,本章还使用示例介绍一些人工智能建模技术,以及示例背景下的银行业务功能。

第4章 资本市场决策自动化,讨论基本的金融和资本市场概念。本章探讨如何通过人工智能运行风险模型和利用宏观经济数据生成销售预测来帮助优化最佳资本结构。本章还会介绍线性优化和线性回归模型等重要的人工智能建模技术。

第5章 预测投资银行(券商)业务,介绍如何用人工智能技术为新发行证券进行自动化承销辛迪加来完成融资。我们将学习如何从感兴趣的投资者那里获得资金。本章的后半部分将介绍识别收购者和目标公司的案例,这需要科学地挑选出那些需要投资银行服务的对象。

第6章 使用特雷诺 •布莱克模型和ResNet自动化投资组合管理,重点研究投资者的动态变化。本章讨论投资组合管理技术,并说明如何将其与人工智能相结合,以实现购买资产时的决策自动化。

第7章 感知市场情绪,在卖方进行算法营销。本章主要介绍金融市场的卖方市场。本章详细介绍证券公司和投资银行,还会讨论情绪分析(sentiment analysis),并介绍一个使用Neo4j构建网络的示例。

第8章 使用API构建个人财富顾问机器人,主要介绍个人银行业务。本章解释管理客户数字数据的要求、如何访问Open Bank API,以及文档布局分析。

第9章 客户终身财富的大规模定制,讲解如何结合调查数据进行个人数据分析。本章还会讨论Neo4j,这是一个图数据库。在本章中,我们将介绍如何建立一个聊天机器人(chatbot),为客户提供“7×24小时”全天候服务。我们还将看到一个使用自然语言处理、Neo4j和Cypher语言来操作Neo4j中的数据从而预测客户反应的示例。

第10章 现实工作中的注意事项,是对前9章所涉及的人工智能建模技术的总结。本章还会说明在哪里可以找到该领域更深层的知识。

在开始阅读本书之前,假定你运行的是Ubuntu 16.04 LTS桌面版或更高版本,并且已经完成Python入门课程的学习。本书假定你已经掌握了安装相关软件包的知识,因此不会对这些知识进行介绍。

本书会介绍使用3种数据库引擎——SQLite、MongoDB和Neo4j,请确保你已经安装它们。

关于数据来源,第3~5章使用data.world和付费订阅的Quandl里的Sharadar Core US Equities Bundle,第6章和第7章使用Quandl里的Sharadar Fund Prices,第7章使用Twitter公司的Premium Search,第8章使用Open Bank Project。

考虑到本书是一本入门图书,读者未必能够轻松地读懂和跑通书中的代码,译者专门录制了系列讲解视频。读者可以在异步社区和B站上观看。

你可以从异步社区下载本书的示例代码文件。文件下载完毕后,请使用以下软件的最新版本解压。

对于Windows操作系统,可以使用WinRAR/7-Zip。

对于macOS操作系统,可以使用Zipeg/iZip/UnRarX。

对于Linux操作系统,可以使用7-Zip/PeaZip。

本书的代码也托管在GitHub上,可以在PacktPublishing主页下搜索Hands-On-Artificial-Intelligence-for-Banking找到代码资源。如果代码有更新,我们将会在这个GitHub代码库上进行更新。

我们还提供一个PDF文件,该文件包含本书使用的彩图,你可以在异步社区下载。

本书中使用了许多文本约定。

代码体:指示文本中的数据库表名、文件夹名、文件名、文件扩展名、路径名、虚拟URL、用户输入和Twitter句柄等代码。这里有一个例子:该函数将从Quandl下载SHARADAR数据库中任何给定股票代码的价格数据。

代码块将会是如下格式。

#list of key intent, product and attribute
product_list = ['deposit','loan']
attribute_list = ['pricing','balance']
intent_list = ['check']
print('loading nlp model')
nlp = spacy.load('en_core_web_md')

命令行的输入或输出代码都会写成如下格式。

sudo cp dataset.csv /var/lib/Neo4j/import/edge.csv
sudo cp product.csv /var/lib/Neo4j/import/product.csv
sudo cp customer.csv /var/lib/Neo4j/import/customer.csv

粗体:表示新术语、重要词语或你在屏幕上看到的词语。例如,菜单或对话框中的词语一般就会以这种格式显示。这里有一个例子:资产类别被定义为具有相似特征的一组资产。


本书由异步社区出品,社区(https://www.epubit.com/)为您提供相关资源和后续服务。

本书提供配套资源,请在异步社区本书页面中单击“配套资源”,跳转到下载界面,按提示进行操作即可。注意:为保证购书读者的权益,该操作会给出相关提示,要求输入提取码进行验证。

您还可以扫码右侧二维码, 关注【异步社区】微信公众号,回复“e57919”直接获取,同时可以获得异步社区15天VIP会员卡,近千本电子书免费畅读。

作者和编辑尽最大努力来确保书中内容的准确性,但难免会存在疏漏。欢迎您将发现的问题反馈给我们,帮助我们提升图书的质量。

当您发现错误时,请登录异步社区,按书名搜索,进入本书页面,单击“提交勘误”,输入勘误信息,单击“提交”按钮即可,如下图所示。本书的作者和编辑会对您提交的勘误进行审核,确认并接受后,您将获赠异步社区的100积分。积分可用于在异步社区兑换优惠券、样书或奖品。

扫描下方二维码,您将会在异步社区微信服务号中看到本书信息及相关的服务提示。

我们的联系邮箱是contact@epubit.com.cn。

如果您对本书有任何疑问或建议,请您发邮件给我们,并请在邮件标题中注明本书书名,以便我们更高效地做出反馈。

如果您有兴趣出版图书、录制教学视频,或者参与图书翻译、技术审校等工作,可以发邮件给我们;有意出版图书的作者也可以到异步社区投稿(直接访问www.epubit.com/contribute即可)。

如果您所在的学校、培训机构或企业想批量购买本书或异步社区出版的其他图书,也可以发邮件给我们。

如果您在网上发现有针对异步社区出品图书的各种形式的盗版行为,包括对图书全部或部分内容的非授权传播,请您将怀疑有侵权行为的链接发邮件给我们。您的这一举动是对作者权益的保护,也是我们持续为您提供有价值的内容的动力之源。

“异步社区”是人民邮电出版社旗下IT专业图书社区,致力于出版精品IT图书和相关学习产品,为作译者提供优质出版服务。异步社区创办于2015年8月,提供大量精品IT图书和电子书,以及高品质技术文章和视频课程。更多详情请访问异步社区官网https://www. epubit.com。

“异步图书”是由异步社区编辑团队策划出版的精品IT专业图书的品牌,依托于人民邮电出版社几十年的计算机图书出版积累和专业编辑团队,相关图书在封面上印有异步图书的LOGO。异步图书的出版领域包括软件开发、大数据、人工智能、测试、前端、网络技术等。

异步社区

微信服务号


本部分从经济和金融角度对金融业进行总体概述—这些内容一般很少出现在IT编程书中。本部分的存在是为了让技术专家和业务人员都能体会到对方工作的乐趣。

本部分包括以下章。

第1章 人工智能在金融业中的重要性


人工智能(Artificial Intelligence,AI),是一种非常强大的技术。精心设计实现的人工智能应用可以在业务功能自动化方面创造奇迹。人工智能有能力通过其应用来改变众多行业。计算机系统随着时间推移而发展,已经变得非常强大。因此,机器也变得非常强大,可以轻松完成许多复杂的任务。例如,光学字符识别(Optical Character Recognition,OCR)就是一项即使使用个人计算机也可以借助软件轻松完成的任务。OCR需要智能来将图像中的点转换为字符。因此,理想情况下,OCR被视为AI的一个应用。但是,由于机器是如此强大,可以完成比OCR复杂很多的任务,所以在本书中我们倾向于不将OCR视为AI的一个应用。

在本章中,我们的重点是了解什么是人工智能及其在金融业的应用。金融领域是一个极其多样化和复杂的行业领域。为了简化复杂的金融业务,金融业需要不断提供先进的技术解决方案。正如福布斯进行的一项分析显示,到2030年,在各种金融业务流程中应用AI将能为金融业节省超过1万亿美元。因此,在不久的将来,金融业将从AI系统中获益很多。

首先我们将简要介绍人工智能和金融业。在本章中,我们将定义在软件系统中实现AI的方法,并介绍金融业是如何通过AI应用受益的。此外,本章还将涉及更多主题。所以,与其简单地讨论你可以从本章中学到什么,不如就让我们直接开始吧!

在本章中,我们将重点讨论以下几个主题。

什么是人工智能?

了解金融业。

金融业务可获得性的重要性。

人工智能在金融业的应用。

人工智能,又称机器智能,是机器创造出来的、能够表现出人类通常以自然智能形式所表现出来的智能的统称。约翰·麦卡锡(John McCarthy)在1955年提出了人工智能这个术语。

在某种程度上,人工智能能够基于预先定义的规则将决策过程从人类层面转移到机器层面从而辅助人类。在计算机科学领域,人工智能也被定义为对智能体的研究。智能体是指任何能从环境中学习,并能根据所学知识做出决策、以最大限度提高实现其预定目标的概率的设备。

人工智能能够解决极其广泛的问题。这些问题包括但不限于简单的数学难题、寻找从一个地点到另一个地点的最佳路线、理解人类语言以及处理大量研究数据以生成有意义的报告。以下是系统为解决这些问题而必须具备的能力,以及每种能力的简要说明。

推理:解决难题和进行逻辑推理的能力。

知识表示:对研究人员和专家收集的知识进行处理的能力。

计划:确定目标和确定成功实现这些目标的方法的能力。

学习:通过经验改进算法的能力。

自然语言处理(Natural Language Processing,NLP):理解人类语言的能力。

感知:使用传感器和设备(如摄像头、麦克风等)以获得足够的输入来理解和解释环境的不同特征的能力。

运动:四处移动的能力。

让我们快速了解一下机器学习的基础知识。机器可以使用3种方法进行学习——有监督学习、无监督学习和强化学习,如下所述。

有监督学习(supervised learning)是基于挖掘带标注的训练数据的概念。这些训练数据表示为由输入数据和预期的输出数据组成的数据对。其中,输入数据又称特征向量(feature vector)——这是一个数字向量,即可以用数字来表示输入数据的特征。输出数据又称标注、标签或标记,本书将输入数据和输出数据组成的一对,统称为标注(label),每对数据都有一个标注。图1-1所示为有监督学习方法。

图1-1

无监督学习(unsupervised learning)基于这样一种情况:提供的训练数据没有任何与数据相关的基础信息,也就是说训练数据没有被标注。无监督学习将尝试找出这些训练数据的隐藏含义。图1-2所示为无监督学习方法。

图1-2

强化学习(reinforcement learning)是一种没有训练数据的机器学习方法。这种方法基于两个概念——智能体(agent)和对该智能体的奖励(reward)。智能体要学习经验以获得奖励。图1-3所示为强化学习方法。

图1-3

开源软件运动(将在1.3节进行讨论)推进了软件开发。该运动与硬件(例如GPU、CPU、存储和网络硬件)的改进相结合。它还得到了无数致力于提高硬件性能和强化互联网连接性能的技术人员的支持。这些技术人员已经将人工智能算法发展到了接近人类智能。

图1-4所示为我们在实施机器学习项目时应考虑的典型技术栈。

图1-4

表1-1所示为图1-4提到的不同软件组成部分的几项关键技术。

表1-1

序号

组成部分

相关名称

相关说明

1

用户界面(User Interface,UI)/应用程序接口(Application Programming Interface,API)

API/Python

API是一种允许程序与另一个程序通过互联网协议进行交互的接口。与UI相比,API是针对机器设计的。在后文中,我们会介绍一个个人银行服务的开放银行(open bank)项目创建消费银行服务,在这一部分中我们将使用API从数据源中提取数据

2

机器学习和分析

TensorFlow、scikit-learn、PyTorch、ImageNet

Google公司的TensorFlow自2017年以来一直是最受欢迎的深度学习框架之一。scikit-learn是一个很方便的机器学习包,它在机器学习方面提供了许多有用的功能。当我们研究深层神经网络时将使用TensorFlow和Keras,当我们做不太复杂的网络和数据准备工作时将使用scikit-learn。本书的第2章到第9章将介绍使用这些构建机器学习模型。
PyTorch是一个很有名的机器学习框架,因篇幅所限,本书未能详述这一框架,感兴趣的读者可以自行了解。
ImageNet是由美国普林斯顿大学在2009年创建的,目的是帮助研究人员测试和构建基于数据集的深度学习模型,这使得利用深度学习网络进行图像识别的研究蓬勃发展

3

数据存储方式(数据结构)

pandas和NumPy

pandas和NumPy是令Python能够操作数据的数据结构。
本书的代码示例使用了它们。它们是使Python在数据科学家中流行的关键原因之一。第2章到第9章将会介绍如何使用这些库

4

3D加速

NVIDIA

如果TensorFlow在后端(如NVIDIA提供的软件和硬件)使用3D加速,则Keras相关代码的计算性能将得到提高,例如第3章中的相关代码

5

操作系统

Ubuntu

Ubuntu是一个免费、开源的操作系统,它与我们在本书中介绍的大多数Python库兼容。它可以说是人工智能社区首选的操作系统

6

编程语言和开发环境(编辑器)

Python、IDLE、JypyterLab

Python是人工智能领域常用的一种编程语言。Python的存在要归功于DARPA在1999年的资助,其目的是提供一种通俗易懂的编程语言,它是开源的。IDLE是一个与Python默认“捆绑”在一起的集成开发环境。IDLE是Python自带的集成开发环境,初学者可以利用它方便地创建、测试、调试和运行Python程序。然而,还有更多的开发环境可供开发人员使用,如Jupyter Notebook、JupyterLab Spyder等。本书将介绍使用Python和IDLE来编写代码。译者将在配套讲解视频中使用JupyterLab来编写代码

7

版本管理(版本控制)

GitHub

GitHub是最流行的基于云的协作网站之一。云技术的普及,令云协作成为可能,云技术实现了可扩展的计算和存储。我们的代码库将在GitHub上存放和交换

随着我们对本书会涉及的工具、技术和软件包的简单介绍完成,现在让我们继续探索人工智能的一个重要领域——深度学习。下面将详细讲解神经网络和深度学习。

神经网络和深度学习

除了开源软件运动,神经网络的研究突破在提高人工智能算法决策的准确率方面也发挥了重要作用。你可以参考伊恩· 古德费洛(Ian Goodfellow)、约舒亚· 本吉奥(Yoshua Benjio)和亚伦·库维尔(Aaron Courville)的《深度学习》一书来获得更数学化和正式的介绍。你也可以参考安东尼奥·古利(Antonio Gulli)和苏伊特·帕尔(Sujit Pal)的《Keras深度学习实战》,该书为开发人员做了简明的分析。

深度学习是机器学习的一个特殊子领域或分支。深度学习方法的灵感来自一种以人脑为模型的计算机系统,即神经网络

银行通过移动或Web应用程序聊天机器人(chatbot)提供的在线客户支持是深度学习在银行业务中应用的一个很好的例子。当涉及理解客户请求、偏好和兴趣的上下文时,此类应用程序(聊天机器人)是强大的。聊天机器人连接与数据存储交互的后端应用程序,根据客户的输入或对服务的选择,向客户呈现各种可供选择的子服务。

聊天机器人或深度学习应用程序是分层工作的,可以把这比作人类学习一门自然语言。例如,一个人通过严格学习如何独特地识别每个字母来掌握字母表之后,他将有资格进入下一个复杂层次——单词。此人将会先学习短单词,然后学习长单词。掌握了单词之后,此人将进入下一个复杂层次——句子。他将开始造句,理解不同复杂程度的语法概念。一旦达到复杂层次的顶端,此人就能够掌握这门自然语言了。

你可能已经注意到了,每进入层次结构的下一个阶段或层时,学习将会变得更加复杂。每一层都是基于从上一层复杂度中学习的知识构建起来的,这就是深度学习的工作原理。程序不断地学习,在从上一层获得的知识的基础上,形成新一层复杂度的知识。分层复杂度就是“深度”这个词的来源。

深度学习的主要作用在于使模型的性能更好,因为它可以适应更复杂的推理。我们希望能够准确地做出财务决策,这意味着在平衡客户利益的同时,给股东合理回报的成本效益比将更高。

我们对智能机器的期望就是输入处理输出这么简单,如图1-5所示。

图1-5

在大多数金融业案例中,我们实施了有监督学习,有监督学习类似于训练动物的过程——你对正确的结果给予奖励,并阻止不正确的结果(这个例子听起来像强化学习,但是也适用于有监督学习)。这就是我们需要用结果——目标变量(target variable)来进行训练的原因。

在确定硬件预算时,你需要确保囊括了正确的硬件资源配置。这将使你能够在承诺的预算范围或上线时间内完成交付,特别是在你要从零开始建设一家银行的人工智能时!

鉴于银行面临的经济压力相当大,你最好确保所花的每一分钱都能发挥作用。为了做到这一点,我们需要了解硬件对人工智能的贡献,以确保我们拥有正确的硬件资源配置。

除了软件和算法之外,使用图形处理单元(Graphics Processing Unit,GPU)固态盘(Solid State Disk,SSD)将有助于加快机器学习的速度。GPU和SSD的使用令计算机进行智能化思考成为可能。

1.图形处理单元

图形处理单元(GPU)是一种专门设计的电路,能够以并行方式来处理计算。并行方式处理计算适用于计算机图像处理,其中每个像素都需要同时处理,来最终生成完整的图像。为了直观地说明这一点,假设有10个像素需要处理。我们可以对这10个像素逐一进行处理,也可以将它们分成“10个过程”来同时处理。

CPU在每个像素的处理时间方面具有独特的优势,而GPU具有多线程的优势,可以同时处理数据。表1-2所示为串行数据处理和并行数据处理之间的区别。

表1-2

串行数据处理

并行数据处理

数据是按顺序依次传入的,因此需要较长的时间来处理计算

数据是并行传入的,从而缩短了处理时间

对于运筹学专业的学生来说,通过上述比较,很容易就能看出应该要使用GPU,这类似于我们设计工厂工作流程的方式——尽可能多地挖掘产能并减少瓶颈!

除了擅长处理图像外,GPU还被用来进行深度学习,将SSD与GPU结合使用还能提高CPU/GPU的数据读写处理速度。

2.固态盘

机器学习要求的另一个硬件是一种叫固态盘(SSD)的存储设备。传统的硬盘使用机械电动机将读写数据的磁头放到磁带或磁盘的指定位置。与此相反,SSD是使用电路上的电流来读写数据的,因此没有电动机的机械运动。板载电流与电动机的机械运动相比,令SSD的数据检索速度快了约20倍。

数据挖掘跨行业标准流程(Cross-Industry Standard Process for Data Mining,CRISP- DM)是一种建模方法论。数据挖掘是探索大量数据以确定要应用于下一组数据以生成所需输出的任意模式的过程。本书在介绍建立模型时,将使用CRISP-DM建模方法论。这将有助于我们保持统一的方法来实施机器学习项目。图 1-6 所示为在机器学习项目中使用CRISP- DM建模方法论的项目执行流程。

图1-6

如图1-6所示,CRISP-DM建模方法论涉及多个阶段。我们可以详细解释一下,具体如下。

(1)理解业务:这一阶段主要是确定项目的业务目标。在这一阶段,你要明确与核心业务目标相关的问题。例如,假设核心业务目标是利用客户与网站互动的历史数据来预测客户何时离开某个网站。那么要明确的相关业务问题可能就是目前的支付界面是否就是导致客户离开网站的原因。在这一阶段还要确定出业务成功的标准。

(2)理解数据:这一阶段主要是理解从数据库或数据存储里挖掘到的历史数据。对数据的大小、格式、数量、与业务的关系、字段、数据来源等方面进行分析。

(3)准备数据:这一阶段主要是提高数据的质量,使其达到机器学习算法处理所需的水平。例如按所需格式对数据进行格式化、将数据四舍五入到可接受的精度以及准备派生属性等。

(4)建模:这一阶段主要是选择要应用的建模技术或算法。选择算法就是寻找一个函数,当给定相应的输入时,该函数会产生所需的输出。

(5)评估:这一阶段主要是评估前一阶段所建立的模型的准确率。我们将对模型进行必要的修改,以提高效率和准确率。

(6)部署:这一阶段主要是确定模型在实际环境中的部署策略,以处理新数据。为了保证模型的准确率,我们还要对模型进行监测。

在大致介绍了什么是人工智能、机器是如何学习的以及人工智能的实施方法之后,现在是时候介绍金融业这一行业了。在后文中,我们将探讨金融业各种类型的金融业务和其所面临的挑战。

金融业是一种持有特定类型金融资产的专用经济体,其所使用的方法能使上述资产在一段时间内实现财务增长。金融业受政府或类似机构制定的规则约束。

著名作家和金融顾问斯蒂芬·瓦尔德斯(Stephen Valdez)在其著作《国际金融市场导论》中描述了国际金融市场中不同类型的金融业务。

它们分别是商业银行业务、投资银行业务、资产管理业务、保险业务、消费贷款业务和影子银行业务。

以上这些类型的金融业务基本满足了从大型组织到个人客户等各种客户的需求。后文将从客户需求的角度出发,对这些类型的金融业务进行说明。

商业银行业务可以是零售业务(服务于个人),也可以是批发业务(服务于公司)。从本质上讲,商业银行业务的重点是从储户那里吸收存款,并将这些存款贷给借款人,从而收取利息来盈利。商业银行的发展依赖于其对借款人发放贷款的风险的评估能力。如果不能准确评估风险,就可能会无法向储户归还资金而导致破产。许多商业银行就因此在金融危机中倒闭,例如美国的华盛顿互惠银行。

投资银行/证券公司业务包括咨询业务和证券交易业务。咨询业务主要是处理企业的买卖,也就是并购(Mergers and Acquisitions,M&A)、债权融资、股权融资(例如,企业在纽约证券交易所上市)。证券交易业务包括股票、固定收益、大宗商品和外汇的交易。证券交易业务涉及愿意购买证券的买方、愿意出售证券的卖方以及促成证券买卖的经纪人。
咨询业务的核心是通过合并或分拆业务为企业创造价值。通过这一过程可以提高企业的绩效。它还通过变成标准化借贷结构(如债券)来优化企业的资金成本。企业可以通过向金融市场参与者发行新股或卖出现有企业股份(股权)来进行更多的投资。
上述所有活动都是只有在金融市场参与者能对企业给予正确评估的前提下才能创造价值的,而这些评估是由市场情绪以及更多的是由理性的思考所驱动的。

资产管理业务包括各种类型的基金——共同基金、交易所交易基金、对冲基金、私募基金等。资产管理公司采用不同的投资策略(买入和卖出决策的组合)来投资各种类型的金融资产和企业的各个生命阶段。对投资的未来价值给予正确估值是这个业务的关键决策之一。
资产管理的参与者对创造收益有一种“饥渴感”,以达到从保护资产价值到增值等各种目的。他们通常被称为买方,代表资产所有者,相关的金融服务包括证券销售(面向客户、收集订单)、交易(执行订单)以及研究(评估证券)。

保险业务包括普通保险和人寿保险。人寿保险可以保障购买者在一定程度上避免承担死亡后果的损失,人寿保险不能涵盖其他所有方面,如灾害造成的损失、行李丢失造成的损失、黑客或病毒利用系统漏洞造成的损失等。
保险业务的核心是评估被保人或被保物的风险状况。同时,创造投资收益以弥补损失的能力也很重要。保险公司的投资业绩越高,通常它的竞争力就越强,它的保险定价就越激进。这也是伯克希尔-哈撒韦公司的保险定价[1]能够具有竞争力的原因之一 ——它的投资业绩优异。

[1] 译者注:虽然沃伦·巴菲特(Warren Buffett)以“股神”著称,但是伯克希尔-哈撒韦公司的主营业务的确是保险业务。

消费贷款业务以消费类债务为代表,主要是指我们在生活中不同阶段可能需要的房贷、车贷、个贷以及信用卡业务等。

影子银行业务主要是指常规银行系统之外的金融活动。例如另类的投资基金、向消费者提供借贷的消费和抵押贷款金融公司。

通过将金融业的庞大规模与全球每年的生产收入相比较,我们就能大致了解全球是如何利用金融业务来维持发展的。

但是,仅展示统计数据,未免比较抽象。让我们假设全球是一个人。那么金融是如何融入这个人的生活的呢?下面就给大家列举说明。

(1)年收入:根据世界银行的统计,2018年全球经济的生产力以及由此产生的年收入为79.87万亿美元。大约1/5(19%)的年收入来自跨境贸易(14.64万亿美元)。

(2)财富:全球人类每年的年收入大约相当于4.38年的年度GDP。2018年度GDP的细目见表1-3。这里的年收入信息是综合了各种来源获得的信息,然后将经济活动与GDP的规模进行比较得出的。这4.38年可以分为以下几个部分。

0.91年放在资产管理公司里。

0.78年放在银行里。

1.04年放在股市里。

剩下的1.65年则是信贷/借款(债券为0.76,银行贷款为0.39,影子银行业务为0.45,消费贷款为0.05)。

当然,这是对全球财富的简化描述。有些数字可能会被重复计算,例如股市的数字可能包括上市公司的存款,而这些存款又被计入了银行负债。这里我们只是通过一条捷径,按原样显示这些数字,以便我们了解各种金融活动的相对规模及其重要性。

(3)保险:为了抵消生产或投资活动中产生的任何不良风险带来的损失,全球人类年收入的6%被用于购买保险,保险金额则为其对应收入的1.45倍。保费将用于购买相关金融资产,以产生收入来抵消任何不良风险带来的损失。

(4)衍生品:作为风险保护工具,除了保险之外,还有衍生品这种金融工具可以用于提供风险保障。术语“衍生品”是指双方之间围绕着标的资产,在某些特定条件下为支付或获得经济利益而达成的协议。标的资产从固定收益(fixed income)货币(currency,即外汇)大宗商品(commodities)不等,可简称FICC。

固定收益包括利率和信用衍生品,货币指的是外汇的衍生品,大宗商品指的是大宗商品的衍生品。外汇(即表1-3中的“全球外汇场外交易+交易所交易衍生品”)以87万亿美元的未偿风险敞口位居表1-3的第二位,这大致相当于全球GDP。大宗商品、信贷和股票衍生品所占比例较小,各占GDP的2%至9%左右。当把衍生品作为一种风险保护工具进行核算时,我们并没有包括一种叫作场外利率交易或者利率场外交易(Over-the-Counter,OTC)的衍生品,因为它相当于全球GDP的6倍——这远远超过了作为风险保护工具所需要保护的财富范围。但是事实上,有些投资者把利率场外交易也当作一种投资产品。这里我们把利率场外交易剔除,这是因为我们是从对保险的整体理解角度来分析的。场外交易指的是不通过交易所,由投资银行与客户直接进行的双边协议。

与场外交易相对应的是场内交易,又称交易所交易,是指供求双方通过一个集中的交易所买卖金融产品的交易方式。本书并没有列入太多交易所交易的数据,但这一点被包含在所提到的外汇、大宗商品、信贷和股票等数据里面,所以还是起到了展示金融业各个领域相对规模的作用。

表1-3所示为以上数据汇总。

表1-3

 

2018年GDP/万亿美元

占GDP的百分比/%

全球 GDP

75.87

100

全球跨境贸易额

14.64

19

财富

332.46

438

全球资产管理

69.10

91

全球银行负债(包括存款)

58.93

78

全球股市

79.24

104

全球债券市场

57.49

76

银行贷款

29.70

39

影子银行业务

34.00

45

全球消费贷款

4.00

5

全球保险(新投保)

4.73

6

保险范围内的衍生品(不含利率场外交易)

110.15

145

全球外汇场外交易+交易所交易衍生品

87.41

115

大宗商品场外交易合约

1.86

2

场外信用衍生品

9.58

13

股票挂钩合约

6.57

9

利率场外交易合约

461.98

609

 

 

除了另有说明之外,所有数据均为前文提及的2018年全年数据。GDP和股市规模数据来自世界银行;跨境贸易数据来自世界贸易组织;新增保险保费数据来自瑞士再保险公司;全球资产管理规模数据来自波士顿咨询公司2018年发布的全球资产管理报告;所有银行业务、债务和衍生品统计数据均来自国际清算银行。

金融业的客户包括参与储蓄活动的储户和参与贷款活动的借款人。在从事商业银行活动(如跨境支付或外贸金融)时,他们又被称为申请人(资金发送方)受益人(资金接收方)

如果客户从事的是投资银行、证券、资产管理等活动,则被称为投资者,或者直接称为客户。在为了免受潜在风险影响的购买保险活动中,买方被称为投保人,而该保险活动则被称为保险项目。在风险发生的情况下,如果保险公司需要赔偿,则收受赔偿的人被称为受益人

非金融公司是所有金融活动的真正企业客户,应被视为经济学意义上的真正参与者。它们最终吸纳储存了央行超发的货币,为消费者生产商品和提供服务。

 

在此本书想要明确和强调的一个信息是,金融是为实体经济服务的。那么,为什么金融机构的业务增长会超过实体经济的增长呢?好吧,按照切凯蒂(Cecchetti)和Kharroubi的观点,过多的金融业务增长会损害实体经济的增长。它会带走能够为实体经济做出贡献的高素质研发人才,这些高素质研发人才的流失会对生产要素产生负面的影响。你可以在Why does financial sector growth crowd out real economic growth一书中找到更多有关这方面的信息。

金融业务应该像电和水等一样广泛和容易获得。我们只有提高金融机构的效率,才能使金融业务成为像电和水一样方便的业务,从而使尽可能多的人受益。金融业务是一种服务,提供这种服务的目的是充分地利用资本/资金,为储户或需要资金的人创造回报,使他们在约定的风险和回报下过上更有意义的生活。

我们要做的与罗伯特·J希勒(Robert J.Shiller)在其著作《金融与好的社会》中的观点一致,他在书中指出了信息技术在金融中的必要性,指出信息技术可以帮助我们实现目标。下一步就是利用开源软件解决方案和应用来解决金融业务的可获得性挑战。开源软件解决方案往往具有成本效益比高、健壮性强和安全性高等优点。

要想让金融业务变得更容易获得,最重要的事情之一就是要拥有大量的数据。这将使决策更加高效和透明,从而有助于降低金融决策的成本。我们将在本节讨论对开放数据的需求。由于金融市场竞争激烈,金融业务的价格将会逐步降低,因此效率更高的金融机构将会赢得更大的市场份额。

人工智能一旦在金融业实施,则会对该行业产生三方面的影响——重复性任务的工作岗位将减少,人工智能将会辅助人类提高效率,以及创造与人工智能相关的新任务(如建模)方面的就业机会。在这三者中,工作岗位的减少和效率的提高将会影响到现有的工作岗位,而就业机会的创造将会对未来的人才和就业市场产生影响。

随着自动化的发展和效率的提高,现有的工作将会受到影响和改变。机器可能会以比人类更高的效率来执行日常任务。然而,为了管理、监控机器或人工智能执行任务等,该行业将会对既懂金融业务又懂人工智能技术的专业技术人士提供工作机会。

由于开源软件运动,因此过去20多年来技术发展的速度相当快。开源软件运动始于Linux,随后是ImageNet。ImageNet提供了大量的训练数据,这些训练数据促进了从事研究、开发人工智能算法的技术人员的活动。这些技术人员利用Python、R、scikit-learn、TensorFlow等编程语言和开源库,开发了深度学习和神经网络的算法。本着同样的精神,本书的代码也是开源的。

除了开源软件运动促进软件开发之外,还有另外一个关键要素就是数据。寻找实用的开放数据是一个挑战。同时,相对于其他行业,金融业还要面临一个额外的挑战:要谨慎、安全地将客户委托给金融机构的数据在不会违规的前提下转换为可以交给机器训练的数据集。

如今,在金融业和银行业,对客户数据的保密性要求仍然是向更广泛研究团体开放数据的主要障碍之一。现实工作中的问题可能比我们在开放数据领域看到的问题还要复杂。开放存储在数据库中的数据可能还是一个比较实际的步骤,而开放如图像、文档、音频文件或语音对话等数据,则是一个挑战。因为这些数据一旦被掩蔽或修改,可能就会系统性地丢失一些信息。

实际上,在金融业务中实现实际应用的主要成本也来自数据获取。你将会在本书中看到降低数据收集和汇总的成本是一个重大的挑战。至于我们的社会要如何处理这个问题,要如何激励商业界去解决这个问题,则需要进一步的讨论,这超出了本书的范围。

让我们讨论一项单一的金融业务,即在融资市场中匹配资金的需求。这是一项非常常规的数字匹配业务。在这里,显然计算机会更适合这项工作。

采用人工智能的目标是让机器做人类现在正在做的事情,但效率会比人类去做更高。很多人不禁要问,在金融业应用人工智能是否会影响到金融业从业人员的工作。

请记住,我们的目的并不是要取代人类,而是要提高人类现有的能力,提高生产力,这也一直是整个人类文明史上所有科技发展的目标。众所周知,人类在概率准确性方面是比较弱的,丹尼尔·卡尼曼(Daniel Kahneman)在2013年4月2日发表的心理学研究论文“Thinking, Fast and Slow”[2]中就指出了这一点。因此,人类在没有计算机的情况下进行概率决策其实是很有挑战性的。

[2] 译者注:丹尼尔·卡尼曼在发表了这篇论文之后,又出版了同名书籍。

麦肯锡全球研究院的《人工智能——下一个数字前沿》这份报告所列举的13个行业中,金融业排名第三,紧跟在“高科技和电信”“汽车和装配业”之后。

虽然麦肯锡全球研究院的报告中并没有提到金融业的用例,但是或许我们可以通过如下所示的人工智能创造价值的4种方式来稍微研究一下。

预测:预测需求,改善采购,减少库存(空闲资金)。

提高生产力:以更低的成本或更高的质量提供服务。

促销:在正确的时间为正确的客户提供正确的价格以及正确的信息。

提供服务:提供丰富、个性化、便捷的用户体验。

现在就让我们根据上面4种方式来研究一下人工智能是如何应用到金融业的,研究结果如表1-4所示。

表1-4

参与者

预测:更好地预测

提高生产力:更低的处理成本

促销:个性化报价

提供服务:便捷

商业银行

优化资金需求

利用人工智能,可以实现贸易融资处理的自动化,从而提高效率

当货物流向不同类型、不同风险程度的利益相关者时,人工智能可以提供进出口金融业务的实时报价

使用支持NLP的聊天机器人来改善客户服务

投资银行

对公司进行估值

有了人工智能,能够通过识别市场情绪来更快、更低成本地传达市场信号

人工智能可以自动匹配资产卖家和买家的需求

可以随时随地获取信息

资产管理

资产评估和优化

人工智能可以通过自动化交易和平衡投资组合来提供帮助

人工智能可以给客户推荐投资

更快速、便捷地更新投资组合

面向个人的银行业务

制订切实可行的储蓄计划

个性化的机器人顾问可以从收据中捕获数据,而无须人工帮助

人工智能可以理解到客户需要融资或投资产品的合适时机

使用智能机器人7×24 小时全天候随时随地为客户提供服务

现在,我们可以全面地看到数据是如何被用于金融业的智能决策的:更多的数据点和更高的数据交换速度可以大大降低金融业务的成本。更详细的例子将会在后文中提供。

那么我们要怎样才能降低成本呢?从本质上来讲,我们可以通过减少花费在生产金融业务方面的时间来实现这一目标。

为了让你了解人工智能对金融机构盈利能力的影响,我们从两个角度来看一些简单的估算:模型预测准确率的提高以及运行/训练模型所花费的时间。

在过去的10年里,GPU的时钟频率和内核数量约提高了10倍,从大约300个内核增加到大约3000个内核。

本书将我10年前经历的浅层机器学习或统计模型与我现在所看到的深层神经网络进行了比较。神经网络的模型预测准确率从80%左右提高到90%以上,提高率约为12.5%。表1-5所示为内存数据速率、内存总线带宽和内存大小方面的改进。

表1-5

年份

GPU

GPU内核时钟频率

内存数据速率

内存总线带宽

内存大小

2007

8800 Ultra

612 MHz

2.16 GHz

384 bit

768 MB

2018

TITAN X

1417 MHz

10 GHz

384 bit

12 GB

2018

GeForce RTX 2080 Ti

1545 MHz

14 GHz

352 bit

11 GB

表1-6所示为以上硬件的发展给金融业相关领域带来的改进情况。

表1-6

需求

改进

金融业相关领域

预测:更好地预测

模型预测准确率提高了15%

风险模型、定价

提高生产力:更低的处理成本

自动化率达到了50%

运营

促销:个性化报价

模型预测准确率提高了15%

风险模型、定价

提供服务:便捷

如果所有流程都是自动化的,则能够减少50%的延迟

运营

如果金融机构的成本收益比在70%左右,那么自动化可能会将这一比例降低一半到35%。但是,随着人工智能在金融业应用的激增,所多出的技术投入成本将会占5%~10%,从而会使目标成本收益比从35%上升到45%。这对发达国家的金融机构影响较大,因为与新兴市场相比,发达国家的劳动力成本要高很多。

提高预测的准确率将进一步降低金融机构在预测方面的成本,进而降低15%的风险成本。本书的看法是,对发达国家来说,风险成本占总资产的50个基点。因此将金融机构的风险成本降低15%对发达国家来说其实并不能为金融机构的盈利能力带来重大改进。

预测准确率和便利性的提高将提高金融业务的可获得性,这意味着该金融机构可以接触到那些过去认为不可行的更大的市场。虽然股本回报的获利能力比例并不能反映出这种影响,但是这种影响将表现在金融业的规模和金融机构的市值上。在扩大市场覆盖面之后,股本回报率(Return on Equity,ROE)应该会提高到14.5%。

股本回报率从7.9%提高到14.5%,提高了约80%。不过,对于系统重要性银行,将会有11%~12%的资本充足率要求(具体比例数据每个国家和地区会不一样,可以参考“银监发〔2011〕44号”文),这在过渡阶段将会使整体股本回报率下降到13.3%,直到所有法规和监管都到位。

本章开头,我们先解释了人工智能是怎么一回事。人工智能是让机器执行人类能做的任务的技术,例如天气预测、预算预测等。它使机器能够基于数据进行学习。我们介绍了人工智能的各种技术,例如机器学习和深度学习。然后,我们介绍了金融业的复杂流程。如果我们能够将它们自动化,我们将可以降低金融机构的成本。我们还了解了金融业务可获得性的重要性。最后,我们研究了人工智能在金融业的应用及其积极影响,并用一些数据来支持这些论点。

从第2章起,我们将继续金融业人工智能之旅。第2章将重点介绍时间序列分析和预测。我们将使用各种Python库,如scikit-learn,来执行时间序列分析。还将解释如何测量基于机器学习的预测的准确率。第2章将会充满有趣的内容,并将教你如何将财务比例与机器学习模型相结合。这将会更深入地探讨如何应用机器学习模型来解决金融业的问题。

读者服务:

微信扫码关注【异步社区】微信公众号,回复“e57919”获取本书配套资源以及异步社区15天VIP会员卡,近千本电子书免费畅读。


相关图书

金融软件测试从入门到实践
金融软件测试从入门到实践
金融科技2.0:从数字化到智能化
金融科技2.0:从数字化到智能化
Python金融实战案例精粹(第2版)
Python金融实战案例精粹(第2版)
银行信息科技:构建银行数字化发展新图景
银行信息科技:构建银行数字化发展新图景
Python期货量化交易
Python期货量化交易
Excel金融建模
Excel金融建模

相关文章

相关课程