算法金融——AI金融应用的新物种
人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,基于人工智能的科技产品通过对人的意识和思维过程进行模拟、学习,使产品能像人一样思考,在某些方面达到甚至超过人类的智力水平。2017年5月在乌镇举行的围棋峰会上,AlphaGo横扫众多围棋高手,以深度学习为代表的人工智能算法将AlphaGo推向了围棋界的巅峰。这表明人工智能在对传统制造行业产生重大效能之后,已成功渗透到复杂的分析决策领域,也预示着人工智能算法今后将对社会生活的各个领域产生重要影响。
图片来自“123rf.com.cn”
人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,基于人工智能的科技产品通过对人的意识和思维过程进行模拟、学习,使产品能像人一样思考,在某些方面达到甚至超过人类的智力水平。2017年5月在乌镇举行的围棋峰会上,AlphaGo横扫众多围棋高手,以深度学习为代表的人工智能算法将AlphaGo推向了围棋界的巅峰。这表明人工智能在对传统制造行业产生重大效能之后,已成功渗透到复杂的分析决策领域,也预示着人工智能算法今后将对社会生活的各个领域产生重要影响。
与此同时,移动互联、物联网的兴起使许多线下活动转移到线上,这些线上行为积累了海量的数据,而云计算的极速发展又极大地提升了针对海量数据进行储存与运算的能力。这些领域的发展进步为人工智能算法的深入应用创造了可行的条件。
什么是算法金融业务?
金融业作为一个“泡”于数据、“跑”在云上的行业,数字化程度很高,也极具客户基础、数据基础和社会影响,在人工智能应用方面具备得天独厚的优势和广阔的前景。同时,人工智能算法通过对投资决策、风险定价等金融最核心职能的优化,可以更有效地提高分析判断的效率,助力金融经营决策的智能化、动态化与前瞻化,最终造就了算法金融的创新业务模式。
在财富管理领域,智能算法的应用领域主要包括高频交易、统计套利策略、动量与其他资产组合管理、机器学习与计算金融智能、衍生品估值算法分析、行为金融与投资者启发以及舆情分析与文本处理等。比如机器人投顾,可以利用递归神经网络实现对金融市场中时变数据的最优估计,获取动态最优的投资组合配置;可以利用XGBoost算法预测股票涨跌的概率,挑选股价上涨概率较大的股票;可以利用SVM算法对股票涨跌进行分类,对个股或大盘的走势进行预测。正是在算法的驱动下,形成了从用户属性分析到投资组合推荐再到组合动态调整的全流程、自动化的机器人投顾业务模式(见图1)。
在风险信贷领域,智能算法可以应用于对公企业的风险管理,实现客户多维度数据管理、财务侦测、信用评级违约判定、授信额度计量、风险定价等功能,也可以用于审批针对零售小微客户的线上快速贷款。比如在物流行业,通过构建物流金融风控模型,可以提高银行等金融机构在多种企业融资模式下的风险管理能力。一方面,借助层次分析法(AHP)处理较为复杂而模糊的大数据,配合专家经验对指标排序,通过计算判断矩阵的最大特征值和特征向量,得到各元素的权重,实现量化打分评级的效果,并将信用评分结果应用于额度计算、贷款定价等审批决策过程,实现信贷审批精准量化决策辅助。另一方面,在数据积累到一定程度下,基于人工智能、机器学习、统计学、信息检索、数据库等技术,利用信息值(IV)、相关性、共线性(VIF)等技术手段筛选并删除失效的财务指标,让中小融资企业为迎合传统风控模型而人为调整的各项财务指标减弱或失效,同时挖掘出那些潜在的、有效的风险特征、数据规律、规则、趋势等,达到“总结过去、预测未来”的智能化效果(见图2)。
算法金融的本质
算法金融的本质是要搭起计算科学、人工智能、数据科学等理论技术与金融行业具体业务场景之间的桥梁,使不同领域的算法在金融行业得到更为鲜活的应用,推动金融服务的智能化水平不断提升。
算法的基础理论及基本原理是公开的、共有的,但理论原理要落地,要进一步形成与金融场景相结合的具体方法技术,直到最终产品的出炉,还有很多具体环节需要实现突破。这个过程中的核心和关键就是算法理论和原理如何与具体的金融业务场景相融合。从这个角度,算法金融对产品或服务的创新并不一定是算法原理的改造,而是建立在金融场景与算法原理对接基础上的数据工程化、原理实证化及算法产品化的过程。
以数据工程化为例,算法金融产品在某个金融场景能否得到成功应用,主要取决于产品对该场景中数据及信息的分析预测结果。如果说场景中的数据是基础,如何在场景中选择合适的数据并提取相关特征,对算法模型的效果起着至关重要的作用(见图3)。好的训练数据及特征能使算法模型产生更好的作用,即使在模型不是最优的情况下也能产生不错的效果。比如,利用XGBoost算法构造选股模型以选出股价上涨概率较高的股票时,一个很重要的步骤就是筛选与股价相关的数据并提取对股价影响较大的特征因子,如财务指标、技术指标等等,特征因子的好坏会直接影响模型预测股价涨跌的效果,而特征因子的提取又需要对股票市场行情、公司基本面等领域都有一定的专业知识。
从数据工程化到算法产品化,整个过程的实现必须建立在算法产品研发人员对场景、数据、算法原理、算法产品的系统部署等整个流程均具有较深厚的理解与认知的基础上;需要将算法与场景连接起来,通过设计算法、开发模型来刻画、描绘场景,将场景关系转换成可以定量描述的状态、空间,或者将变化规律通过数理方程、图论支持的图示、神经网络等算法刻画出来。一个量化概念的构造或一个算法原理在不同场景中的应用过程往往千差万别,其应用效果也是大相径庭。比如,概率通常被用来表示一个事件发生的可能性,但既可以用来筛选建模样本,也可以用来预测股票涨幅大小,还可以通过概率思维来表达特定个体某种尝试行为的次数及相应的数据生成过程。
最近邻域算法(KNN)是机器学习的分类算法之一。这一算法可以应用于信用卡产品的精准营销上,基于海量信用卡交易信息,推算所有POS机的位置,以此构建每个用户的消费轨迹,为精确进行用户画像、个性化推荐、商圈营销等提供依据;也可用以判断股票走势分化趋势,确定强势、中等、弱势股票的分类边界,分类边界的形状会因K的取值不同而不同,因此关键就是要找到合适的K值,而寻找最优K值的过程可能又会涉及其他算法;同时,针对不同的数据特点,最适合的K值的算法也有所不同(见图4)。
算法金融业务的特点
算法金融业务的最典型特征就是贯穿整个业务场景的全链条服务,而不是只在业务的某一个环节或者产品建设的某一个阶段发挥作用(见图5)。
从产品的打造过程来看,算法金融业务是全流程的算法驱动与串联:从业务场景端的切入开始,到场景内外部数据整合、清洗挖掘、特征变量的加工,到算法体系设计与具体实施步骤,逐层落地算法伪代码,业务实证结果的编码实现,数据集的增广,直至业务痛点被解决,全过程均有算法的支持与驱动。整个过程中,为达到阶段性的目标需要构造具体的、可描述的目标(函数),这些目标(函数)的优化又会涉及不同领域的算法推理实现环节及实现步骤的编码过程。
从产品的生命周期来看,算法产品的开发验证、测试上线、监控优化形成了一个闭环,每一环节中都存在着不断的调整优化,甚至涉及具体实现算法的重新构造。算法模型通过不断试错迭代,循环修正当前算法对场景变迁刻画不充分、不到位的地方,不断化解场景与数据的关联度、适配度不足的问题。因此,智能化算法金融业务产品往往能够自动做出更精确有利的金融决策,提升金融资源利用效率,提高服务质量,增强客户的差异化竞争能力,增加业务经营的商业价值。
以风控类的算法产品为例,金融机构对公客户的授信审批催生了对风控算法产品的需求,产品建设的整个过程中,需要整合企业内外部数据并提取风险相关特征,利用机器学习算法进行训练分析,从业务稳定性、还款能力、还款意愿、信用历史等方面全面评估企业的信用风险,并将算法结果应用于授信审批过程,以降低业务审批的边际成本。在风控算法产品上线使用后,仍需要对其表现持续监控和验证,评估实际运行效果,进行更新优化及再开发,修正其中存在的缺陷,以确保算法模型的有效性和满足监管合规要求。
算法金融产品的全流程数据算法驱动、模型不断调整优化等特点使得其与传统人工决策相比具有较明显的优势:算法金融产品利用大量数据对算法模型进行训练,由模型自动生成分析结果,在数据信息发生变化时会及时调整,给出新的最优结果;人工决策主要基于业务经验,对长期的业务实践进行归纳总结,得出一些事件发生的规律,对变化的捕捉相对滞后。相比之下,算法金融产品在对客观特征的发现识别、对未知的判断预测上有更高的精准度。同时,算法金融产品基于强大的数据处理能力,在处理问题尤其是处理大量问题时的效率要明显优于人工。在很多情形下,算法金融产品所起到的服务效果往往需要许多相同种类的人工服务才能达到。