阿里云刘伟光:4万字解读金融行业全域数据“观”(精华版)
2023-02-21 09:44:16

“风起于青萍之末,浪成于微澜之间”,用(yòng)这句话来形容中國(guó)金融行业数据领域发展的历程颇為(wèi)恰当。从2003年银行的数据仓库初建开始到今天整整20年过去了,相比其他(tā)行业,金融行业真正完整地经历了数据仓库建设和大数据建设的两个十年周期;同时经历了从MPP技术到Hadoop大数据开源技术、存储计算分(fēn)离的云原生数据处理(lǐ)技术,再到AI数据智能(néng)化的时代;从持续了20年的数据治理(lǐ)到今天的全域数据资产管理(lǐ)的数据中台化架构,关于金融行业的数据计算分(fēn)析和智能(néng)化运营的探索从来没有(yǒu)停止过。但是,如何在原有(yǒu)的数据基础和平台技术积累上完成全局视角的数据能(néng)力提升和技术體(tǐ)系的迭代,是今天金融行业共同关注的话题,也是金融机构进入数字化智能(néng)时代的重要标志(zhì)。

阿里云历时5年助力阿里巴巴集团完成了全域数据中台的建设,同时也在数据平台的建设和数据治理(lǐ)方面服務(wù)了众多(duō)不同类型的金融行业客户;数据智能(néng)化方面,在接触了近千家金融机构了解实际业務(wù)需求和现状后,激发了我们创造本文(wén)的热情与初衷,期望用(yòng)更全面、更立體(tǐ)的视角去定义数据的技术和业務(wù)价值;站在全局视角去剖析数据生命周期的管理(lǐ);站在云原生技术的视角去建议数据计算能(néng)力的未来布局。

同时全文(wén)解析了从底层数据计算到数据资产化的完整建设方法和路径;分(fēn)析了当前数据平台如何从分(fēn)而治之的建设模式和技术體(tǐ)系逐步演进到全局的数据智能(néng)化中台。关于数据领域研究,不仅仅是技术命题,我们也讨论了金融机构内部数据运营模式以及数据人才建设體(tǐ)系这些当前重要话题。

期待本文(wén)能(néng)够為(wèi)金融机构不同部门在治理(lǐ)/应用(yòng)/运营/计算/决策等诸多(duō)数据方面的工作,带来有(yǒu)价值的新(xīn)发现,带来更多(duō)关于数据思想的碰撞。


一、金融行业数据领域面临的困扰

数字化程度的一个重要标志(zhì)是“数据与业務(wù)的关系”是否能(néng)从“跟随”(事后分(fēn)析)到“伴随”(实时分(fēn)析),再到“引领”(智能(néng)服務(wù))。金融机构的数据能(néng)力已经出现了较大的分(fēn)化,有(yǒu)些已经一骑绝尘、很(hěn)好地引领业務(wù)的创新(xīn),有(yǒu)些则不仅不能(néng)跟随业務(wù)、甚至成為(wèi)了业務(wù)发展的阻碍。


 一是数据平台面临“跟不上”业務(wù),而出现“掉队”的情况。从2017年到2021年,全國(guó)数据生产量增長(cháng)了3倍多(duō),实时数据、触点数据、过程数据、IOT数据、音视频数据等数据价值不断被深入挖掘,未来业務(wù)对数据规模、数据时效、数据类型、数据应用(yòng)需求会更进一步放大,现有(yǒu)的数据架构开始出现“跟不上”业務(wù)而“掉队”的情况。

二是数据管理(lǐ)普遍存在“数据有(yǒu)标准、没有(yǒu)落地”“指标同义不同名、同名不同义”“数据处理(lǐ)与元数据两张皮”等局面。以监管报送為(wèi)例,每年超千万罚单均与数据质量相关,提高数据质量已成為(wèi)亟待解决的问题。

三是数据资产“缺盘点”。企业往往面临着“指标多(duō)、资产少”的困境,报表很(hěn)多(duō),但能(néng)够服務(wù)业務(wù),且可(kě)复制、可(kě)重用(yòng)的数据资产却很(hěn)少。

四是数据服務(wù)“效率低”。目前大量金融机构用(yòng)数取数还是传统模式,从需求到拿(ná)到数据需要数月时间,“响应慢”是用(yòng)数部门普遍面临的痛点。


二、金融数据发展瓶颈的破题之术

未来的金融机构都是“数据驱动型”企业。金融服務(wù)正在从“大”到“小(xiǎo)”到“微”,数据价值也从原来的“结果记录”发展為(wèi)起到“实时精准制导”的作用(yòng)。我们认為(wèi),数据能(néng)力像“水”,数据體(tǐ)系就像盛水的“木(mù)桶”,需要打造企业整體(tǐ)数据能(néng)力,為(wèi)此,我们从顶层设计、业務(wù)价值、数据服務(wù)、数据治理(lǐ)、数智算力、数字人才等六个维度提出“企业数据能(néng)力建设参考模型”。


 

首先,数据體(tǐ)系的建设需要从原来单点需求功能(néng)实现转变為(wèi)自顶向下的总體(tǐ)规划设计,审视构建满足业務(wù)战略的数据能(néng)力,将“数据+业務(wù)+技术+组织”融為(wèi)一體(tǐ),有(yǒu)效联动,系统化建设企业级数据體(tǐ)系,全面提升数据能(néng)力。

其次,从业務(wù)目标上,让数据回归解决业務(wù)痛点的本源,将以人為(wèi)驱动的业務(wù)经验总结出来,形成以数据驱动的业務(wù)动作;从数据服務(wù)上,通过一站式数据门户,转变用(yòng)数习惯,从按需到交互式自助模式,让数据使用(yòng)贴近业務(wù);从数据质量上,数据生产源头的治理(lǐ)更加重要,将数据标准有(yǒu)效嵌入到数据生产到消费的各个环节,打造全链路治理(lǐ)能(néng)力;从平台算力上,海量近实时化数据和基于数据的智能(néng)决策的爆发式增長(cháng),需要数据平台架构向云原生化和多(duō)算力融合能(néng)力的升级。

最后,重点需要数字化人才體(tǐ)系的打造,尤其是数据产品经理(lǐ)将成為(wèi)企业数据领域洞察业務(wù)需求、沉淀数据产品、提升服務(wù)供给能(néng)力的“破局者”。


三、金融数据能(néng)力建设的核心观点

数据战略就是企业战略。数据是一面“镜子”,如何把数据的价值从“后视镜”(做历史分(fēn)析),转变為(wèi)“望遠(yuǎn)镜”(看方向)、“放大镜”(精细化操作)、“显微镜”(发现问题真相),关键是看企业的数据體(tǐ)系的完整度(木(mù)桶的短板)和数据能(néng)力的应用(yòng)程度(水位的高低)。

(一)以全局视角的驱动力

站在全局视角,我们提出了“全域数据观”的“一张蓝图、3+1数据體(tǐ)系、6大核心能(néng)力”的数据能(néng)力體(tǐ)系框架,如下图所示。


 

一张蓝图:通过自顶向下的设计方法,统一规划和设计数据驱动业務(wù)发展的战略目标和价值,推动企业整體(tǐ)数字化经营,从而體(tǐ)系化解决原有(yǒu)数据體(tǐ)系分(fēn)散建设的问题。

三个驱动:采用(yòng)存算分(fēn)离、多(duō)引擎算力融合架构的算力驱动,打造企业级数字基建;构建“采建管用(yòng)”的全域数据體(tǐ)系和“盘评治享”的全链路治理(lǐ)體(tǐ)系的数据驱动,沉淀企业高价值数字资产;运用(yòng)“人货场”数字化运营體(tǐ)系的价值驱动,助力数业融合的数字应用(yòng)。

一套机制:工作目标管理(lǐ)、组织架构支撑及数字人才體(tǐ)系等一系列运营保障机制。

六项能(néng)力:通过“3+1”数据體(tǐ)系的建设,帮助金融机构在增效率、降成本、提质量、敏创新(xīn)、强团队、建生态等六项核心能(néng)力上得以提升。

(二)以分(fēn)层视角的核心力

在数据能(néng)力體(tǐ)系中,“3+1”数据體(tǐ)系是核心能(néng)力,采用(yòng)分(fēn)层架构详细设计了数字基建、数字资产和数字应用(yòng)三层核心架构,以及运营保障机制。


 

1、数字基建

数字基建是数据计算、存储的算力基础设施。针对当前海量数据算不动、效率低、成本高、难运维等问题,新(xīn)一代大数据平台建设通常遵循五大法则,分(fēn)别是具备云原生扩展的多(duō)种计算模式融合、支持多(duō)层智能(néng)化的分(fēn)布式存储层、统一调度和弹性伸缩的资源池管理(lǐ)、异构计算引擎的工作负载协同和大数据SRE智能(néng)运维能(néng)力。

2、数字资产

数字资产通过全域数据资产建设、智能(néng)化数据分(fēn)析手段以及多(duō)样数据服務(wù)能(néng)力,实现企业数据的管理(lǐ)闭环,并打通各层级与多(duō)业務(wù)间的数据壁垒,实现数据的统一整合与运营,提高企业数据建设和应用(yòng)的效率。全域数据“观”提出数字资产建设 4项核心能(néng)力+4项扩展能(néng)力。

 

4项核心能(néng)力:通过“采、建、管、用(yòng)”建设数据资产體(tǐ)系

1)“采”—— 企业数据资产全域采集,核心能(néng)力在于“全域和时效”

全域是解决数据完整性问题,时效是解决数据实时性问题,同时多(duō)样数据源為(wèi)了确保与企业内部数据融合,还需要规范化和标准化的管理(lǐ)机制保障。随着经营管理(lǐ)决策对数据时效性的需求,对数据全面性、实时性也提出了较高要求,如基于埋点数据的采集和分(fēn)析可(kě)大幅提升客户经营决策能(néng)力。

2)“建”—— 敏捷构建企业级核心数据资产,核心能(néng)力在于“敏捷和复用(yòng)”

敏捷解决的是数据模型研发效率低的问题,复用(yòng)解决的是公共层、萃取层建设的数据资产共享问题。我们在进行数据模型分(fēn)层體(tǐ)系、数据公共层模型體(tǐ)系、企业级指标和标签體(tǐ)系建设的同时,引入模式设计即开发工具提升数据研发效率和质量,并通过指标和标签體(tǐ)系沉淀企业高价值数据资产,引入数据连接(数据+算法+服務(wù))技术实现多(duō)端设备互联互通,打通数据资产与业務(wù)通道,实现数业深度融合。

3)“管”—— 打造精品数据资产管理(lǐ)及运营體(tǐ)系,核心能(néng)力在于管“好”资产

数据资产管理(lǐ)是金融机构一直不断持续优化的能(néng)力,构建全域资产知识图谱,摸清家底;通过资产价值健康度评估,提升资源利用(yòng)效能(néng);借助源系统数据研发工具与数据治理(lǐ)平台工具集成,实现全链路数据治理(lǐ)體(tǐ)系升级,实现高价值数据资产的“金融活水”作用(yòng)。

4)“用(yòng)”—— 数据产品打通数据应用(yòng)“最后一公里”,核心能(néng)力在于“价值和體(tǐ)验”

数据产品和服務(wù)建设目标是全面掌握企业数据资产、降低用(yòng)数门槛、提升用(yòng)数體(tǐ)验。同时,推动企业内部形成人人都是分(fēn)析师的文(wén)化氛围,為(wèi)此,我们提出三个关键方向:一是数据产品化将成為(wèi)数据资产从资源态到服務(wù)态的重要载體(tǐ);二是数据产品经理(lǐ)将成為(wèi)数据人才建设中的“灵魂人物(wù)”;三是一站式数据工作台将加速推动金融机构的数据平民(mín)化进程。

4项扩展能(néng)力:我们还需要通过“盘评治享”打造新(xīn)一代数据治理(lǐ)體(tǐ)系,持续管理(lǐ)“好”企业的高价值数据资产。

1)“盘”—— 全面了解家底

数据资产盘点,明确数据资产范围,自动化构建数据资产目录,盘点数据资产内容,打造数据资产标签體(tǐ)系,通过可(kě)视化和智能(néng)化手段,支持各类用(yòng)户快捷高效、便捷查询和了解数据资产情况,摸清底数。

2)“评”—— 评估资产价值

数据资产评估,针对资产价值、效能(néng)、质量、活性和安全等不同维度建立对数据资产的评价方法,以量化的方式描述和评价数据资产,便于数据生产者、数据管理(lǐ)者和数据消费者更准确的了解数据资产的状态。

3)“治”—— 提升数据质量

数据资产治理(lǐ),从数据资产可(kě)用(yòng)性的角度提升数据质量。新(xīn)一代数据治理(lǐ)机制的关键点在于“全链路数据治理(lǐ)”,抓住数据生产源头,强化业務(wù)系统元数据管理(lǐ),从源头消除数据标准不落地问题,推动治理(lǐ)工作迁移,将规范设计嵌入研发體(tǐ)系,形成全链路数据治理(lǐ)能(néng)力,从而解决设计与运行、線(xiàn)下与線(xiàn)上两张皮的现象。

4)“享”—— 服務(wù)与共享

数据资产服務(wù)与共享,以数据资产在企业内部的充分(fēn)流动、高效共享,实现用(yòng)户端侧价值為(wèi)首要目标,具體(tǐ)工作围绕着数据产品化、服務(wù)计价和服務(wù)运营几个方面展开。

3、数字应用(yòng)

借用(yòng)“消费者运营”的理(lǐ)念,贯穿客户全生命周期、围绕“人—货—场”三个核心要素的数字化运营體(tǐ)系,建立业務(wù)通、数据通、技术通的跨业務(wù)单元和技术团队的高效协同能(néng)力。

 

1)“人”——客户经营数字化

客户经营旅程数字化是用(yòng)数字化能(néng)力实现从潜客線(xiàn)索初筛到获客开户再到业務(wù)培育最终实现忠诚沉淀的过程,从一条完整链路的客户经营视角,实现对客户陪伴服務(wù)的过程。通过数据驱动业務(wù)流程,优化决策分(fēn)析,与客户形成互助共赢的紧密关系,真正培育出金融机构的長(cháng)期黏性客户。

2)“货”——产品运营精细化

结合客户经营管理(lǐ)的数字化能(néng)力,形成不同客群、不同阶段、不同需求的个性化产品精细化运营體(tǐ)系。采用(yòng)数据分(fēn)析算法,通过产品组合提供相应产品定价和推广建议,客户可(kě)一键完成購(gòu)买的交易过程,同时跟进市场和需求变化情况动态调整,并建立跨业務(wù)条線(xiàn)的合作模式,实现产品服務(wù)精准、客户服務(wù)专享等體(tǐ)验的大幅提升。

3)“场”——渠道生态多(duō)样化

构建数字渠道核心思想是构建用(yòng)户承接渠道矩阵,连接用(yòng)户教育到用(yòng)户转化,形成和客户的多(duō)层次连接。通过多(duō)样化的渠道建设,解决金融服務(wù)“最后一公里”难题。主要包括三层:一是新(xīn)媒體(tǐ)流量运营,打造品牌心智;二是可(kě)交互渠道,加深用(yòng)户理(lǐ)解产生黏性;三是自有(yǒu)渠道,提供全链路金融服務(wù)。每层场的定位和运营策略都有(yǒu)差异,结合客户分(fēn)层,通过不同的“场”实现“人和货”的协同。

4、运营保障机制

运营机制是数据體(tǐ)系持续发展、数据价值逐步释放的关键驱动力。它是通过战略及目标、组织及制度的制定和拆解,从数据资产及运营、数据平台工具及运营、数据产品及运营的维度分(fēn)别建立配套工作目标、组织架构、数字人才等一系列运营保障机制。

(三)以业務(wù)视角的价值链

数据驱动下企业数字化经营的价值體(tǐ)现尤為(wèi)重要,需要多(duō)部门密切配合。如精准获客、产品定价、风险识别、数据管理(lǐ)和平台建设等方面,是分(fēn)别站在金融机构的前台、中台、后台部门,以及数据管理(lǐ)和科(kē)技研发部门的不同视角,通过数据能(néng)力體(tǐ)系的建设“看”企业经营管理(lǐ)能(néng)力的提升。业務(wù)前台部门围绕人货场数字化经营理(lǐ)念,进行潜客精准识别度;业務(wù)中台部门结合客户分(fēn)层价值分(fēn)析,建立精细化产品定价體(tǐ)系;业務(wù)后台部门通过审计数据挖掘,主动预警人為(wèi)操作风险,防患未然;数据管理(lǐ)部门通过数据的全链路治理(lǐ),提升数据质效;科(kē)技研发部门通过技术能(néng)力升级,增强算力,增效降本。数据體(tǐ)系化建设将不断驱动金融机构迈向数字化企业。


 

四、金融数据能(néng)力建设的成功要素

Capital One创始人曾说:“我们不是一家银行,我们是一家以数据作為(wèi)基础战略的公司,只不过我们公司第一个成功的产品碰巧出现在银行业”。数据能(néng)力是未来金融企业的第一能(néng)力,数据能(néng)力越强的企业,边际效应越强、业務(wù)扩展越轻松、产品服務(wù)越精细化。

(一)关键能(néng)力和价值方向

金融行业的数据體(tǐ)系建设应注重以下价值方向:一是降低数据建设成本,二是进行全链路数据集成与治理(lǐ),三是实施一站式数据研发和服務(wù),四是满足多(duō)样化的数据服務(wù)體(tǐ)验,五是强化数据产品经理(lǐ)的培养与塑造。


 

(二)关键路径与成功要素

一是通过数据體(tǐ)系评估,形成适合自身发展的数据體(tǐ)系成熟度评估模型,并制定企业数据战略。二是准确把握数据中台模型与数仓模型的关键差异,合理(lǐ)选择最佳数据模型。传统数仓是数据驱动,周期長(cháng),但模型稳定;数据中台是业務(wù)场景驱动,见效快,但模型变化频繁。三是充分(fēn)考虑传统数仓的演进路径,从技术架构、数据模型、平台兼容性、业務(wù)对数据需求等方面评估,选择数仓平迁、数仓升舱或数据中台重构方案,在迁移中还应考虑语法兼容性和工具便捷性,确保成本和风险双降,服務(wù)效率和价值双升。四是建设统一数据服務(wù)平台,提供统一门户支持数据的资产分(fēn)类和数据管理(lǐ),提供稳定的、高效的、安全的全域数据服務(wù)。五是强化全员的数据责任意识,通过治理(lǐ)體(tǐ)系优化,明确相应的责权利。六是构建多(duō)维度企业数据资产共享,释放数据价值。


作者:刘伟光,阿里巴巴集团副总裁,阿里云智能(néng)新(xīn)金融&互联网事业部总经理(lǐ)

来源:银行家杂志(zhì)


相关热词搜索:数据,金融行业

上一篇:李扬:积极推动金融业的数字化转型
下一篇:人行消保局尹优平:推进普惠金融与绿色金融高质量融合发展