• 首页 >  投资金融 >  金融科技
  • 北京金融科技产业联盟:金融业数据应用发展报告(2023)(167页).pdf

    定制报告-个性化定制-按需专项定制研究报告

    行业报告、薪酬报告

    联系:400-6363-638

  • 《北京金融科技产业联盟:金融业数据应用发展报告(2023)(167页).pdf》由会员分享,可在线阅读,更多相关《北京金融科技产业联盟:金融业数据应用发展报告(2023)(167页).pdf(167页珍藏版)》请在本站上搜索。 1、金融业数据应用发展报告(2023)北京金融科技产业联盟 2024 年 5 月 版权声明 本报告版权属于北京金融科技产业联盟,并受法律保护。转载、编摘或利用其他方式使用本报告文字或观点的,应注明来源。违反上述声明者,将被追究相关法律责任。编制委员会 编委会成员:何 军 聂丽琴 孔 宇 左 燕 刘 刚 编写组成员:蒙永明 蔡 睿 张少敏 金银玉 单进勇 蔡超超 韩 杰 卞 阳 杨天雅 陈嘉俊 张敬之 曹旭涛 郑华祥 李 博 吴红力 姚 明 陈 聪 张艳君 黄 淼 王鹏达 胡翔鹰 黄翠婷 陈 涛 康和意 李伟男 毛智琪 陈 明 李克鹏 李如先 刘维静 李 杰 叶旭发 秦 凯 徐集优 王 超 赵 可 2、王慧敏 编 审:黄本涛 国 钰 郭 栋 刘宝龙 参编单位:中国农业银行股份有限公司 中国银行股份有限公司 北京数牍科技有限公司 上海富数科技有限公司 浙商银行股份有限公司 平安银行股份有限公司 青岛银行股份有限公司 北京金融资产交易所有限公司 深圳市洞见智慧科技有限公司 北京银联金卡科技有限公司 北京冲量在线科技有限公司 同盾科技有限公司 蚂蚁科技集团股份有限公司 深圳市腾讯计算机系统有限公司 联易融数字科技集团有限公司 中电金信软件有限公司 蓝象智联科技有限公司 目 录 一、概述.1 二、发展背景.3(一)政策指引.3(二)标准引导.15 三、发展现状.29(一)数据治理.29(二)数据资产3、管理.34(三)数据运营.37(四)数据要素流通.48(五)流通技术.57 四、面临的挑战.68(一)政策标准有待进一步完善.68(二)数据应用风险管控亟待加强.71(三)数据服务能力评价机制仍需完善.74(四)系统建设与数据应用仍然存在割裂.76(五)数据产品创新能力不足.79 五、发展建议.81(一)加大政策支持与标准供给.82(二)推进数据安全体系落地.85(三)构建数据服务闭环.91(四)建设数据友好型系统.93(五)加强数据驱动型产品建设.97 六、典型案例.104 七、结语.147 八、附录.150 1 一、概述 随着数字经济席卷全球,数据作为一种新型生产要素已成为重要战略资源。各4、行业纷纷增设信息科技部门,加大信息化建设力度,以期利用大数据技术提高服务能力和水平。在我国,互联网、政府、金融是大数据融合产业发展的重点行业。其中互联网和金融行业信息化水平高、研发力量雄厚,在业务数字化转型方面处于领先地位。除此之外,金融数据是大数据商业应用最早的数据源之一,面对如今快速增长的海量网络数据和复杂的网络社群关系,如何从大数据中提取有价值的信息,最大化提高数据服务能力,是金融行业不可避免的难题。在此背景下,中央多次发文表示要加强数据的感知、传输、存储和运算能力。国民经济和社会发展第十四个五年规划 中,明确指出要加快构建全国一体化大数据中心体系,建设若干国家级大数据中心集群;激活数据5、要素潜能,加快建设数字经济、数字社会、数字政府;充分发挥海量数据和丰富应用场景优势,推动数据赋能全产业协同转型;加强数据开放共享,建立健全数据要素市场,开展数据跨境传输安全管理试点。金融科技发展规划(20222025 年)提出新时期金融科技发展指导意见,明确金融数字化转型的总体思路、发展目标、重点任务和实施保障。解决金融科技发展不平衡不充分等问题,推动金融科技健全治理体 2 系,完善数字基础设施,促进金融与科技更深度融合、更持续发展,更好地满足数字经济时代提出的新要求、新任务。本报告通过对数据应用技术在2021至2023年间的发展进行分析探索,希望能够对大数据在金融行业的应用提供参考。报告一共6、分为六章。第一章概述,介绍了本报告的研究内容与意义。第二章发展背景,从政策及标准的背景、内容、影响等方面介绍2021 年到 2023 年新出台的对金融行业影响较大的行业政策和行业标准,以及金融行业机构对新政策的解读。第三章发展现状,从数据要素流通、数据资产管理、数据治理、流通技术等角度对金融行业数据应用现状进行详细介绍。第四章面临的挑战,提出了政策标准不够完善、数据应用存在安全风险、数据服务能力评价体系不完善、系统建设与数据应用仍然存在割裂、数据产品创新乏力等数据应用面临的挑战及难题。第五章发展建议,针对第四章提出的挑战进行了逐一分析建议,提出了加强政策引导与制定应用标准、保障数据安全体系落地7、、形成数据服务闭环、建设数据友好型系统、数据驱动产品建设等对策建议。第六章典型案例,介绍了金融业数据应用的实践案例。第七章结语,总结课题情况及数据专委会重点工作。本报告在北京金融科技产业联盟数据专委会组织下,由农业银行牵头,中国银行、数牍科技、富数科技、浙商银行、平安银行、洞见科技、银行卡检测中心、冲量在线、青岛银行、同盾科技、北京金融资产交易所、蚂蚁集团、腾讯、联易融、中电金信、蓝象智联等机构共同编写完成。3 二、发展背景 在数据要素建设全面提速的背景下,数据赋能金融机构数字化转型已成为大数据时代的必然选择,全面加强数据能力建设势在必行。当前,金融机构对数据能力的要求和关注日益提升,监管部门8、也加强了对数据能力建设及数据治理的要求和指引。本章节主要从政策背景、内容、影响等角度对中华人民共和国数据安全法 中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见 金融科技发展规划(20222025 年)金融数据安全 数据生命周期安全规范 金融数据安全 数据安全分级指南金融业数据能力建设指引等政策法规、行业标准进行解读。(一)(一)政策指引政策指引 1.1.中华人民共和国数据安全法中华人民共和国数据安全法(1)政策背景 2021 年 6 月 1 日,中华人民共和国数据安全法(以下简称数据安全法)经第十三届全国人民代表大会常务委员会第二十九次会议表决通过,于 2021 年 9 月 1 9、日正式施行。数据安全法 是我国首部以规制数据安全为核心内容的专项法案,其施行既有利于弥补我国数据安全保护领域的法律空白,为保护我国数据安全以及维护数据主权提供法律支持,又有 4 利于推动以数据为核心的数字经济的发展,实现我国产业的数字化转型升级。该法案对于数据采取的治理逻辑为保护加利用,一方面,基于国家安全战略对数据的审查、评估、管理等制定了严格的政策与措施,另一方面,为数据的要素化、充分挖掘数据的巨大潜能提供了重要的制度保障。这是整个数据行业的基本法,更加强调总体国家安全观,该法以数据为核心,对信息社会、数据时代起基础性支持作用,其本质是以安全为基础和起点,终极目标是数据作为生产要素能够加速10、流通。数据安全法不仅回应了国内外重要的数据安全问题,还体现了我国数据安全保护的决心。一方面,进入信息全球化时代以来,数据安全问题频发,世界重要国家与国际组织先后通过立法对数据安全问题进行规制。另一方面,近年来我国产业的数字化转型升级加快,对数据安全保护提出了新的要求。我国当前针对数据安全问题的立法存在空白,法律体系尚不完善,数据安全受到严重威胁。在数字经济蓬勃发展的时代,应当建立起我国统一的数据安全法律体系,提升数据安全保护效力,为推动数字经济发展打下坚实的法律基础。因此,数据安全法的出台具有深刻的时代意义。(2)政策内容 a.具体内容 数据安全法是我国在数据安全领域的专门立法,与网 5 络安11、全法 个人信息保护法以及其他专项及地方立法共同构成我国数据安全保护法律体系。数据安全法主要包括以下四个方面的内容:第一,数据安全法确立了我国坚持数据安全保护与发展并举的原则。安全是法律保护的秩序价值,发展是法律追求的重要目标。就数据规制而言,需要更好地平衡安全与发展的关系,以实现数据安全与发展的动态平衡。丧失了安全保障,数据发展将失去稳定运行的前提,甚至会由于缺乏监管而带来不可承受的风险与损害。因此,我国坚持数据安全保护与发展并举,在确保数据安全的前提下,鼓励数据依法合理有效利用,促进以数据为核心的数字经济发展。第二,数据安全法 设立了多样的数据安全保护机制。数据安全法出台前,我国多从技术控制12、的角度对数据安全问题进行规制,强调通过技术手段保障数据安全,缺乏相应的配套制度。该法第三章以专章形式规定了数据分级分类保护、数据安全审查、数据出口管制、对等措施以及跨境流动审批等制度,强调以完善的体制机制维护数据安全。数据安全法设立的数据安全保护机制,弥补了过去重技术轻制度建设的情况,减少了因制度建设不完善而产生的数据安全问题。第三,数据安全法明晰了数据安全保护义务。与该法设立的数据安全保护机制相衔接,数据安全保护义务强调在数据安全保护机制下实行多元主体协作机制。在保护义务的具体实施方面,数据安全法第四章规定了数据内部及外部控制、风险监 6 测、风险评估以及数据交易等机制,明确了各级各类主体应13、当承担的义务以及采取的必要措施。考虑到政务数据具备的特殊价值,数据安全法第五章对政务数据安全与开放问题进行了单独规定。明晰的义务有利于规范数据处理活动,进一步明确数据安全监管责任,降低数据安全风险。第四,数据安全法建立了追责制度。针对不同的义务主体,数据安全法在第六章规定了不同的法律责任。针对我国有关主管部门,明确了其监管责任以及对违反数据安全保护义务的组织和个人可以采取的措施。对进行数据处理活动的有关组织和个人而言,应当配合主管部门的监管,遵守数据安全保护制度,否则将根据其违法的程度不同,给予警告、停业整顿、吊销营业执照以及罚款等惩戒措施。与上述措施不同,对不履行监管义务的国家机关工作人员以14、及责任人员主要给予行政处分以示惩戒。数据安全法以分级分类的形式明确了不同主体的法律责任,使得数据安全法的执行力更强,能够有效预防、制止以及惩罚危害数据安全的各类行为。总体而言,数据安全法明确数据安全主管机构的监管职责,建立健全数据安全协同治理体系,提高数据安全保障能力,促进数据出境安全和自由流动,促进数据开发利用,保护个人、组织的合法权益,维护国家主权、安全和发展利益,让数据安全有法可依、有章可循,为数字化经济的安全健康发展提供了有力支撑。b.落地方案 7 对标数据安全法等法律法规和监管要求,金融机构首先要建立健全数据安全管理制度体系,细化数据分类分级机制,补充完善重要数据管理、数据安全风险评15、估、数据安全审查和出境管理等方面的要求,并加强监督落实。其次要持续完善数据安全技术防护措施,参照有关标准规范和最佳实践,做细做实数据分类分级和全生命周期安全防护建设,从源头上加强技术安全防护。最后要不断加强数据合规使用,规范数据采集和外部数据使用,加大政务数据的采集和开发利用,同时做好动态管理,针对数据采集、传输、融合、共享、发布等关键环节,组织开展数据安全风险评估,对涉及国家安全的,及时申报数据安全审查。金融机构的数据治理体系建设核心将转向以保护数据主体权益的数据安全治理体系,从组织架构、管理流程、技术工具、人才培养等多个方面自上而下进行推动。重点关注的内容包括管理机构的明确、数据合规机制的16、建立与运转、数据安全创新技术的引入与研究、培训宣贯与人才培养。为落实数据安全法,可以在如下几个方面,进行落地:一是加强数据安全治理,制定数据安全有关制度规范,技术部门和业务部门、风险管理部门、审计部门“三道防线”各司其职,联防联控,共同推进落实数据安全管理。二是构建数据安全纵深防御体系,在传统网络安全防护的基础上,强化一体化运维安全建设和漏洞处置能力,部署沙箱、云桌面、数据脱敏和防泄漏、态势感知等安全产品;同时,加强应 8 用安全防护,将数据安全要求嵌入业务需求和系统建设各个环节,通过系统固化业务流程,利用认证、校验、加密、脱敏、屏蔽、访问控制、备份恢复、安全审计等措施,从源头上加强保护。三是17、强化数据使用安全,通过优化业务流程,进一步规范员工合规操作;通过推进数据分类分级,强化数据精细化管理;通过建设数据实验室、搭建大数据门户、统一外部数据管理等措施,保障数据安全使用;通过开展舆情监测、强化敏感数据监测、组织外包检查等措施,防范供应链安全风险。四是引导数据安全文化建设。一方面,组织开展消费者权益保护、安全保密、个人金融信息安全等方面的培训,开展案例警示教育,营造安全合规氛围;另一方面,利用网点、网站、社区等多种渠道,持续宣传数据安全与个人金融信息保护内容,增强公众安全意识。五是加强审计监督,组织开展年度信息科技风险检查、评估与审计,将网络数据与个人金融信息安全作为工作重点,加大问题18、整改和处罚力度,坚持零容忍态度,对违规行为进行严肃处理。(3)政策影响 数据安全法的出台,对金融机构在数据安全、个人金融信息保护上提出了新要求:第一,对“数据”范围作出界定,既包括“网络数据”,又包括以纸质等其他形式记载的“信息”,将其统一纳入数据安全法的规制,有利于法律执行的统一性,也符合数字经济时代下的网 9 络安全要求。第二,构建国家数据安全基本制度,覆盖数据全生命周期,重点明确了数据分类分级及重要数据保护目录、数据安全风险评估、数据安全审查、数据出口管制和域外管理等方面的要求。第三,规定了数据安全保护义务,要求重要数据的处理者应当明确数据安全负责人和管理机构,落实数据安全保护责任,涵盖19、数据收集、存储、使用、加工、传输、提供、公开等处理过程,并强化了国家核心数据和重要数据的保护要求和法律责任。第四,提出数据交易安全要求,明确数据交易中介服务机构的主要义务、数据交易的原则性要求和政务数据开放规定。第五,体现数据伦理内容,要求数据的开发利用应充分考虑老年人、残疾人的需求,不得对其造成障碍,充分体现了国家对特殊群体的关怀,有利于增强全民的幸福感和获得感。2.2.中共中央国务院关于构建数据基础制度更好发挥数中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见据要素作用的意见(1)政策背景 数据作为新型生产要素,具有无形性、非消耗性等特点,可以接近零成本无限复制,对传统产权、流20、通、分配、治理等制度提出新挑战,亟需构建与数字生产力发展相适应的生产关系,不断解放和发展数字生产力。按照党中央、国务院决策部署,国家发展改革委牵头研究起草“数据二十条”,组建跨学科专家队伍,赴多地深入调研,并吸纳了各方面有关意见。习近平总书记主持 10 召开中央全面深化改革委员会第二十六次会议,审议通过了“数据二十条”。“数据二十条”主旨是构建数据基础制度,保障数据要素的安全和发展。(2)政策内容“数据二十条”强调探索建立数据产权制度,推动数据产权结构性分置和有序流通,结合数据要素特性强化高质量数据要素供给。在国家数据分类分级保护制度下,建立公共数据、企业数据、个人数据的分类分级确权授权制度和21、市场化流通交易机制,建立数据资源持有权、数据加工使用权、数据产品经营权的“三权”分置的产权运行机制,健全各参与方合法权益保护制度,推进“共同使用,共享收益”新模式。加大个人信息保护力度,推行匿名化个人数据合理使用,健全数据要素权益保护制度。在流通和交易方面,要完善和规范数据流通规则,构建促进使用和流通、场内场外相结合的交易制度体系,培育壮大场内交易;有序发展数据跨境流通和交易,建立数据来源可确认、使用范围可界定、流通过程可追溯、安全风险可防范的数据可信流通体系。在收益分配方面,要顺应数字产业化、产业数字化发展趋势,充分发挥市场在资源配置中的决定性作用,更好地发挥政府作用。完善数据要素市场化配置22、机制,扩大数据要素市场化配置范围和按价值贡献参与分配渠道。完善数据要素收益的再分配调节机制,让全体人民更好共享数字经济发展成果。11 在数据要素治理方面,要把安全贯穿数据治理全过程,构建政府、企业、社会多方协同的治理模式,创新政府治理方式,明确各方主体责任和义务,完善行业自律机制,规范市场发展秩序,形成有效市场和有为政府相结合的数据要素治理格局。在保障措施方面,要加大统筹推进力度,强化任务落实,创新政策支持,鼓励有条件的地方和行业在制度建设、技术路径、发展模式等方面先行先试,鼓励企业创新内部数据合规管理体系,不断探索完善数据基础制度。切实加强组织领导、加大政策支持力度、积极鼓励试验探索、稳步推23、进制度建设。(3)政策影响“数据二十条”指出数据基础制度建设事关国家发展和安全大局,要维护国家数据安全,保护个人信息和商业秘密,促进数据高效流通使用、赋能实体经济,统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系。这一重要论述,为我们加快构建数据基础制度体系,进一步释放数据要素价值,激活数据要素潜能指明了方向。构建数据基础制度体系,是新时代我国改革开放事业持续向纵深推进的标志性、全局性、战略性举措,有利于充分发挥数据要素作用,赋能实体经济,推动高质量发展;有利于做强做优做大数字经济,应对科技革命和产业变革,构筑国际竞争新优势;有利于统筹分配效率与公平,推动全民共享数字经24、济发展红利,促进实现共同富裕;有利于提高数据要素治理效能,助力国家治 12 理体系和治理能力现代化。3.3.金融科技发展规划(金融科技发展规划(20222025 年)年)(1)政策背景 在金融科技(FinTech)发展规划(20192021 年)引领下,我国金融科技发展取得举世瞩目的成就,已成为金融数字化转型的核心驱动力,在深化金融供给侧结构性改革、增强金融服务实体经济能力等方面发挥重要作用。人民银行认真贯彻落实党中央、国务院决策部署,从战略全局不断加强顶层设计和统筹规划,接续出台金融科技发展规划(20222025 年),提出新时期金融科技发展指导意见,明确金融数字化转型的总体思路、发展目标、25、重点任务和实施保障,为新时期金融数字化转型谋定方向、明晰路径。(2)政策内容 金融科技发展规划(20222025 年)明确了金融数字化转型总体思路、目标方向和实施路径,系统提出 8 大类 28 项重点任务,勾勒“十四五”时期金融科技发展蓝图。金融机构要以规划为引领,着力在补短板、强弱项、固底板、扬优势上下功夫,重点做好五方面工作。充分激活金融数据要素潜能。充分激活金融数据要素潜能。一是加强数据治理。建立健全协调一致、涵盖全生命周期的数据治理体系,统一数据编码规则和接口规范,编制企业级数据字典和数据资源目录,做好数据分级分类。二是深化融合应用。建立多元化数据共享和权属判定机 13 制,搭建企业级26、数据交换技术通道,综合运用隐私计算、联合建模、差分隐私等技术对海量多样化多维度数据资源进行价值挖掘和关联分析。三是做好信息保护。严格落实数据安全保护法律法规与标准规范,建立健全数据全生命周期安全管理机制,运用匿踪查询、去标记化、可信执行环境、随机化等手段严防数据逆向追踪、隐私泄露、数据篡改与不当使用,切实保护数据主体合法权益不受侵害。着力打造数字化经营新动能。着力打造数字化经营新动能。在战略部署方面,建立健全企业级数字化转型组织架构和治理机制,通过数字化能力成熟度评价等方式科学衡量转型质效,构建涵盖规划、生产、管理等职能的特色化发展矩阵。在敏捷创新方面,探索数字化工厂、创新实验室等创新模式,建27、立技术与业务高效联动、前中后台密切协作、决策与执行高度统一的创新协同网络。在中台建设方面,采用低耦合、高内聚架构搭建便捷易用的技术中台,构建集成数据整合、提纯加工、建模分析、质量管控、可视交互等功能的综合型数据中台。在业务赋能方面,运用知识图谱、机器人流程自动化等技术构建环节无缝衔接、信息实时交互、资源协同高效的运营模式,构建覆盖用户全生命周期、业务全流程的数字化经营能力。不断深化关键核心技术应用。不断深化关键核心技术应用。一是加强核心技术应用攻关,聚焦金融科技应用前沿问题和主要瓶颈,通过行业组织、孵化平台、专项合作等方式加大关键软硬件技术金融应用的前瞻性与战略性研究攻关。二是切实保障供应链稳28、定可靠。强化关键核心技术标准符合性和安全性把关,确保技术路径与自身需求高度匹 14 配。三是构建开放创新产业生态。以金融机构为主体,广泛联合高等院校、科研院所、高新技术企业等搭建金融科技产用对接平台,加强共性技术、资源和服务的开放合作、互惠共享,推动技术共研、场景共建、标准共商、成果共用、知识产权共享。加快推动金融服务智慧再造。加快推动金融服务智慧再造。在惠民方面,运用 5G、虚拟现实、智能物联网(AIoT)等技术推动实体网点智慧升级与线上服务渠道迭代优化,深化跨界合作、消除渠道壁垒,不断扩展金融在公共缴费、社保服务、医疗保障、交通出行等领域的应用场景。在利企方面,有序推动跨领域、跨地域信用信29、息互联互通和归集共享,打通金融机构与实体企业融资对接的数字通道,在绿色金融、农业金融、供应链金融、小微金融、科创金融等领域打造精细化、定制化数字信贷产品。切实加强金融科技审慎监管。切实加强金融科技审慎监管。一是强化金融科技创新行为监管。加快出台符合国情、国际接轨的金融科技伦理制度规则,不断扩大金融科技创新监管工具应用的广度与深度。二是筑牢金融与科技风险防火墙。健全智能算法管理规则,加强算法备案管理、安全评估和运行监测,着力提升算法可解释性、透明性、公平性和安全性。三是加快数字化监管能力建设。深化监管科技在金融市场、支付结算、征信、消费者保护等领域的应用,打造权威专业化风控基础设施。(3)政策影30、响 金融科技发展规划明确了治理体系、数据要素、基础设 15 施、核心技术、激活动能、智慧再造、审慎监管、发展基础等八个方面的目标;并在试点示范、支撑保障、监测评估、营造环境、组织统筹等五个方面提出要求。金融机构需要做好整体规划,完善相关的配套细则,推动金融科技深度应用,加快全方位数字化转型。在发展金融科技的过程中,金融机构需要着重关注数据风险管理、模型风险管理、场景风险管理,在风险可控的前提下创造价值。除此之外,金融机构还要强化人才培养,完善培养机制、确立培养目标,来应对金融科技未来的挑战。(二)(二)标准引导标准引导 1.1.金融数据安全金融数据安全 数据生命周期安全规范数据生命周期安全规范31、(1)标准背景 随着大数据、人工智能、云计算等新技术在金融行业深入应用,金融数据逐步实现从信息化资产到生产要素的转变,其蕴含的极高的商业价值和重要性日益凸显。同时,数据泄露、滥用、篡改等安全威胁的影响也在不断增加,逐步从机构内转移扩大至机构间和行业间,甚至影响国家安全、社会秩序、公众利益和金融市场稳定。如何在满足金融业务基本需求的基础上,强化数据保护能力,保障金融数据安全流动,已成为当前亟待解决的问题。金融数据复杂多样,对数据实施生命周期安全管理,能够进一步明确数据生命周期各阶段的保护要求,有助于金融业机构合理分配数据保护资源和成本,建立完善的数据生命周期防护机 16 制。为指导金融业机构合理32、制定和有效落实数据生命周期安全管理策略,进一步提升金融业机构的数据管理和安全防护水平,确保金融数据安全应用,2021 年 4 月,中国人民银行发布并实施JR/T 02232021金融数据安全 数据生命周期安全规范。(2)标准内容 金融数据安全 数据生命周期安全规范规定了金融数据生命周期安全原则、防护要求、组织保障要求以及信息系统运维保障要求,建立了覆盖数据采集、传输、存储、使用、删除及销毁过程的安全框架,适用于指导金融业机构开展电子数据安全防护工作,并为第三方测评机构开展数据安全检查与评估工作提供参考。图 1 数据生命周期安全框架 金融数据安全 数据生命周期安全规范建立的安全框架 17 如图 33、1 所示。首先,为防范和抵御金融数据安全风险,要求金融业机构在开展业务和日常经营管理过程中,遵循以下数据安全基本原则:合法正当原则、目的明确原则、选择同意原则、最小够用原则、全程可控原则、动态控制原则以及权责一致原则。数据安全分级是建立完善的数据生命周期安全防护体系的基础,对机构的数据资产进行全面梳理,按照 JR/T 01972020相关要求,根据数据安全性遭到破坏后的影响范围和影响程度,将金融数据安全级别从高到低划分为 5 级、4 级、3 级、2 级、1级。数据生命周期包括数据采集、传输、存储、使用、删除和销毁等环节,金融数据安全 数据生命周期安全规范针对各个环节,依据不同数据安全级别的安全34、保护需求,对数据安全防护做出了详细的规定。在金融业机构数据安全防护实践中,各个环节均有其侧重的关键技术。在数据采集环节,数据源的真实性至关重要,需根据采集的数据安全级别,采用不同的技术措施如口令密码、设备指纹、数字签名等对数据源进行鉴别和认证;在数据传输环节,存在着数据传输中断、篡改、伪造及窃取等安全风险,需根据不同的数据传输模式和数据安全级别,采用相应的技术措施如加密传输、身份认证、可信物理信道和通信协议约定等加强传输过程中的安全防护;在数据存储环节,为应对数据泄露、篡改、丢失、不可用等安全风险,数据加密、权限控制和备份恢复是保障数据安全的重要手段;数据使用环节包括数据的访问、导出、加工、展35、示、开发测试、汇聚融合、公开披露、数据转让、18 委托处理、数据共享等活动,这些过程中存在着数据非授权访问、窃取、泄漏、篡改、损毁等安全风险,需采用访问控制、身份认证、数据脱敏、数据加密、多方安全计算以及跟踪溯源等技术保障数据安全;在数据生命周期的结尾,通过数据清理和数据介质销毁形成闭环。最后,金融数据安全 数据生命周期安全规范对数据安全组织保障和信息系统运维保障进行了详细规定,如要求金融业机构建立健全包括决策层、管理层、执行层以及监督层的数据安全管理体系,加强在边界管控、访问控制、安全监测、安全审计、检查评估、应急响应与事件处置等过程中的数据安全风险防控能力等,构成了数据生命周期安全防护机制36、能够有效落实和严格执行的基石。(3)标准影响 一方面,金融数据安全 数据生命周期安全规范为金融业机构开展金融数据生命周期安全防护提供了具体实施指导,其发布推动金融业机构逐步落实金融业数据安全管理要求,提升金融业数据安全保护工作的规范化和标准化程度,为金融业机构有效防范数据安全风险及应对数据安全事件提供科学依据和指导,为金融数据的应用和流动提供有力保障。另一方面,金融数据安全 数据生命周期安全规范的发布能够促进金融科技的安全发展,明确了整个金融数据生命周期的安全要求,使金融业机构在数据安全治理方面的需求得到快速 19 提升,从而推动一系列安全技术的发展。近年来,以多方安全计算、可信执行环境、联邦37、学习等为代表的隐私计算技术为数据交换共享过程中数据的“可用不可见”提供了解决方案,并已在金融、政务、医疗等领域开始推广应用。另外,一些传统技术如数据脱敏、基于角色的数据授权方式等也在效率和适用性等方面面临着升级压力,从而催生出敏感信息自动识别、动态鉴权等新技术,为金融数据提供更加有力的安全保障。2.2.金融数据安全金融数据安全 数据安全分级指南数据安全分级指南(1)标准背景 为落实中共中央、国务院加强数据资源整合和安全保护相关工作要求,指导金融业机构合理开展金融数据安全定级工作,有效落实金融数据生命周期全过程安全管理策略,进一步提高金融业数据管理和安全防护水平,确保金融数据的安全应用。202038、年 9 月,中国人民银行发布金融数据安全 数据安全分级指南(JR/T01972020)金融行业标准(以下简称“分级标准”),有助于金融业机构明确金融数据保护对象,合理分配数据保护资源和成本,是金融机构建立完善的金融数据生命周期安全框架的基础,能够进一步促进金融数据在机构间、行业间的安全流动,有利于金融数据价值的充分释放和深度利用。(2)标准内容 a.分级分类管理细则制度出台 为规范管理和使用数据,保障数据安全,参考“分级标准”20 中给出的金融数据安全分级的目标、原则和范围,数据安全定级的要素、规则和定级过程,以及金融业机构典型数据定级规则,并基于单位的实际组织机构和业务情况等,制定并发布自己39、的分级分类管理细则,对组织与职责、分级分类规则、分级分类流程、分级分类新增与修订等做出管理说明。b.分级分类台账形成 根据数据分级分类细则,形成数据分级分类台账。台账主要依据数据的重要程度以及数据发生丢失、泄露、被篡改、被毁损事件的影响范围和程度将数据划分为 5、4、3、2、1 共五个安全级别。定级规则。定级规则。5 级数据:涉及国家秘密的数据,依据国家和中国人民银行涉密相关标准和规定执行;4 级数据:一旦丢失、泄露、被篡改、被毁损会对金融市场稳定、上级单位业务造成严重影响的数据,在非涉密数据中安全控制等级最高;3 级数据:一旦丢失、泄露、被篡改、被毁损会对社会公众、单位本身、单位客户利益造成40、影响的数据,应实施较强安全控制;2 级数据:一旦批量丢失、泄露、被篡改、被毁损会对社会公众、单位本身、单位客户利益造成影响的数据,执行基本的安全控制;1 级数据:批量丢失、泄露、被篡改、被毁损,不会对社会公众、单位本身、单位客户利益造成影响的数据,对安全控制不作要求。定级考虑因素。定级考虑因素。一是从数据应用场景初步梳理数据使用概要情况,根据概要情况,初步判断数据安全级别。比如可以广泛公开的数据定为 1 级,可以公司范围内公开或者不宜广泛公开的定 21 为 2 级,仅针对特定人员公开的定为 3 级。二是参照“分级标准”中的数据安全级别,将涉及单位核心业务相关数据内容安全级别设置为对应的级别。三41、是分析各项业务内容发生数据丢失、泄露对市场、客户、单位的影响范围与影响程度。并综合平衡业务开展实际情况,对数据进行定级。定级步骤。定级步骤。一是数据资产盘点,对相关业务数据进行盘点、梳理与分类,形成统一的数据资产清单。二是参考统一数据资产清单,根据数据业务属性和特征进行数据分类,形成多级数据目录,便于后续台账使用查找和管理。三是按照业务条线、业务环节、业务形态和业务数据可公开范围,划分数据类别并按照类别设置默认的数据安全级别。四是参照“分级标准”中的“金融业机构典型数据定级规则参考表”调整数据安全级别。五是其余数据内容综合数据影响范围和影响程度分析判断数据安全级别,形成台账初稿。最后,综合业务42、部门对台账初稿意见完善数据分类和级别,形成待评审稿。(3)标准影响 在数据发展成为重要生产资源的当下,数据处理活动日益复杂,数据处理涉及的主体和环节越发多样化,企业内部数据可能存在各种被泄露、滥用、篡改的安全风险。对数据进行分类分级保护,有利于企业对其持有的数据“摸家底”,对不同重要和敏感程度的数据采取不同的管控和保护措施,建立、完善数据风险管理内部流程,对企业控制、处理的数据按照分类分级结 22 果采取适当的安全措施。除此之外,实施数据分类分级保护亦有助于企业应对各类业务场景下的网络安全与数据合规义务。3.3.金融业数据能力建设指引金融业数据能力建设指引(1)标准背景 数字技术的快速发展和新43、冠疫情的全球肆虐深刻改变了经济发展、社会治理和个人生活的方方面面,全球经济逐步由工业经济向数字经济转型,“十三五”以来,我国高度重视数字经济发展,先后出台一系列政策文件,以促进传统经济与数字经济深度融合,实现数字化转型。为做好金融业数据安全防护,充分释放金融业数据要素潜能,推动金融行业数据规范共享和综合应用,中国人民银行组织编制并发布了金融业数据能力建设指引,进一步明确了金融业数据能力建设遵循用户授权、安全合规、分类施策、最小够用等五大基本原则,同时也为金融机构开展数据工作指明方向、提供依据。通过数据能力建设提升金融数据的规范性和科学性,释放数据生产力,充分激活数据资产潜能,自上而下推动金融业44、数字化转型。(2)标准内容 a.具体内容 金融业数据能力建设指引规定了数据战略、数据治理、数据架构、数据规范、数据保护、数据质量、数据应用、数据生存周期管理能力域划分,明确了相关能力项,提出了每个能力项的建设目标和思路。金融业数据能力建设指引能力域主要分 23 为以下八个方面:一是数据战略,包括数据战略规划、数据战略实施、数据战略评估三个能力项。数据战略规划是基于金融机构对数据的需求,经相关方充分协商达成一致后拆解出可评估、可衡量、可操作的目标,最终形成数据战略内容的过程。数据战略具有一定前瞻性和统领性,内容覆盖数据管理工作愿景、目标、原则、任务、路径等要素,做到内容全面、目标合理、范围明确、45、路径清晰,可操作性强,能够指导未来一段时间有效开展数据管理工作。数据战略实施是按照既定目标和路线持续执行数据战略工作任务的过程,做好工作任务责任分解和措施保障,强化过程监督管理,确保达成预期目标。数据战略评估是在数据战略实施期间和实施后,对照目标和实施情况全面综合评价数据战略实施的效果,并进行闭环反馈。二是数据治理,包括组织建设、制度建设、流程规范、技术支撑四个能力项。组织建设包括组织架构、岗位设置、团队建设、数据责任等内容,是各项数据职能工作开展的基础。其目标是对数据管理和应用进行职责规划与控制,指导各项数据职能的执行,以确保有效落实数据战略目标。制度建设是数据管理和数据应用各项工作有序开展46、的基础,是数据治理的依据。制度建设分层次设计,遵循严格的发布流程,并定期检查和更新。技术支撑是指为开展数据治理工作而建设的相关系统或平台。三是数据架构,包括元数据管理、数据模型、数据分布、数据集成四个能力项。元数据管理是关于元数据的创建、存储、整 24 合、控制等一整套流程的集合。数据模型使用结构化的语言将收集到的业务经营、管理和决策中使用的数据需求进行综合分析,并按照模型设计规范将数据需求重新组织。数据模型分为企业级数据模型和系统应用级数据模型。企业级数据模型包括主题域模型、概念模型和逻辑模型,系统应用级数据模型包括逻辑模型和物理模型。四是数据规范,包括数据元、参考数据和主数据、明细数据、指47、标数据四个能力项。数据元是由一组属性规定其定义、标识、表示和允许值的数据单元。通过制定核心数据元的统一规范,提升数据相关方对数据理解的一致性。参考数据是一组增强数据可读性、可维护性、可理解性的数据集合。借助参考数据可实现对其他数据的合理分类。主数据是企业中需要跨系统、跨部门共享的核心业务实体数据。主数据管理是对主数据规范和内容进行管理,实现主数据跨系统、跨部门的一致、共享使用。明细数据是日常生产经营等活动中直接产生或获取的未经任何加工的初始数据。指标数据是在经营分析过程中衡量某一个目标或事物的数据,由明细数据按照统计需求和分析规则加工生成,一般由管理属性、业务属性、技术属性等组成。五是数据保护48、,包括数据保护策略、数据保护管理、数据保护审计三个能力项。数据保护策略是数据保护的核心内容,在制定的过程中结合企业管理需求、行业监管要求以及相关制度规范等统一制定。数据保护管理是通过开展数据保护等级划分、数据访问权限控制、用户身份认证和访问行为监控、数据安全风险防 25 护、数据隐私保护等管理工作,满足数据保护的业务需求和监管要求,实现对数据生存周期的安全管理。数据保护审计是一项控制活动,负责定期分析、验证、讨论、改进数据保护管理相关的策略、规范和活动。审计工作可由企业内部或外部审计人员执行,并且审计人员独立于审计所涉及的数据和流程。六是数据质量,包括数据质量需求、数据质量检查、数据质量分析、49、数据质量提升四个能力项。数据质量需求是根据业务、数据需要制定的一种衡量数据质量的规则,是度量和管理数据质量的依据,包括技术指标、业务指标以及相应的校验方法。数据质量需求符合相关规范,依据数据管理目标、业务管理需求和行业监管要求统一制定和管理。数据质量检查是根据数据质量规则中的技术指标、业务指标、校验方法等对数据质量进行有效监控、发现问题并及时反馈的一种方法。数据质量分析作为数据质量提升的参考依据,通过对检查过程中发现的数据质量问题及相关信息进行分析,找出影响数据质量的原因,并定义数据质量问题的优先级。数据质量提升针对数据质量分析结果,制定实施数据质量改进和数据问题预防方案,确保数据质量改进工作50、有效落实。七是数据应用,包括数据分析、数据交换、数据服务三个能力项。数据分析是对企业各项经营管理活动提供数据决策支持而进行的数据挖掘、建模、成果交付推广等活动,有助于促进业务发展。数据交换是指数据在企业内外部的流转交互,包括按一定策略引入外部数据供内部应用以及有选择地对外提供企业内部数据等。数据交换的主要目的是通过及时高效获取外部数据和安 26 全合规分享内部数据,从而更好地发挥数据价值。开展数据交换需建立明确的交换目录和策略,并做好交换合作方的管理。数据服务是通过对企业内外部数据的统一加工和分析,结合公众、行业和企业的需要,以数据分析结果的形式提供服务。数据服务一般需经过需求分析、服务开发、51、服务部署、服务监控、用户管理等过程。八是数据生存周期管理,包括数据需求管理、数据开发管理、数据维护管理、历史数据管理四个能力项。数据需求是指企业在业务运营、经营分析和战略决策过程中产生和使用数据的分类、含义、分布和流转相关要求的描述。数据开发是指设计实施数据解决方案、提供数据服务并持续满足企业数据需求的过程。数据解决方案包括数据结构设计、采集存储、整合交换、挖掘探索、可视化(报表、用户视图)等内容。数据维护是指数据服务上线投入运营后,对数据采集、数据处理、数据存储等日常的运行维护,保证数据正常服务的过程。历史数据管理是指根据法律法规、行业监管要求,以及业务、技术等方面的需求对历史数据进行归档、52、迁移、销毁等。b.落地原则 对标金融业数据能力建设指引要求,金融机构应遵循以下基本原则开展金融数据能力建设:用户授权。明确告知用户数据采集和使用的目的、方式以及范围,确保用户充分知情,获取用户自愿授权后方可采集使用,严格保障用户知情权和自主选择权。27 安全合规。遵循国家法律法规、管理制度,符合国家及金融行业标准规范,建立健全数据安全管理长效机制和防护措施,通过技术手段将原始信息脱敏,并与关联性较高的敏感信息进行安全隔离、分散存储,严控访问权限,严防数据泄露、篡改、损毁与不当使用,依法依规保护数据主体隐私权在数据管理与应用过程中不受侵害。分类施策。综合考量国家安全、公众权益、个人隐私和企业合法53、利益等因素,根据数据的保密性、完整性、可用性等属性受到破坏后的影响对象和影响程度,对数据进行分级分类管理。对不同级别数据进行分类施策,采取差异化控制措施,实现数据精细化管理。最小够用。规范数据使用行为,严控数据获取和应用范围,确保数据专事专用、最小够用,杜绝过度采集、误用、滥用数据,切实保障数据主体的数据所有权和使用权。可用不可见。建立数据规范共享机制,在保障原始数据可用不可见的前提下规范开展数据共享与融合应用,保证跨行业、跨机构的数据使用合规、范围可控,有效保护数据隐私安全,确保数据所有权不因共享应用而发生让渡。(3)标准影响 金融业数据能力建设指引 明确了金融业数据能力建设要遵循的 5 大54、基本原则和金融业数据工作的相关能力域和对应的能力项,提出了每个能力项的建设目标和思路。在数据战略方面,28 金融业数据能力建设指引 明确了从战略规划到实施再到评估的建设过程,数据战略内容覆盖数据管理的工作愿景、目标、原则、任务等要素,能够指导未来一段时间有效开展数据治理工作。在数据治理方面,综合考量国家安全、公众权益、个人隐私和企业合法利益等因素,根据保密性、完整性、可用性等属性对数据进行分级分类管理,对不同级别数据进行分类施策,采取差异化控制措施,实现数据精细化管理。金融业数据能力建设指引 的制定为金融机构开展数据工作指明方向、提供依据,引导金融机构加强数据战略规划、着力做好数据治理、强化数55、据安全保护、推动数据融合应用,充分释放数据要素价值,为金融机构加快数字化转型发展夯实数据基础,打造适应数字经济时代发展的金融核心竞争力。另外,金融业数据能力建设指引 的出台也有助于引导金融机构深挖数据要素潜能,全面提升数据管理和应用水平,切实将数据规划好、治理好、应用好、保护好。29 三、发展现状 本章从数据要素流通、数据资产管理、数据治理、数据流通技术、数据运营体系等角度对数据应用发展现状进行详细介绍。(一)(一)数据治理数据治理 1.1.数据治理现状数据治理现状 根据金融行业信息化发展的现状,结合当今数据治理的要求,金融机构现阶段数据管理方面存在以下的不足:(1)多系统分散建设,没有规范统56、一的数据标准和数据模型。金融机构的各个业务部门为满足业务的需求,各自建立独立的信息系统。各部门站在自身的立场使用和管理数据,从不同的角度关注数据,使得同类型数据分散在不同的信息系统中,数据口径不统一,逻辑不一致。缺少一个从全局视角对数据进行管理的需求,缺乏统一的数据规划、可信的数据来源和数据标准。从而导致数据不规范、不一致、冗余、无法共享等问题出现。(2)缺少统一的主数据。金融机构核心系统主要信息并不是存储在一个独立的系统中,或者不是通过统一的业务管理流程在系统间维护。缺乏对主数据的管理,就无法保障主数据在整个业务范围内保持一致、完整和可控,导致业务数据正确性无法得到保障。30(3)缺乏完善、57、统一的数据质量管理体系。目前的数据质量管理主要由各部门分头进行,跨部门的数据质量沟通机制不完善,缺乏清晰的跨部门的数据质量管控规范与标准。很多金融机构数据的产生、使用、维护、备份、销毁的数据生命周期管理规范和流程还不完善,非结构化数据未纳入管理范畴。组织机构的数据考核体系也尚未建立,无法保障数据质量管理标准和规程的有效执行。2.2.数据治理核心领域数据治理核心领域 数据治理领域包括但不限于以下内容:元数据管理、数据模型、数据标准、数据分类分级、数据质量管理、数据生命周期管理、数据分布和存储、数据交换以及数据安全。(1)元数据管理 元数据管理是语义工具,其重要性在于能够为数据治理建立一套数据资料58、库,存储治理范围内的数据定义、负责人、来源、转换关系、目标、质量等级、依赖关系、安全权限等。这些信息对于商业整合、数据质量、可审计性等数据治理目标的实现至关重要。元数据管理是实施数据治理的核心技术,有效的元数据管理将为数据质量、数据集成等技术的实施,以及数据治理目标的最终实现奠定坚实的基础。(2)数据模型 数据模型包括概念模型、逻辑数据模型和物理数据模型,是 31 数据治理的关键、重点。数据模型必须在设计过程中保持统一的业务定义。为满足将来不同的应用分析需要,逻辑数据模型的设计应支持最小粒度的详细数据的存储,以应对各种可能的分析查询,同时保障逻辑数据模型能够最大程度上减少冗余,保障数据结构具有59、足够的灵活性和扩展性。(3)数据标准 数据标准是金融机构建立的一套符合自身实际,涵盖定义、操作、应用多层次数据的标准化体系。包括基础标准和指标标准(或应用标准),与数据治理其他核心领域具有一定的交叉,比如元数据标准、数据交换和传输标准、数据质量标准等。商业银行的数据标准一般以业界的标准为基础,如国家标准、相关部委制定的标准,结合商业银行本身的实际情况对数据进行规范化,一般会包括格式、编码规则、字典值等内容。良好的数据标准有助于商业银行数据的共享、交互和应用,可以减少不同系统间数据转换的工作。(4)数据分类分级 不同敏感级别、重要性级别的数据,需要采取不同的保护措施,在数据汇集、传输、存储、加工60、等各环节均有不同要求,因此对数据资源目录进行梳理,并根据国家和各领域的管理要求进行分类分级,是保障数据安全的前提条件。(5)数据质量管理 数据质量管理已经成为银行数据治理的有机组成部分。高质 32 量的数据是商业银行进行分析决策、业务发展规划的重要基础,只有建立完整的数据质量体系,才能有效提升银行数据整体质量,从而更好地为客户服务,提供更为精准的决策分析基础。数据质量问题会发生在各个阶段,因此需要明确各个阶段的数据质量管理流程。从技术层面上,首先要完整、全面地定义数据质量的评估维度,包括完整性、时效性等。在系统建设的各个阶段都应该根据标准进行数据质量检测和规范,及时治理不合规的部分,避免事后的61、清洗工作。(6)数据生命周期管理 数据生命周期管理一般包括数据生成及传输、数据存储、数据处理及应用、数据销毁四个方面。数据要按照数据质量标准和发展需要产生,在数据产生阶段需要保证数据的准确性和完整性。在数据传输阶段需要考虑保密性和完整性,对不同类型的数据采取不同的措施防止数据泄露或者被篡改。在数据存储阶段除了关注保密性、完整性外,还有数据的可用性。为了降低存储成本,可以实行分级存储策略。分级存储就是根据数据的重要性、访问频次等指标将数据存储在不同性能的存储设备上。在数据处理及应用阶段,为了保证过程数据的安全性,一般采用联机处理。在数据销毁阶段,主要涉及数据的保密性。应该明确数据销毁流程,对数据62、销毁的过程有完整的记录,确保进行可靠销毁。33(7)数据分布和存储 数据分布和存储主要涵盖了数据如何划分和存储、总行系统以及总分行数据如何分布、主数据及参考数据(也称为副本数据或者辅数据)如何管理。只有对数据进行合理的分布和存储,才能有效地提高数据的共享程度,才能尽可能地减少数据冗余带来的存储成本。(8)数据交换 数据交换是银行进行数据交互和共享的基础,合理的数据交换体系有助于银行提高数据共享程度和数据流转时效。一般商业银行会对系统间数据的交换规则制定一些原则,比如对接口、文件的命名、内容进行明确,规范系统间、银行系统与外部机构间的数据交换规则,指导数据交换工作有序进行。建立统一的数据交换系统63、,一方面可以提高数据共享的时效性,另一方面也可以精确掌握数据的流向。(9)数据安全 数据安全管理的主要目的是解决数据在保存、使用和交换过程中的安全问题。主要体现在以下六个方面:一是数据使用的安全性,包括基础数据的保存、访问和权限管理;二是数据隐私问题,系统中采集的证件号码、银行账号等信息在下游分析系统和内部管理系统中,是否要进行加密,以避免数据被非法访问;34 三是访问权限统一管理,包括单点登录问题及用户名、数据和应用的访问授权统一管理;四是数据安全审计,为数据修改、使用等环节设置审计方法,事后进行审计和责任追究;五是制度及流程建立,逐步建立数据安全性的管理办法、系统开发规范、数据隐私管理办法64、及相应的应用系统规范、在管理决策和分析类系统中的审计管理办法等;六是应用系统权限的访问控制,建立集团级权限管理系统,增加数字水印等技术在应用系统中的使用。(二)(二)数据资产管理数据资产管理 1.1.数据资产管理概述数据资产管理概述 良好的数据资产管理是释放数据要素价值的基础。数据资产管理包含数据资源化、数据资产化两个过程。数据资源化通过将原始数据转变成数据资源,使数据具备一定的潜在价值,是数据资产化的必要前提。数据资源化以提升数据质量、保障数据安全为工作目标,确保数据的准确性、一致性、时效性和完整性,推动数据内外部流通。数据资源化包括数据模型管理、数据标准管理、数据质量管理、数据安全管理、数65、据开发管理等活动职能。数据资产化通过将数据资源转变为数据资产,使数据资源的潜在价值得以充分释放。数据资产化以扩大数据资产的应用范围、厘清数据资产的成本与效益为工作重点,并使数据供给端与数据消费端之间形成良性反馈闭环。数据资产化主要包括数据资 35 产流通、数据资产运营、数据价值评估等活动职能。2.2.数据资产管理现状数据资产管理现状 我国数据资产管理能力整体处于发展初期。数据能力成熟度评估模型(Data Management Capability Maturity Assessment Model,简称 DCMM)是我国在数据管理领域正式发布的国家标准(GB/T 360732018),旨在帮助66、企业利用先进的数据管理理念和方法,建立和评价自身数据管理能力。中国电子信息行业联合会通过计算历年来评估企业的 DCMM 能力分布,大部分贯标企业的数据管理能力均在二级(受管理级)及以下水平,占全部贯标企业的 80.1%;三级(稳健级)占总量的 15.6%,四级及以上(量化级和优化级)不足 5%。其次,行业间数据资产管理能力差异分布显著。根据中国信通院 2023 年 1 月发布的数据资产管理实践白皮书 6.0 版,软件和信息技术业、工业和制造业、医疗行业、教育行业等传统行业仍处于初级阶段,数据资产管理处于大数据平台建设阶段,主要针对核心业务开展数据标准化、数据质量管控等工作。而金融行业、互联网行67、业、通信行业、电力、零售等行业较早享受到了“数据红利”,持续推进业务线上化,开展数据分析和数据服务。资产管理实践案例可参考附录案例 11-15。36 3.3.数据产品与服务数据产品与服务 随着企业数字化进程发展,数据资产管理不再局限于数据资源本身,对数据进行加工后的数据产品或数据服务也要加以管理。数据产品与服务是数据资产管理的重要组成部分,涵盖了从数据采集、数据处理(包括计算、分析、可视化等)、数据传输、数据存储、数据交换到数据应用的全过程。在数据资产管理中,数据产品和服务不仅负责提供高质量的数据产品,如数据分析报告、数据模型和预测算法等,而且还承担着提升数据资产价值和效率的关键任务。企业向数68、字驱动逐步迈进,Hadoop、hive 等技术也相继提出,大数据服务迎来了爆发期。与此同时,企业开始对数据的存储和分析处理有了更高的需求,为了解决这些需求,研究人员相继提出相关的数据服务。其中近几年提出了数据仓库、数据湖等新型数据平台,这些新型数据平台在企业的数据服务建设中起到了重要作用。当然数据仓库、数据湖在后继的生产使用中仍然存在问题,如数据仓库数据存储需要大量资源;数据湖缺乏结构性,一旦没有治理好,就会变成数据沼泽。为更好地挖掘数据中的价值,更好地支撑各种数据需求,研究者融合数据仓库和数据湖各自特点的新型数据平台,提出了数据湖仓。数据湖仓可以更好地挖掘数据价值,消除数据孤岛,减少数据冗余69、,降低存储成本,避免数据沼泽。近几年随着 AI 的兴起,数据湖仓一体是未来的发展趋势。37 数据服务终将成为企业下一代数据平台的方向和目标,只有让业务把数据用起来了,才能反向推动数据治理和数据标准等诸多工作。而数据治理的推进也会让数据服务化更好,让业务更好地使用数据,这其实也是企业数字化转型的重要方向和目标让数据用起来。(三)(三)数据运营数据运营 1.1.数据运营的背景数据运营的背景 数据要素化就是要将数据转化为可用于社会化大生产的资源,发挥出生产要素的作用和价值,促进数字经济和国家经济的发展。数据要素化过程中,需要经过数据资源化、数据资产化、数据资本化三个阶段。数据资源化涉及原始数据的采集70、、清洗、数据处理和数据价值识别,是数据资源形成阶段。数据资产化则是将实现数据资源价值的过程,通过数据流通将数据资源应用在合适的场景中,完成数据资源的价值传递,并体现在主体的资产核算中,成为主体资产的一部分。数据资本化阶段将进一步促进数据价值的变现,通过金融衍生品的创新,将高价值数据资产进行抵押、委托等方式,扩大数据资产价值的发掘能力,促进数据经济的活跃和发展。金融行业是数据资源密集型行业,每时每刻都在产生和应用着海量数据,面向营销、征信、业务管理进行全面的信息化、数字化管理实践,并进一步向智能化业务应用转变。然而,金融业往往是数据要素市场最大的买家,海量数据流 38 入金融业并通过金融业务体系71、实现价值变现。传统情况下,金融业的大型集团公司或企业内部之间,通过建立统一数据资产目录、实现数据的物理汇聚等方式实现金融数据的内部循环利用,以此减少数据应用成本、充分发挥数据价值。但在个保法的新规下,个人数据在没有单独同意授权的情况下不能进行跨法人主体的传递。因此,大型金融集团为了能够合理地利用数据资源,开始探索通过隐私计算的方式来建立数据统一管理体系。数据价值实现除了内循环的有效应用外,还可以通过外循环将数据资源向其他单位、其他行业进行赋能,以此实现数据价值的充分挖掘。但金融行业数据的外循环却相对匮乏,金融业沉淀的数据资源鲜少被流通出来。因此,在讨论金融业数据运营体系时,不仅要考虑金融业机构72、数据内循环运营管理方式,也需要考虑如何推动和构建数据外循环的运营实现方案,通过数据流通从数据要素市场的买方向数据要素市场的卖方转变,充分参与到数据经济的建设中,实现金融行业沉淀和积累的数据资源的价值挖掘。另一方面,金融行业自身的金融业务属性,也需要在数据经济中承担起金融服务商的使命。从服务实体产业向服务实体产业和数据产业转变,增加面向数据资产的金融服务能力,实现数据资产的资本变现模式创新。因此,金融行业数据运营,不仅需要针对数据要素本身的固有特点进行运营管理,还需要结合金融业自身的行业使命进行针 39 对性地思考,从而搭建起具有金融业特色的数据运营管理体系。2.2.金融业数据运营的现状金融业数73、据运营的现状 我国金融行业在信息化、自动化、智能化建设上,起步早、应用程度深、成熟度高、规范化好,通过技术与业务的融合,极大提高了金融服务实体经济和人民生活的效率和质量。金融行业也在持续的科技创新中,汇聚和应用了海量的数据资源,同时也沉淀和积累了丰富的行业数据。金融行业也在科技的推动下,从数字金融、网络金融向数据驱动决策的智能金融和数据开放融合方向转变,这对金融数据运营提出了全新的要求。随着金融行业数据应用程度的不断加深,金融机构汇聚的数据规模、衍生的数据资产、数据类型也在快速地增长。传统的数据治理模式在效率和效果上都难以支撑新形势下的快速发展。同时,个人信息保护法数据安全法网络安全法的整体要74、求下,金融机构在合规性建设上,也大举投入,构建个人数据采集的授权同意管理体系和基于个人用户同意的数据应用控制能力。因此,自动、智能的数据发现、数据识别、数据治理、分类分级管理能力,也成为金融机构运营管理实践的重要内容。金融行业的数据运营,还要兼顾数据内循环和数据外循环的两方面要求。内循环是在集团或企业范围内,构建统一的数据标准、数据汇聚管理能力和数据开发利用能力,面向内部全业务链实现实时、高效、联动的数据服务和应用支持。外循环,则是将自身沉淀、汇聚的数据资源,通过标准化、规范化建设形成数据 40 资产,向其他单位或行业进行赋能,寻求金融行业数据的价值变现。在这个过程中,数据价值的评估、数据资产75、的定价以及数据流通的计费管理和收益分配,成为数据价值变现的重要考量因素。通过数据流通印证数据资产的价值,为金融机构带来收益的同时,金融行业也在探索将金融赋能实体经济的业务内涵扩展到数字经济中。通过向已经存在数据采购合同的数据标的进行融资支持,金融机构通过金融产品创新有一次参与到数字经济浪潮中,探索和推动着数据资产向数据资本的转变,从数据要素化的全过程中深度探索金融行业的主体角色和能力边界,全面塑造着金融行业在新时代的崭新形象。3.3.金融业数据运营的目标金融业数据运营的目标 金融业即可作为数据要素市场的普通参与主体,又身兼数据要素市场金融服务商的天然使命,金融业数据运营的目标就需要符合金融业的76、两种核心角色要求。一方面,需要通过数据运营建立高效、统一、合规的数据价值挖掘和应用机制,建立对内流通和对外流通双循环运营管理体系,发挥数据的价值并降低数据价值实现的整体成本。另一方面需要聚焦金融行业的业务特点,从数据资本运营的角度探索金融行业数据运营的价值实现路径。41 4.4.金融业数据运营体系金融业数据运营体系(1)数据资源化阶段运营要求 数据资源化阶段是指将有含义的数据信息集聚到一定规模,形成可被使用的资源的阶段。主要包括数据采集、数据清洗、数据加工、数据存储、数据价值评估几个方面。在数据资源化阶段,数据运营管理需要解决数据的标准与合规性问题,并将数据资源进行探索挖掘,形成可被理解和使用77、的数据产品,内容涉及数据标准和制度规范、数据质量、数据分类分级、数据资源目录、数据开发利用、成本管理和数据价值评估等。总体上来看,数据资产价值评估需要从多维度上进行统一考虑和周期性监测,以此建立数据资源价值的持续评估能力。(2)数据资产化阶段运营要求 数据资产管理白皮书(4.0)将数据资产定义为“由企业拥有或控制的,能够为企业带来未来经济利益的,以物理或电子的方式记录的数据资源,如文件资料、电子数据等”。根据该定义,数据资源可以为企业或单位带来价值的情况下,才会变成数据资产。也就是说,数据资产诞生于数据资源的变现环节中,通过交换、交易等方式为企业或单位产生收益的数据资源,就变成了数据资产。因此78、,数据资产化阶段运营的核心是实现数据资源的变现。1)数据定价 数据资源变现离不开数据要素市场,市场化要素配置是数据 42 经济的基础规则。结合数据资源的价值,结合市场配置资源的机制,按照“市场评价贡献、按贡献决定报酬”的价格生成机制,根据市场供求关系最终形成数据资产的市场化价格。但由于数据资源的特殊性,数据资源的价值贡献难以事先获得、数据交易双方对数据价值的判定存在信息不对称等情况,使得数据资源的定价复杂程度大幅提升。目前市场主流的数据定价依赖真实性、收益最大化、公平、无套利、隐私保护和计算效率的六大基本原则。而定价方法则集中于预定价、固定定价、拍卖定价、实时定价、协议定价和免费增值六类。针对79、大规模数据要素流通的市场定价,黄倩倩等人也提出了基于“报价-估价-议价”相结合的数据交易价格生成路径。2)数据商品目录 数据商品目录有别于数据资源目录,是针对已经具备数据资产化条件的数据产品的统一管理清单。数据商品目录包含数据资源化阶段的部分内容,比如元数据信息,还要包括数据权属、数据产品合规要求、数据价格、数据面向场景的行业贡献情况、数据交付要求等面向数据变现过程中的其他信息。数据商品目录集中呈现了某一数据流通平台范围内具备对外提供的数据资产范围。3)场景撮合 数据资产的运营即利用最小的成本和资源,将数据资产服务在最有价值的地方。其中,寻找合适的地方分为两部分,其一就 43 是数据资产的场景80、挖掘,另一部分,则是场景下需求主体的开拓和管理。数据资产在不同的场景中,能够发挥的价值亦不相同,主要表现在数据资产对特定场景的影响程度不一样。且由于行业差异、市场主体差异、目前客户群体差异等多维度因素的影响,这种数据资产的影响程度呈现出复杂的变化。另一方面,由于不同场景中,场景背后的价值不同,需求方对于数据资产的采购意愿也存在差异。因此,面向数据要素市场,纷繁复杂的行业形态,挖掘适宜场景,推动数据要素流通,是数据资产化阶段运营的关键任务。4)主体管理 寻找到合适的场景,下一步就是围绕场景拓展有需求的客户。客户的来源可能存在多种情况,包括直接挖掘客户、代理人引入客户、集采分销引入客户等等。不同客81、户来源也带来了不同市场参与主体。因而数据资产的有序流通,需要能够面向数据要素市场的多角色、多主体提供全面支持。5)数据交付 数据资产化阶段核心任务是实现数据资源的变现。数据资源的成功交付使用,是变现前提条件。根据数据安全法规定,需要“建立数据分类分级保护制度,根据数据在经济社会发展中的重要程度,以及一旦遭到篡改、破坏、泄露或者非法获取、非法利用,对国家安全、公共利益或 44 者个人、组织合法权益造成的危害程度,对数据实行分类分级保护”。因此,数据要素流通过程中,建立跟数据资产安全保护等级相匹配的数据交付方式,是数据要素安全流通的基础。行业范围内,目前通过区分原始数据、脱敏数据、模型数据、人工智82、能数据等将数据进行分类分级管理,并通过引入数据沙箱、隐私计算等多种数据交付工程解决方案并结合区块链等技术实现方式来搭建数据要素流通底座,实现金融领域数据要素的安全、可行流通。6)数据贡献评价 数据资产在流通过程中,会产生多维度信息,包括数据质量、基于场景的贡献度、数据源服务能力、数据产品使用评价。通过整合相关信息,共同形成数据资产的评价体系,可以建立起平台、生态内的数据资产评价标准,帮助降低数据资产变现过程中的信息不对称性,促进数据要素市场的健康发展。7)收益分配 数据资产顺利交付后,需要根据数据流通过程中涉及的关联方,依据主体角色,或者主体贡献,完成收益的最终分配,以此完成整个数据要素市场的83、资源配置。数据要素有别于传统商品,对数据要素在不同场景中的共享情况需要针对性进行测量和评估。因此数据资产变现过程中的收益分配也要根据数据资产交付的不同形式进行穿透式管理和针对性支持。45(3)数据资本化阶段运营要求 数据资本化是指通过数据交易流通将数据资产转变为数据资本的过程,通过数据交易,将数据资产在一定价值基础上投入到新的生产关系中,从而在更高层次上实现数据资本价值。数据技术的迅猛发展正在消除金融资本、实物资本与数据资本之间的鸿沟,巨大的颠覆性创新正在逐步将数据引入资本市场。数据资本需要通过金融产品的创新,实现对数据资产的融资、数据资产的信托、数据资产的权益保障等方式,构建基于数据资产的全84、新价值变现体系,实现数据的资本化运营。(4)穿透式审计 数据运营管理需要具备支持平台审计或第三方审计的能力,建立起针对数据生命周期的全过程进行穿透式监管。穿透式监管是指不仅需要针对传统数据链路中的上下游链路、数据处理方式、数据处理对象进行监督和记录,还需要面向数据处理过程进行合规检查。针对中高保密数据运营过程中的数据来源合规性、数据应用方式合规性、数据流通过程合规性等进行识别和审查能力,才能切实保障平台运营工作的合规性、有效性。(5)数据存证和纠纷解决 为了支持平台或第三方进行合规性审计,也为了支持数据资源化、资产化、资本化运营过程中产生的纠纷解决,除了需要做好穿透式追踪和记录机制外,还需要建85、立可信的数据存储和管理 46 能力。行业范围内通过区块链来解决数据存储的不可更改问题,并通过联盟链的方式,利用智能合约机制建立统一、共识的可信数据存证机制。为了保证平台存证数据满足纠纷解决的证据线索要求,平台还需要对存储的数据范围、数据内容进行管理。行业范围内可通过行业标准、引入公证机构、加入司法联盟链的方式来建立存证管理的标准体系。5.5.数据运营体系待解决问题数据运营体系待解决问题 数据合理运营,离不开数据权属的确认。完善的数据产权制度是充分发挥数据要素作用的前提,是实现资源有效配置和经济发展的保障。2022 年 6 月,深化改革委员会第二十六次会议审议通过 关于构建数据基础制度更好发挥数86、据要素作用的意见,提出要统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系的总体要求。数据流通领域和法律界人士从实践应用和法律体系完善等方面,同步推进,为构建中国特色数据产权制度先行先试。北京、上海、深圳、贵州等地的国家级新型数据交易中心,从数据流通实践的角度进行探索和尝试。比如北京国际大数据交易所(下称“北数所”)在 2021 年上线的 IDeX 系统,实现了数据产品上架登记的功能,并结合区块链数据不可篡改的特性进 47 行记录;深圳数据交易有限公司则通过引入第三方评估机制,通过数据准入评估对数据权属和合规性进行监督和管理。法律界则提出优先从搭建以数据使用权为核心的产权87、制度体系出发,通过对数据进行分类分级,进行针对性的制度设计和业务实践,促进数据的使用和价值的释放。金融行业数字化实践起步早、成熟度高,数据标准等基础相对完善,可以率先探索行业数据权属的应用实践。在金融数据安全 数据安全分级指南的基础上,探索金融数据确权的行业解决方案,推进数据确权规则的成熟和完善。48 (四)(四)数据要素流通数据要素流通 1.1.框架总述框架总述 在法律法规、监管合规要求下,数据高效流通交易、数据要素市场规范发展,有赖于行之有效的流通模式等规则机制和安全可靠的技术能力支撑。针对现阶段市场发展面临的挑战,提出包含规范体系、规则机制、支撑体系三层的金融数据流通体系框架,如图 2 88、所示,自上而下指导和促进、自下而上支撑和推进,以保障数据来源可确认、使用范围可界定、流通过程可追溯、安全风险可防范。在规范体系的顶层指导下,通过规则机制和支撑能力体系双轮驱动,形成场内外多层次数据流通服务模式,共同推动金融数据流通市场高质量发展。49 图 2 金融数据流通体系框架 2.2.规范体系:战略规划、法律法规、标准规范规范体系:战略规划、法律法规、标准规范 国家战略规划、法律法规和行业标准规范整体构成金融数据流通体系框架中的规范体系,提供顶层指导和合规保障,促进建立良好的数据流通市场环境。首先,在战略规划方面,“数据二十条”指出构建数据基础制度,保障数据要素的安全和发展,金融科技发展规89、划(20222025 年)明确了金融数字化转型总体思路、目标方向和实施路径。其次,法律法规是保障数据要素流通合法、有序进行的重要基石,数据安全法与网络安全法个人信息保护法并行成为网络空间治理和数据保护的三驾马车,网络安全法负责网络空间安全整体的治理;数据安全法是数据安全领域的 50 基础法律,负责数据处理活动的安全与开发利用;个人信息保护法负责个人信息的保护。最后,标准规范的制定和实施是推动数据要素流通的关键环节,金融数据安全 数据生命周期安全规范 金融数据安全 数据安全分级指南和金融业数据能力建设指引等文件为金融数据采集、分类分级处理、传输、存储和使用等各个环节提供了详细的操作指南和安全标准90、。3.3.服务模式服务模式体系体系 基于金融数据流通现状和当下国内各地数据交易所的发展,提出数据流通服务模式体系。一方面,在跨行业跨机构间,根据数据安全分类分级的不同,可以对应匹配数据集、数据 API 或隐私计算流通服务模式;在同领域或同行业机构间,可以通过数据共享与交换实现数据流通。另一方面,现如今各地数据交易所积极创新,不局限于供需撮合,根据金融数据流通交易的场所可分为场内、场外交易。综合金融业数据流通诉求、数据交易所模式以及数据要素市场的发展,实现数据安全合规、大规模、高效率流通交易,场内、场外以及数据集、API 服务、隐私数据服务等模式交互融合,建立多层次、多样化的数据流通服务模式体系91、。4.4.规则机制体系规则机制体系:管控管控、管理管理、市场市场 数据流通规则机制体系分为管控机制、管理机制、市场机制 51 三个层次,分别规范和促进金融数据流通的可行、能行和易行。管控机制是金融数据有序流通的前提,保障数据流通源头的合法合规;管理机制是金融数据流通的核心基础,促进数据安全和数据质量的把控,以及数据用途与流通模式的合理匹配;市场机制是金融数据流通的关键,合作生态和定价收益等体系的建立有助于催化数据流通市场的高效发展。(1)管控机制 管控机制层面由数据登记和公证体系、数据信用体系等组成。登记和公证体系:登记和公证体系:建立数据登记和合规公证体系,保障数据合法合规。登记构成要件包括92、登记机构、数据来源说明、数据授权书、安全等级和保密要求等,由数据公证机构对材料进行核查和确认,出具公证证明,确保数据主体与数据来源合法合规,保障交易数据真实可靠以及数据承载的数据主体权益,为数据要素交易流通提供参考依据,有助于维护数据交易市场秩序,促使其稳定、健康、快速发展。数据信用体系:数据信用体系:建立数据信用体系,加强数据流通监管。打造数据交易市场社会信用体系,逐步完善数据交易中失信行为认定、失信惩戒、异议处理和信用修复等机制。加强与社会信用体系的同步建设、协同联动、相互促进,强化数据从创建到流通再到应用的全生命周期的全过程信用监管,维护市场主体权益。制定交易数据“负面清单”,明确国家秘93、密、商业机密、个人隐私 52 领域不能或严格限制交易的数据项。建立交易诚信“黑名单”机制,将违规操作的市场主体纳入黑名单,限制数据要素交易活动并责令限期整改。(2)管理机制 管理机制层面由安全管理体系、质量管理体系、流通规则体系等组成。安全管理体系:安全管理体系:建立数据安全管理体系,促进数据可信流通。强调数据交易的可追溯性,记录、追溯数据交易的事前磋商与验证、交易流程和数据触达情况等。建立数据要素流通使用全过程的合规公证、安全审计、算法审查、监测预警机制,促进不同场景下数据要素安全可信流通。根据数据内容、应用场景等制定数据分类分级的保护标准,以实现针对性、分等级、差异化的数据隐私保护和安全防94、护。质量管理体系:质量管理体系:建立数据质量管理体系,提高数据流通效率。大力推进金融数据标准化建设,统一金融数据的规则和技术要求,促进金融数据规范定义、规范标识、规范使用,增强数据的可用性。加强金融机构数据的质量管理,进一步完善金融数据质量监管规则,将数据质量情况作为金融机构、公司治理风险管控的重要考量因素,加强评估考核和监督检查。流通规则体系:流通规则体系:建立统一规范的流通规则体系,构建在使用中流通、场内场外相结合的交易制度。数据流通应体现为多层次的市场交易体系,并根据具体的类型和场景,适用不同的交易规 53 则,包括集团内、金融行业内、跨行业、跨境的数据开放、共享、交换、交易等场内和场外95、的流通方式。建立数据用途和用量控制制度,实现数据使用“可控可计量”。(3)市场机制 市场机制层面由合作生态体系、定价收益体系、需求管理体系等组成。合作生态体系:合作生态体系:构建以交易所、数据服务商和第三方机构共同构成的数据流通合作生态体系。交易所可以夯实数据要素治理基础,负责标准化数据产品的交易撮合、价格生成、结算等工作;数商可以提高数据要素应用水平,负责对多源异构数据的汇聚对接、清洗加工、质量管控、可信流通,将非标准化数据转化为标准化产品;第三方机构可以释放数据要素流通活力,提供数据集成、数据经纪、数据评估、数据审计、数据公证等市场服务,加快构建数据要素社会信用体系。定价收益体系:定价收益96、体系:构建数据定价体系。推动数据要素由市场评价贡献、按贡献决定报酬的相关机制。充分发挥市场在资源配置中的决定性作用,扩大数据要素市场化配置范围和按价值贡献参与分配渠道,完善数据要素收益的再分配调节机制,保护数据要素各参与方的劳动收益,促进劳动者的贡献和劳动报酬相匹配,强化基于数据价值创造的激励导向。通过数据产权制度保障数字权益、保障各相关主体基于数据市场评价贡献决定报酬分配。需求管理体系:需求管理体系:建立需求管理体系,以选择实现数据应用为 54 导向,梳理应用所需数据,开展专项数据治理。再通过迭代的方式,逐步实现体系化数据治理。新模式既满足监管对数据的要求,同时也涵盖监管要求的数据价值实现。97、加快培育供求匹配高效、标准制度统一、市场运行规范、产品质量可控的数据要素市场。支撑能力体系:支撑能力体系:从广义数据流通来看,实现数据流通全流程不仅需要狭义层面的流通技术,还需要数据资产管理、数据治理、流通技术、数据运营、服务创新等多方面的能力支撑,共同构成金融数据流通的支撑能力体系。数据资产管理能力:数据资产管理能力:数据资产(Data Asset)是指由组织(政府机构、企事业单位等)合法拥有或控制的数据,以电子或其他方式记录,例如文本、图像、语音、视频、网页、数据库、传感信号等结构化或非结构化数据,可进行计量或交易,能直接或间接带来经济效益和社会效益。在组织中,并非所有的数据都构成数据资产98、,数据资产是能够为组织产生价值的数据,数据资产的形成需要对数据进行主动管理并形成有效控制。从企业应用的角度,数据资产是企业过去的交易或事项形成的,由企业合法拥有或控制,且预期在未来一定时期内为企业带来经济利益的以电子方式记录的数据资源。数据资产管理(Data Asset Management)是指对数据资产进行规划、控制和供给的一组活动职能,包括开发、执行和监督有关数据的计划、政策、方案、项目、流程、方法和程序,从而控制、保护、交付和提高数据资产的价值。数据资产管理须充分融合政策、管理、业务、技术和服务,确保数据资产保值增值。具 55 体内容在 3.2 章节详细论述。(4)数据治理能力 金融业99、数据治理是指金融机构通过建立组织架构,明确董事会、监事会、高级管理层及内设部门等职责分工,制定和实施系统化的制度、流程和方法,确保数据统一管理、高效运行,并在经营管理中充分发挥价值的动态过程。数据治理其实是一种体系,是指从组织架构、管理制度、操作规范、应用技术、绩效考核支持等多个维度对组织的数据模型、数据架构、数据质量、数据安全、数据生命周期等各方面进行全面的梳理、建设以及持续改进的体系。高质量的数据对金融机构是战略性资产,要使数据具有价值,需确保数据的可信任、安全性、可访问性、准确性、共享性和及时性。然而,由于历史原因,大多数金融机构的数据是分散的、缺乏规范管理、无主数据标准的状态。随着金融100、机构不断推进数字化转型的进程,有效数据正迅速成为一个关键的业务差异,因此数据治理显得尤为重要。数据治理能力在 3.3 章节详细论述。(5)数据流通的流程与技术 数据交易业务流程主要包含数据产品上架、需求发布、分类分级登记和确权、数据资产评估和定价、供需匹配、数据产品分级流通、交易存证管理、监管通道、运营分析和数据产品下架等流程。具体如图 3 所示:56 图 3 数据流通交易业务流程 结合流通的各业务流程,针对数据安全流通、治理、数字化运营和创新服务各方面的支撑,主要涉及隐私计算、API 技术、脱敏、去标识化、匿名化、区块链、数据水印技术、密码技术、大数据技术与分析技术等。隐私计算在 3.4 章101、节详细论述。(6)数据运营能力 挖掘需求:挖掘需求:数据要素价值发挥依赖业务场景,一方面促进供需的高效交流,形成对营销、风控等多种场景的数据服务;另一方面,借助服务中介机构,其优势是对行业有深入的理解和服务经验,支持其挖掘合规、创新等各类潜在的场景。形成数据产品:形成数据产品:数据保护要求不断提升,直接的数据集交换难以成为主要的流通模式,数据产品和服务则有可能成为数据要素流通的核心。因此,结合各类场景的业务需求,清晰定义数据产品和服务的主要功能和交互界面,是实现数据要素价值交换的可行方式。同时,也有利于评估流通价格。57 活跃数据流通与交易:活跃数据流通与交易:数据要素流通的关键在激发各方的动102、力,包括数据供应者和使用者的动力,一方面依托政策推动作用,逐步丰富数据供给。同时,依托生态建立多方共赢的权益激励机制,通过多层次的数据中介丰富数据产品服务形式,增进数据服务的成效。此外,加强数据合规和安全保障措施,免除各参与方的顾虑。数据运营在 3.5 章节详细论述。(五)(五)流通技术流通技术 1.1.数据共享数据共享 当前全球数据总量高速增长,数据要素地位显著提升,数据作为一种新型生产要素,已成为国家和企业具有战略价值的核心资产。如何在安全合规的前提下有效利用数据,推动数据的流通共享与开发利用,实现数据价值的最大化,成为数字经济发展的重要课题。由于数据具有流动性、多样性、可复制性等不同于传103、统生产要素的特性,数据安全风险在数字经济时代被不断放大。海量的数据蕴含巨大商业价值的同时,也带来隐私安全问题,加重数据流通各方顾虑。在数据流通后,数据一旦被复制转售,数据原始拥有方面临失去其控制权和收益权的风险,同时数据流通链路的各环节都有可能发生数据泄露、隐私侵犯等一系列后链路问题。业内普遍认为,传统的数据流通模式包含三个阶段:1.0 的文件传输阶段,2.0 的接口调用阶段,3.0 的可信沙箱阶段,但此 58 三个阶段均存在不同程度的原始数据出域情况和数据泄露风险。2021 年,数据安全法和个人信息保护法正式实施后,法律层面对数据安全做出明确要求,传统数据流通模式存在较大的合规风险。由此,4104、.0 的隐私计算阶段正式进入行业视野,数据流通与应用发生范式变革,业内普遍认为通过隐私计算可以赋能数据价值的安全释放与数据智能的合规应用。2.2.隐私计算隐私计算(1)隐私计算概述 隐私计算(Privacy-preserving computation)指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算,有效提取数据要素价值为目标的一类信息技术,保障数据在产生、存储、计算、应用、销毁等数据全生命周期的各个环节中“可用不可见”。隐私计算是一套包含人工智能、密码学、数据科学等众多领域交叉融合的跨学科技术体系,用于保证满足数据隐私安全的基础上,实现数据价值的流通。隐私计算技术契合当前建设数105、字经济,挖掘数据要素市场的社会需求,可以充分保护数据并确保隐私安全,消除“数据孤岛”,在多主体间充分进行数据共享与利用,实现数据价值的转化和释放。隐私计算主要包括如下三类:一是以多方安全计算、同态加密为代表的基于密码学的隐私计算技术。多方安全计算是一种在参与方互不信任且对等的前提 59 下,以多方数据为输入完成计算目标,保证除计算结果及其可推导出的信息之外不泄漏各方的隐私数据的协议。同态加密是能够直接使用密文进行特定运算的加密技术。在同态加密计算过程中,无需密钥即可实现操作,而结果仍需密钥解密从而变为明文,在解密后,得到与明文计算相同的结果。二是以联邦学习为代表的人工智能与隐私保护技术融合衍生106、的技术。联邦学习是一种分布式机器学习范式,包括两个或多个参与方,这些参与方通过安全的算法协议进行联合机器学习,可以在各方原始数据不出本地、不传输原始数据的情况下联合多方数据源建模和提供联合模型推理服务。三是以可信执行环境为代表的基于可信硬件的隐私计算技术。基于可信执行环境的安全计算是数据计算平台上由软硬件方法构建的一个安全区域,可保证在安全区域内部加载的代码和数据在机密性和完整性方面得到保护。(2)隐私计算的发展阶段与共识 近年来,我国政府陆续出台了 中华人民共和国网络安全法中华人民共和国数据安全法 中华人民共和国个人信息保护法,从国家立法层面明确了对数据安全和隐私保护的多法联动要求;同时在国107、务院办公厅、工信部、央行等国家部委级单位配套出台了系列文件明确将数据作为种新型生产要素,与土地、劳动力、资本、技术等传统要素并列,并且明确鼓励科技创新赋能数据安全有序流通。60 在国家相关政策、法规的支持下,隐私计算技术逐渐成为影响数据要素安全流通的关键,凭借其“数据可用不可见”的特性,目前被公认为是既能保护数据安全、又能释放数据价值的技术最优解。经过两年多的发展,隐私计算已经从概念验证阶段步入商业落地阶段,逐步形成了更广泛的技术共识和市场共识。在技术层面,以多方安全计算、联邦学习与可信执行环境等技术为主的隐私计算每种技术均有各自特性与原生局限。在实际业务场景应用中,客户更注重其技术能否满足多108、样化的计算需求,而不是追求单一技术特性,因此融合计算引擎逐渐成为技术共识。此外,由于各厂商平台在技术架构、协议、算法等方面的差异,异构平台之间无法有效协作,也形成了隐私计算互联互通的技术共识,对于构建基于隐私计算的全域数据智能流通网络有积极重大意义。在市场层面,隐私计算商业化进程自 2021 年下半年以来明显提速,对于隐私计算价值的认知和预期也开始从平台建设延展至场景运营,形成了市场共识。隐私计算作为一种需要“对手使用方”才能充分体现价值的技术,除了提供数据流通安全的基础设施技术外,还在于与数据供应方和数据应用方建立生态链接,使多个数据供应方的数据资源通过算法实现价值融合,形成全局性的数据智能109、,最终应用于场景中并通过改善业务效果来充分释放商业价值。61(3)多方安全计算 1)技术概述 多方安全计算(Secure Multi-Party Computation,简称 MPC或 SMPC),是指在无可信第三方的情况下,各方共同参与计算任意约定的函数,同时在计算过程中各个参与方的数据都不会发生泄漏。多方安全计算作用于数据交换过程中,在保证了数据保密的同时实现了数据共享,实现了数据可用而不可见,有利于解决“数据孤岛”现象。多方安全计算是密码学的一个分支,涉及很多密码学知识,同时也反作用于密码学,两者相互促进。多方安全计算包括多个技术分支,主要用到的技术是秘密共享、不经意传输、混淆电路、同态110、加密、零知识证明等。2)技术发展现状 多方安全计算自 1986 年被提出之后,在比较长的时间里,针对其研究都集中在理论层面,而针对多方安全计算的应用少之又少,之后于 2004 年 Malkhi 提出了多方安全计算平台 Fairplay,使多方安全计算得到实际的应用。近年来,由于各国更加重视对数据资源的保护,出台了大量法律法规,多方安全计算又重新回到大众的视野,多个领域都开始尝试使用多方安全计算技术解决领域内的问题,多方安全计算进入到规模化发展阶段。目前,多方安全计算技术已经经过了实践检验,在金融、医疗等领域有实际落地的应用。并且,相关的技术标准(如 JR/T 01962020 多方安全计算金融111、应用技术规范)以及实施指引等 62 已基本完善。3)技术发展趋势 当前多方安全计算的开销大,所以需要优化算法的效率才能够使其大规模应用,同时多方安全计算属于密码学的分支,使用该技术需要密码学技术做支撑,这一点也提高了技术的门槛,所以简单化、易用化的多方安全计算将会是未来的发展趋势。未来,MPC 技术将进一步与其他前沿技术如区块链、人工智能、物联网等深度融合,催生出更多创新的应用场景和商业模式。4)应用情况 多方安全计算技术可以在相对封闭的数据参与方间,建立起安全可信的数据交换网络,实现数据价值的最大效用。多方安全计算适用于数据安全查询、隐私集合求交及联合数据分析。数据安全查询指的是:数据查询方112、需要向数据拥有方查询数据,数据查询方不想让数据拥有方知道其查询需求,数据拥有方也不想让数据查询方知道其余数据。利用多方安全计算技术,能够实现数据的安全查询。隐私集合求交(Private Set Intersection,简称 PSI)指的是:当两方都有各自的秘密列表,通过 PSI,他们只能知道这两个列表有哪些项目是重合的,但是无法让对方看到自己列表中除交集之外的任何信息。能够在保证数据隐私和安全的同时,促进信息的共享和协作。联合数据分析指的是:数据分析方分析数据需要使用到多个参与方的数据,将全部数据收集到之后才能进行分析,但目前的 63 数据分析算法会暴露参与方数据的隐私,多方安全计算能够使原113、始数据在无需归集与共享的情况下实现计算,保护目标数据参与方的隐私。(4)联邦学习 1)技术概述 联邦学习(FL,Federated Learning),又名联邦机器学习,联邦计算。联邦学习是在原始数据不出本地的前提下,通过模型的流通与处理来完成多方联合的机器学习,得到聚合的训练结果。联邦学习的参与方一般包括数据方、算法方、协调方、计算方、结果方、任务发起者等角色。2)技术发展现状 按照数据特征和样本的分布情况,联邦学习可划分为横向联邦学习、纵向联邦学习和联邦迁移学习。其中,横向联邦学习适用于参与方有重叠的数据特征,而拥有的数据样本不同的情况。纵向联邦学习适用于参与方拥有重叠的数据样本,而数据特114、征不一致的情况。典型的例子是两家公司提供完全不同的服务,但在用户群体上有非常大的交集时,他们可以在各自不同的特征空间上协作,得到一个更好的机器学习模型。联邦迁移学习是指各参与方的数据集之间只有少量的重叠样本和特征,或者数据集的分布情况差别很大时,利用源领域和目标域之间的相似性,实现跨领域知识迁移的学习技术。3)技术发展趋势 64 联邦学习的技术正在飞速发展中。2021 年,名为群体学习的新型去中心化机器学习系统的出现引领了联邦学习新的潮流。群体学习引入区块链技术取代第三方协调方,在区块链上共享加密的梯度参数,参与方根据本地数据在本地进行所有模型运算,有力地保证了数据隐私不泄漏。群体学习利用区块115、链技术对试图破坏网络的不诚实参与者采取措施,用惩罚和激励机制为群体网络提供弹性和安全性。相比之下,当前星型网络的联邦学习摆脱不了中心化的数据处理和单点故障风险;纯粹点对点网络的联邦学习数据通信带宽消耗随着参与方的增多将走向失控,因而计算的规模受到严重制约;而群体学习将边缘计算和基于区块链的对等网络结合,兼顾安全、效率与激励,有望成为下一代联邦学习的代表性技术。4)应用情况 联邦学习的架构通常支持通用硬件。而隐私计算的其他分支可行执行环境是需要特定硬件的。在多方参与的复杂场景下,联邦学习这种硬件无关的特性减少了多方间达成一致的沟通成本。当前有部分行业的用户执行严格的数据不出域要求,不仅原始数据不116、能出域,加密后的密态数据也不能出域。在这种情况下,联邦学习“数据不动模型动”的特点能够契合用户的要求,化解数据孤岛难题。由于联邦学习在数据安全流通中的显著作用,已被广泛应用于金融领域,在保证用户隐私的前提下用于联合数据挖掘和建模。65(5)可信执行环境 1)技术概述 可信执行环境(Trusted Execution Environment,简称为 TEE)是计算平台上由软硬件方法构建的一个安全区域,可保证在安全区域内部加载的代码和数据在机密性和完整性方面得到保护。其目标是确保一个任务按照预期执行,保证初始状态的机密性、完整性,以及运行时状态的机密性、完整性。2)技术发展现状 1999 年,康柏117、、HP、IBM、Intel、微软等企业发起成立了可信计算平台联盟 TCPA(Trusted Computing Platform Alliance)该组织于 2003 年改组为可信计算组织 TCG,并制定了关于可信计算平台、可信存储和可信网络连接等一系列技术规范。2009 年 OMTP(Open Mobile Terminal Platform,开放移动终端平台)工作组智能终端的安全率先提出了一种双系统解决方案:即在同一个智能终端下,除了多媒体操作系统外再提供一个隔离的安全操作系统,这一运行在隔离的硬件之上的隔离安全操作系统用来专门处理敏感信息以保证信息的安全。2011 年 Global Pl118、atform(全球最主要的智能卡多应用管理规范的组织,简称为 GP)从 2011 年起开始起草制定相关的 TEE 规范标准,并联合一些公司共同开发基于 GP TEE 标准的可信操作系统。因此,如今大多数基于 TEE 技术的 Trust OS 都遵循了 GP的标准规范。66 3)技术发展趋势 在国外 ARM 公司、Intel 和 AMD 公司分别于 2006、2015和 2016 年各自提出了硬件虚拟化技术 TrustZone、Intel SGX 和AMD SEV 技术及其相关实现方案,在国内中由关村可信计算产业联盟 2016 年发布 TPCM 可信平台控制模块,为国产化可信执行环境 TEE 技119、术的发展起到了指导作用,国内芯片厂商兆芯、海光分别在 2017 年和 2020 年推出了支持可信执行环境技术ZX-TCT、海光 CSV(China Security Virtualization)。4)应用情况 可信执行环境 TEE 技术因可支持多层次、高复杂读的算法逻辑实现、运算效率高和可信度量的方式保证 TEE 的运行逻辑的可信及可度量性的特性,受到业界一致认可,越来越多可信执行环境 TEE 的开源框架和产品踊跃而出。可信执行环境技术(后简称 TEE)因其较强的算法通用性和较小的性能损失,在许多涉及隐私数据计算的场景中都得到了广泛应用,并且尤其适用于具备以下特征的应用场景:a.计算逻辑相对120、复杂,算法难以通过同态加密等技术进行改造,或者改造过后效率下降过多。b.数据量大,数据传输和加解密的成本较高。c.性能要求较高,要求在较短时间内完成运算并返回结果。d.需要可信第三方参与的隐私计算场景,且数据(部分或间接)可被可信第三方获取或反推。e.数据的传输与使用环境与互联网直接接触,需要防范来 67 自外部的攻击。f.数据协作的各方不完全互信,存在参与各方恶意攻击的可能。其中最常见的具体应用场景包括:隐私身份信息的认证比对、大规模数据的跨机构联合建模分析、数据资产所有权保护、链上数据机密计算、智能合约的隐私保护等。(6)隐私计算的应用 随着政策与需求的双重推动,隐私计算技术和产品成熟度迅121、速提升,从 2020 年的概念验证阶段快速进入到 2021 年的商业化落地阶段。据中国信通院隐私计算应用报告(2022)显示,截至 2022 年 6 月,开展实施的隐私计算产品比例已由 2021 年的48%上升至 55%,在 2019 年2022 上半年隐私计算招标行业比例中,以银行、保险、证券等为主的金融业占比高达 53%,隐私计算的落地应用正在加速实施。在金融领域,一方面受国家鼓励数据要素价值释放的政策影响,金融机构数字化转型亟需充分发挥数据价值;另一方面针对数据安全与隐私保护的监管法规不断出台,企业面临的监管日渐趋严,倒逼其寻求技术解决路径。因此,在兼顾数据流通与隐私保护的同时,实现数据122、智能的落地应用,成为业界普遍关注的议题。隐私计算凭借“原始数据不出域,数据可用不可见”的特性,通过将“可见的具体信息部分”保留在本地,“计算价值部分”68 开放、流通和应用的方式,在原始数据不出私域的条件下,完成数据智能应用场景中具体规则和模型计算,由数据信息流通转换到数据智能流通,成为解决既要数据流通又要隐私保护矛盾的技术最优解。隐私计算技术能够帮助银行、保险、证券等金融机构在联合营销、联合风控、精准投放等业务场景中提供更加准确的数据智能模型,通过帮助企业在安全合规的前提下获取更广泛的数据来源和更细颗粒的数据维度,有效推动金融机构数字化转型,充分发挥数据要素市场价值。以联合风控为例,金融机构123、此前普遍面临外部数据缺乏、数据维度单一、验证信息准确性困难、管理信息不对称等瓶颈或风险。但通过搭建隐私计算平台,可以帮助金融机构联合地方政府、通信运营商等外部机构,实现数据安全融合,并丰富客户画像及全面分析客户,从而提高金融机构管理效率。四、面临的挑战(一)(一)政策标准有待进一步完善政策标准有待进一步完善 数据已成为国家基础性战略资源,近年来,我国高度重视数据开发利用,并发布了一系列相关政策推进数据资源开放共享与交易流通。2019 年 10 月,党的十九届四中全会首次公开明确将数据作为生产要素按贡献参与分配,“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决 6124、9 定报酬的机制”。2021 年 6 月 10 日,第十三届全国人民代表大会常务委员会第二十九次会议通过的 中华人民共和国数据安全法,在平衡安全与发展的前提下,也进一步明确了数据安全应用的目标,鼓励和支持数据在各行业、各领域的创新应用。2022年 6 月 22 日,中央深改委第二十六次会议审议通过关于构建数据基础制度更好发挥数据要素作用的意见,会议指出,要建立合规高效的数据要素流通和交易制度,完善数据全流程合规和监管规则体系,建设规范的数据交易市场。对于金融行业而言,金融数据更是蕴含着极高的价值和广阔的应用前景。如今金融数据在客户画像、精准营销、消费信贷、风险评估、黑产防范等众多领域中得到广泛125、应用。对于数据的安全应用及分析能力,正在成为金融机构未来发展的核心竞争要素。近期,金融行业主管部门响应国家政策号召以及行业发展需求,发布了金融领域内的相关规划文件,推动金融机构数据能力建设和金融数据共享与应用。中国人民银行印发金融科技发展规划(20222025 年),明确提出强化数据能力建设、推动数据有序共享、深化数据综合应用、做好数据安全保护这四方面重点任务,以推动金融数据要素潜能释放。银保监会印发中国银保监会关于银行业保险业数字化转型的指导意见,同样强调银行业保险业数据能力建设,要求健全数据治理体系,增强数据管理能力,加强数据质量控制,提高数据应用能力。在金融数据要素市场建设方面,其数据产126、权机制不明确,缺乏通用的数据定价、数据质量评估的方法和标准,支持金融数据 70 交易流通的政策、标准跟不上数据融合应用的步伐。同时,相对于其他行业,金融数据涉及更多的用户个人隐私,在数据安全和个人信息保护方面要求更加严格。目前金融数据相关的政策与标准,在数据安全保护层面有所侧重,然而有关数据应用方面的政策标准尚存在较多空白,在一定程度上制约了金融数据的开放共享与深化应用。一方面,数据应用潜在的安全合规风险使金融机构望而却一方面,数据应用潜在的安全合规风险使金融机构望而却步。步。国家和金融行业数据相关政策如中华人民共和国数据安全法中华人民共和国个人信息保护法中国人民银行金融消费者权益保护实施办法127、、JR/T 02232021金融数据安全 数据生命周期安全规范 等在数据安全保护方面的要求逐步加深和细化,数据安全监管日趋严格,对于金融机构来说,数据安全合规成本不断攀升,且随着公众对于个人隐私数据的重视程度逐渐提升,一旦发生数据泄露或非法利用,金融机构将面临资产与声誉的重大损失。而在金融数据应用方面,缺乏相关的顶层设计和政策支撑,金融机构出于安全合规的考虑,对于数据应用和数据共享趋于保守,有数不敢用、不能用的情况普遍存在。此外,加之金融机构之间存在着较为明显的数据壁垒,机构内部各部门、各业务条线之间也存在较为严重的“数据烟囱”“数据孤岛”问题,使得各金融机构的数据不能进行较好的融合应用和整合128、协同,数据价值没有得到深入挖掘,数据能量没有得到充分释放。另一方面,金融数据应用缺乏整体性规划和具体实施指导。另一方面,金融数据应用缺乏整体性规划和具体实施指导。目前的数据政策仅停留在加强数据能力建设和鼓励数据开发利 71 用层面,没有做出具体的行业整体性规划,为金融数据应用指明发展方向。而且数据应用相关的标准规范仍处于探索阶段,缺乏统一的金融数据管理标准及共享机制,不能为金融机构以及各领域之间的数据共享以及融合应用提供参考与指导。当前各金融机构的数据治理能力参差不齐,行业内数据管理情况秩序不一,数据应用情况较为分散,数据资源流动通道没有形成和开放,数据应用价值无法得到进一步的体现和发挥,且在129、一定程度上制约了新兴技术的深化应用。金融数据应用离不开国家相关政策的保障以及行业标准规范的指引,在当前的局势下,迫切需要完善数据应用产业规划和相关法律法规政策,明确金融安全保护与发展应用重点,为数据在金融行业以及各领域之间的开发利用和融合应用提供政策法规支撑及安全体系保障,同时加强数据安全、数据治理及数据共享相关的标准规范制定,为金融机构进行数据的安全防护、整合协同和深化应用提供理论依据和实践指导。(二)(二)数据应用风险管控亟待加强数据应用风险管控亟待加强 随着金融数据智能化技术的快速发展,须重视金融业务风险与技术风险叠加后产生的扩散效应,对于行业发展与风险监管之间要进行有效平衡。金融数据应130、用方面的安全风险一般包括数据过度采集而产生的隐私信息泄露风险、数据模型对群体非合理的分类评级造成的不公正问题、数据深度挖掘和分析可能产生的数据资源滥用风险以及攻击致使安全机制失效而产生数据被窃取 72 的风险等。现行的中华人民共和国网络安全法与个人信息保护法 民法典虽然已就数据使用和隐私保护方面作出了明确规定,但数据泄露、信息盗取与恶意攻击依然时有发生,信息监管体系仍不完善,技术的不断迭代、创新带来多元风险与新型隐患,以及由此带来的隐私保护和社会安全问题愈发严峻。1.金融金融数据过度采集产生隐私信息泄露风险数据过度采集产生隐私信息泄露风险。随着信息技术的飞速发展,大数据已逐渐成为社会运行的常态131、,数据在金融营销、理财推荐、个人身份认证等各个领域发挥着重要作用。但数据在带来时代福利的同时也引发数据滥用、隐私泄露等诸多问题。个人用户在使用金融应用进行搜索、消费活动时,其数据会被金融应用系统采集、识别和分析。用户的各种金融行为数据会被系统的搜索引擎记录和保持。虽然采集的数据只是某一个时间点或空间点上零星碎片化个人行为数据,但经过大数据的整合、分析及挖掘后,就可以对用户信息进行筛选和分析,可以对用户进行精准画像以及关联到一系列与之相关的数据信息。2.数据深度挖掘和分析可能产生数据资源滥用风险数据深度挖掘和分析可能产生数据资源滥用风险。数据作为金融机构的核心资源,可以通过大数据整合、分析后进行132、营销推广、产品迭代等多项业务的优化。但金融机构在服务场景中,为了给用户提供更加优质的服务,通常会将数据与第三方机构进行交换共享,但对合作三方机构使用用户数据的监测和监管不到位,也会使数据面临潜在的第三方泄露的风险。3.受到攻击使安全机制失效而产生数据被窃取的风险受到攻击使安全机制失效而产生数据被窃取的风险。数字 73 信息技术促使数据应用场景日益多样化,海量的数据不仅是金融机构的资产,也是黑客等攻击的主要对象,金融数据安全保护面临着越来越严峻的挑战和风险。当前最广为人知的大数据技术实施方案,服务模式将数据全权转移给了源程序,恶意的源程序有可能在用户不知情的情况下窃取用户数据,也可能受到攻击致使133、安全机制失效或被非法掌握从而导致非授权人读取数据,给金融数据安全带来巨大风险。根据中国互联网协会发布的网民权益保护调查报告(2021),78.2%的网民的个人身份信息、63.4%的网民的网络金融交易记录曾被泄露过。近年来,每年发生金融隐私泄露事件大约以35%的速度在增长,有公开报道或记录2016年 1093 起,2017 年 1511 起,2018 年 1967 起,2019 年 2300 余起。4.金融监管机金融监管机制制与业务模式的发展速度不匹配与业务模式的发展速度不匹配,加大了金融加大了金融数据应用风险数据应用风险。AI 大数据的快速发展及应用,让许多传统金融业务模式发生了改变。但由于金134、融监管机制目前尚未完善,如果出现业务或者服务纠纷就会面临很多监管难题。一方面,金融监管的责任认定难。AI 大数据本身的学习、决策机制所产生的行为无法追溯,给 AI 大数据行为的监管带来挑战;金融数据智能化应用涉及方众多,需分清虚拟和实体主体,监管成本有所增加。另一方面,监管边界难把握。资产管理、信贷业务等领域都在如火如荼地开展金融数据智能化研究,但分业监管制度下,各类金融业务分别适用于不同的法律法规。所以在实际操作过程中,监管边界不明确的情况下,不法分子将有机可乘,从事非法集资、74 证券传销、非法经营等违法违规活动,进一步扩大了金融数据的应用风险。(三)(三)数据服务能力评价机制仍需完善数据135、服务能力评价机制仍需完善 金融数据服务是开展金融数据管理活动的最终目的和数据资产价值的体现。伴随着互联网金融和金融科技的发展,金融数据应用的商业模式不断更新、服务效率极大提高,出现了金融机构和金融客户前所未有的双赢格局。但是,由于新金融场景不断涌现,金融业态界限越来越模糊,其业务表现形式复杂多样,部分新金融企业产品形式多样鱼龙混杂,再加上金融数据获取和传播方式的便捷性、金融科技技术的开放性和即时性,导致金融数据服务能力难以评价,金融数据服务的服务对象、服务内容、服务模式、管理模式、服务质量等要素难以标准化。通过合理地运用金融数据,对所掌控的数据资产进行加工、处理、整合、利用和反馈等,不断挖掘数136、据资产的价值,为创新金融的内外监管,提高服务效率和支撑产品优化以及新产品开发,实现向客户提供高质量的服务为目标,提供了全新的思维和技术支撑。金融数据应用已经从学术界走进了产业界,无论是金融管理部门、商业银行,还是非银行金融机构,对存量数据的利用在各个专业领域已遍地开花结果,但金融行业数据资产价值的增值理论和数据服务能力体系鲜有出现。1.缺乏可量化缺乏可量化、可追溯可追溯、个性化的个性化的服务模式服务模式。不同类型的服务对象对数据需求是不一样的,对服务对象产生的价值也会千差 75 万别,数据价值的充分发挥不仅受服务模式的制约,也受利益相关者知识水平的制约。当前,对于数据服务执行过程评价指标缺少记137、录和量化,无法进行个性化的服务推荐以及更好地对服务过程进行监督。2.数据服务数据服务管理管理模式不统一模式不统一。由于金融数据应用的新模式、新业务复杂繁多,而对应的数据应用管理模式的创新没能及时跟上,导致金融数据应用缺乏标准化的服务制度、服务流程、数据格式、数据准入流程、数据价值展现方式和数据定价方式等,使高质量和高性价比的个性化服务模式受到一定的制约。3.数据数据服务质量服务质量难以保障难以保障。为了向利益相关者提供高质量的服务,充分提高数据价值,金融数据应用市场缺乏严格的数据准入制度,确保每一类目每一项数据都有利用价值。金融业数据应用,包括了计划、采集、存储、共享、维护、应用、消亡等阶段,138、在数据生命周期的每个阶段里,都可能引发各类数据质量问题,由此影响数据服务质量。因此,需要金融机构保障数据质量,包括数据完整性、准确性、有效性、时效性、一致性等,对数据进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平以提高数据质量。同时,也需要建立衡量数据服务质量和效率的评价体系包括:服务数据质量、服务响应时间、服务价格、服务可靠性、服务可维护性和服务安全性等。数据价值提供方输出的价值,只有向各利益相关者提供高质量数据服务,其价值才能得到有效体现。金融数据服务需要坚持以服务对象为中心,通过创新服务模式,保证服务质量,确保高 76 效率地传递和提升数据价值,也需要在提高数139、据服务能力的同时,完善数据服务能力评价体系,使金融数据应用市场好评价、好监管。(四)(四)系统建设与数据应用仍然存在割裂系统建设与数据应用仍然存在割裂 金融数据应用研究各种数据,通过数据库和大数据、云计算、人工智能等数字化技术解决金融业务问题。金融业务应用是目标,数据应用是手段,业务管理在系统中落地,为数据应用提供了数据基础,反过来,数据应用又反哺业务,两者相辅相成,相互推动进步。当下,银行、证券、保险等机构虽然都展现了其强烈的数据资产挖掘需求,但金融机构原有的数据管理体系仍无法实现将数据真正变成企业级的资产来服务于各类业务需求。金融机构现有业务系统的数据存储分散,各个业务部门数据标准不统一,140、无法形成有效的系统管理;各部门数据无法打通,“部门墙”现象严重,数据重复建设造成资源浪费;数据系统无法对业务形成有效决策支撑,实时、快捷、智能型的数据能力无法实现;各金融数据所有方之间数据分割严重,数据壁垒意识强烈,囿于自身商业机密和利益保护,数据共享流通也受到限制。由此可见,金融系统建设与数据应用仍然存在着割裂,这些“数据孤岛”问题严重影响金融服务的数字化转型进程。如何打破壁垒,实现数据权益与数据提供者的安全、高效科学匹配,是一大挑战。中小金融企业数据应用主要通过手工台账完成。一些中小金融企业,业务人员习惯手工台账记录,然后用 EXCEL 加工生成 77 数据应用,系统建设的意愿比较薄弱。系141、统数据质量无法满足应用要求。由于缺乏数据标准(即使有标准,但标准落地执行不力),各系统在建设过程中独立开发,为后续数据采集、整合带来了诸多壁垒,当数据需要共享和应用的时候,就会发现口径不一样、不准确、不完整等问题。系统建设无法满足应用碎片化要求。数字化时代,业务需求和客户需求都在快速变化,支撑业务应用的数据需求要满足快速化多样化的要求,这对系统建设者提出了前所未有的专业能力要求,在没有把握的情况下,系统建设者可能会抑制数据应用需求的实现。数据应用各自为政,数据资产无法沉淀。某些金融机构对系统功能重视程度远远高于内在数据资产价值,随着系统建设和数据应用的深入,功能不断更新、迭代,但没有积累有效资142、产,数据无法融通应用,复用率低下,数据资产价值无法发挥其应有的价值。另外,不同业务线条根据自身分析的需要提出的数据应用需求没有得到有效管理,各开发团队各自为政,自行开发,资源浪费严重,数据资产价值低下。缺乏统一的数据运营机制。金融系统建设和数据应用的桥梁是良好的数据运营机制,包括建设企业界数据运营中心,负责数据应用建设方法、规范、流程的落地等。需要制定统一的数据应用建设方法,确保数据的一致性、确保提供数据的可信以及数据质量。建立数据应用流程,确保各环节有效协同,明确各环节不同角色的分工以及持续对流程进行优化。78 数据产权机制不明确、数据要素定价困难、用户自主权低等导致金融系统之间的数据融合应143、用受限。当前,金融业在数据应用过程中,存在数据产权不清晰、产权认知存在差异、产权易丢失等问题,造成数据在流通、交易、使用过程中出现权属模糊地带,导致市场规范性变差等现象。其次,数据要素定价面临定价模型复杂,以及容易稀释的痛点。金融业数据应用面临着复杂的应用场景,包括数据查询、数据分析、机器学习等等。在数据使用过程中将产生大量的数据分割、中间数据产生和最终的结果数据,如何对这些不同粒度的数据资产定价、如何评价数据使用流程中各个数据产生的价值,对数据要素进行定价,如何使数据资产价值以市场化的方式计量,并保障数据资产权属利益,是另一大挑战。最后,金融机构在数据应用的过程中,一旦将数据传出本地的管理域144、之后,就会丧失自主权,包括身份自主权、数据自主权、算法自主权等。失去自主权之后,数据应用方对于数据的二次使用和二次分发,将变得不可控。为了避免系统建设与数据应用存在的割裂进一步加剧,需要完善系统建设和数据应用的顶层设计,分阶段解决金融数据要素确权、数据安全共享流通、数据治理与业务流程标准化等问题,在数据应用过程中,不断迭代完善数据标准及功能,构建数据应用互联互通能力,实现各应用数据的融合,提供统一管理与应用,全面提升基于数据的智能化服务能力,实现系统建设及应用的迭代升级。79(五)(五)数据产品创新能力不足数据产品创新能力不足 金融数据价值挖掘、数据产品研发,用数据为业务赋能,逐步成为各金融企145、业发展探索的新领域,然而因数据产品创新乏力,“智能数据+金融”的发展目前尚处于起步阶段。虽然随着人脸识别、OCR、安防等数字化手段的发展,金融机构在业务体验方面得以改善。但其数据产品单一,难以大规模应用,除人脸识别技术成熟度较高,可以大范围推广使用之外,其他产品暂不具备大规模应用的条件。根据外部报告显示,只有 15%的金融机构使用 AI 大数据与同行竞争,银行业对 AI 大数据的部署远远落后于其他行业。金融机构在办理业务流程方面客户的体验严重比互联网行业要差,相比其他行业来看,发展仍比较缓慢。金融数据智能化应用研究的门槛高、投入大。尽管在当下金融数据智能化应用研究已是大势所趋,研究氛围浓厚,但146、对于大多数中小金融机构而言,AI 大数据依然是一个新兴而未知的领域,发展过程中仍然面临困境。新兴科技公司想要进入该赛道将面临较多的壁垒。其一,新兴科技公司缺乏高端人才储备,我国 AI 大数据人才培养的时间不长,在学术界以及产业界高端的 AI大数据技术人才十分稀缺,而拥有高端人才是企业发展的核心推动因素。其二,中小金融机构 AI 大数据研发投入高导致自主创新困难,对外合作不易。相较于大型金融机构,资金缺陷和高素质创新人才不足使得中小金融机构面临无法自主创新和科技外包风险高的两难抉择,同时研发投入高昂导致投资难以持续。例 80 如中国平安近十年的研发投入近千亿元,研发支出高昂导致中小金融机构难以对147、 AI 大数据技术持续投入。金融业务场景复杂,数据智能化应用合规风险大。金融细分业务众多且流程复杂,金融数据智能化应用需要非常强的金融场景理解能力,这离不开对金融业务深入了解的业内专家的深度参与。同时,金融行业的天然特性决定了监管对金融机构内部合规和风控要求高。由于监管的要求严格,以及对于数据安全性的考量,金融数据智能化研究一直都处于浅层次应用,不敢深入。金融数据流通受限,数据应用创新乏力。AI 大数据技术相关算法的迭代优化需要数据作为支撑,拥有海量优质的金融数据将成为科技公司提升自身实力的重要基础。虽然金融行业的数据积累量较大,但由于金融数据产权机制不明确、数据要素定价困难、数据质量难以保障148、、用户自主权低等原因,导致金融业在数据要素安全流通时受限。另外,金融监管对金融数据的管理日趋严格,除公开的金融市场交易数据外,各家金融机构出于金融数据安全考虑,很难主动向金融科技公司开放其内部数据,在一定程度上制约了 AI 大数据在金融领域的创新应用。81 五、发展建议 以数字科技为代表的新一轮科技革命已经深度渗透到社会经济领域,构筑起丰富多样的数字生态系统,改变了工业革命时代形成的基础经济结构和社会结构。数字经济的核心要素与基础是数据,而金融行业作为数据密集型和科技驱动型行业,金融数据是支撑金融活动实现价值管理的重要基础,其安全治理与价值实现是保障金融业创新稳健发展的关键所在。数字经济时代,149、金融行业正不断发生颠覆性变革,相关立法与规则制定工作也在不断推进,但从目前来看,虽然在金融数据的安全性保障方面已经有了基础的法律保障,但金融数据质量、完整性和精准性等方面仍然有待建立一套统一规范的标准体系,金融数据的共享程度也相对较低,金融数据应用创新与价值释放仍显不足。因此,强化金融数据治理、推进金融数据流通、发掘金融数据价值对新时代金融业建设与经济高质量发展意义重大。金融数据的共享流通是信息化时代经济发展的重要助推器,金融数据共享能够激发行业创新,增强金融服务与客户的互动,优化用户金融服务的体验,对于强化金融风险管理,提升金融消费者保护效果、推动金融服务和产品创新,加快金融业数字化转型,充150、分激发金融业对于数字经济高质量发展的赋能作用具有重要意义。但由于金融数据具有较高敏感性,除隐私性外,部分还涉及商业秘密乃至国家安全,在保护与利用上需要建立区别于一 82 般数据的管理措施。个人信息保护法及征信业务管理条例等相关制度虽然从底层个人信息保护及信用数据管理方面指明了方向,但对于金融数据的利用与流通方面的标准与规则体系仍在建设中,这也导致金融机构等在金融数据的共享与流通上存在较大顾虑,制约了金融数据的应用创新与发展。随着大数据、云计算、人工智能等新兴技术与金融行业的深度融合,金融大数据应用已成为行业热点趋势,在交易欺诈识别、精准营销、黑产防范、消费信贷、信贷风险评估、供应链金融、股市行151、情预测、股价预测、智能投顾、骗保识别、风险定价等涉及银行、证券、保险、支付清算和互联网金融等多领域的具体业务中,均得到广泛应用。与之而来的个人隐私安全性问题也越发凸显。为了进一步推动金融数据应用可持续发展,金融机构需要严格遵守相关法律法规,积极面对数据安全问题,建立数据安全的策略与标准,保护客户隐私,合法合规使用和应用数据,保障数据安全。(一)(一)加大政策支持与标准供给加大政策支持与标准供给 金融数据的融合与共享有利于为金融行业提供新的盈利增长动力,能够充分激发金融行业的创新,对整个金融行业的效率提升至关重要。当前,我国金融数据融合应用正处于起步阶段,虽然潜在市场很大,但数据的共享和流通机制152、还有待建设完善,不同类型的数据融合分享平台呈现出多元化、分散式等特征,尚未形成规模。同时,金融数据分享的相关法律及制度建设也有待 83 进一步完善,比如金融数据分享的合作模式、标准框架以及实施规划等问题还待进一步明确。此外,金融数据分享中的隐私保护和安全问题也面临着挑战。为了进一步完善我国金融数据共享,可考虑:一是加快完善金融数据治理政策法规,进一步夯实我国金融一是加快完善金融数据治理政策法规,进一步夯实我国金融数据共享流通的制度基础。数据共享流通的制度基础。加强金融数据监管的顶层设计,加强政策引导,完善既有的监管体系,对数据共享模式、数据开放范围以及信息安全等方面予以明确。同时,完善数据共享153、的管理机制,制定准入及退出机制,明确追责制度和应急补救措施,并探索高效的监管举措,保护个人数据安全性,以及保障市场主体有序、合规地开展数据共享流通。此外,针对金融数据对于金融风险防控的重要作用和特殊性,强化金融数据支持金融风险防控数据模型建设的相关制度保障,发挥数据在反洗钱、反恐融资、反逃税中的基础作用,强化金融风险管理。二是强化标准引领,进一步细化数据及技术标准。二是强化标准引领,进一步细化数据及技术标准。建议进一步完善金融业数据标准体系,加强金融数据分级分类管理,在安全保障基础上推广数据安全融合技术等创新技术解决方案及标准体系建设,确保数据全生命周期安全,在此基础上推动金融业数据的流通共享154、与应用创新,促进数据价值的进一步释放。在数据共享标准方面,建议进一步明确可分享的数据范围、数据格式、传输规则、安全控制、存储及删除等要求,确保数据在不同端口间传输的一致性和可用性;建立数据共享分层管理原则,对敏感度较高的金融数据采用脱敏、标签化、加密等方法,实现数据多 84 种形式的互联互通。在技术方面,目前数据可携带权实现路径尚未明确,以隐私计算为代表的多方安全计算等技术创新,是可以实现金融数据共享的重要探索,可考虑探索制定可操作性强、量化指标明确、与行业应用特征及技术水平切合的标准体系,实施具有公信力的技术认证等措施。三是吸收国际经验,探索多种数据流通共享模式。三是吸收国际经验,探索多种数155、据流通共享模式。可以构建以客户授权为基础,以数据聚合商为桥梁的金融服务生态体系。加强金融机构、科技公司、第三方商户等各参与方数据互联互通,提高标准化程度及对接效率,并建立围绕数据事前授权、事后跟踪管理以及应急补救等机制,保障客户金融数据开放分享中的自主可控权。还可以探索建立以多方安全计算、联邦学习、可信执行环境技术为基础的跨主体数据安全分享平台,数据共享者成立联盟,共同搭建可信、可控的行业云,实现“可用不可见”“数据不动价值动”的金融数据共享模式,更好地释放金融数据的价值。四是进一步优化数据安全组织管理和技术水平,积极应对金四是进一步优化数据安全组织管理和技术水平,积极应对金融数据分享中的安全156、挑战。融数据分享中的安全挑战。首先,市场主体要从被动防御转向主动防御,鼓励能够有效对抗网络威胁和漏洞的信息科技平台企业的发展,为金融机构提供动态化的、丰富的数据安全管理信息,对网络安全和数据安全威胁能够及时主动识别并有效防御。其次,建议金融机构加强金融数据安全管理体系和制度建设,提升数据安全的风控水平。最后,充分发挥科技的作用,借助隐私计算、区块链、人工智能等技术,提升数据分享效率,不断优化数 85 据保护技术水平,加强网络安全产品创新,推动网络安全态势感知、风险识别、行为识别等技术的实施,提高对数据安全威胁的防护能力。(二)(二)推进数据安全体系落地推进数据安全体系落地 金融行业作为高度数据157、密集型行业,在全面实现信息化加速推进数字化建设的进程中,积累了海量的金融数据,这些数据具有数据内容复杂、数据类型敏感、数据价值密度高等特点。随着金融科技的创新应用程度不断深化,数据已经成为金融机构重要的生产资料,其应用已与金融业务场景产生深度结合,对金融机构的运营、营销、风控与客户管理等工作的影响和重要程度也愈加凸显。加强金融数据利用、充分发挥数据要素价值,能够服务金融机构业务创新发展、助力金融机构服务能力提质增效,但同时,也对金融机构的数据安全保障提出更高要求。近年,中华人民共和国数据安全法中华人民共和国个人信息保护法已正式实施,与中华人民共和国网络安全法共同构成数据安全领域基本法律框架,也158、为金融机构数据安全保护工作指明方向和道路。金融科技发展规划(20222025 年)中国人民银行金融消费者权益保护实施办法 对金融机构的数据安全保护能力提出了明确要求,JR/T 01972020金融数据安全 数据安全分级指南,JR/T 02232021金融数据安全 数据生命周期安全规范也已在金融领域发布实施,为金融机构的数据安全体系建设提供了具体的参考与指引。随着数据安全领域 86 法律法规政策不断出台,对于金融机构来说,无论是出于外部监管合规要求,还是内部运营风控需要,开展数据安全体系建设与实施工作早已刻不容缓。1.1.数据安全体系建设数据安全体系建设 当前,大多金融机构已经意识到数据安全的重159、要性,也有不少机构已经建立了相关的数据安全管理制度并采取了一定的数据安全防护措施,但由于金融数据复杂多样、体量庞大,且数据流转环节错综复杂,数据泄露的风险点位众多,导致金融机构的数据安全防护策略难以实现全量数据以及数据生命周期的全面覆盖,数据安全体系落地的有效性难以保证。本节总结了其数据安全体系建设的核心思路和方法,为金融业机构数据安全体系建设与落地实施工作提供参考。众所周知,数据只有通过不断流转和应用才能实现其价值释放。因此数据安全防护体系并不是一套使用技术工具简单堆砌起来的产品级解决方案,而是包含了从决策层到技术层,从管理制度到技术应用,自上而下贯穿整个组织并涵盖数据全生命周期安全保护的完160、整链条,同时要兼顾自身业务发展,在数据安全和数据应用之间做好平衡。该商业银行在参考国内外相关标准及实践案例的基础上,充分结合机构自身特点,制定了以“数据安全使用”为目标的数据安全防护体系建设规划,见图 4。主要依据 JR/T 01972020 中的定级规则和 JR/T 02232021 中建立的安全框架,以数据生命周期安全保护为主线,数据分类分级为抓手,从 87 数据安全管理和安全技术两个层面进行规划并开展数据安全防护体系建设工作。图 4 数据安全防护体系建设规划 在数据生命周期安全管理方面,根据数据分类分级结果,针对不同安全级别的数据,制定其在采集、传输、存储、使用、删除、销毁等生命周期各环161、节的安全防护要求。在数据安全管理层面,建立了覆盖机构内部组织建设、制度流程、人员能力、安全规划、安全考核和外部第三方机构管理的主要架构,为数据安全相关工作的组织和落实奠定基础。在数据安全技术层面,以数据资产为核心,建设“云管端”三道数据防线,构筑数据安全流动边界,实现数据全生命周期安全保障。在数据安全体系建设工作开展之前,该商业银行已建立由安全治理、安全管理、安全技术、安全开发、安全运营、安全验证 88 六个领域组成的网络安全体系,在此基础上,聚焦于数据安全相关的四大能力:组织建设、制度流程、人员能力、技术工具,有的放矢地提升数据安全能力。第一,明确数据安全管理组织架构。基于银行现有的组织架构162、,明确每个部门的职责与分工,每个岗位的权利与义务,建立决策、管理、执行、监督四层数据保护组织架构,确保数据安全防护体系有效执行。具体分工如下:网络安全和信息化领导小组、数据治理委员会负责数据安全方针政策及重大事项的决策;各信息科技部门、业务主管部门、风险管理部门、合规部门等负责数据安全管理工作;各科技职能团队、业务数据管理团队聚焦每个数据安全场景,落实数据安全管理要求;内控、审计部负责数据安全防护工作的监督检查。第二,建立健全数据安全制度体系。根据金融合规、风险管理、业务发展、隐私保护等各方面要求,制定数据安全管理政策,确定数据安全防护控制策略。按照方针政策、管理办法、实施细则、手册表单四层制163、度体系,制定或修订数据安全管理办法、客户个人金融信息保护工作管理办法、零售数据管理办法、数据安全分类分级原则及方法、数据销毁技术规范、隐私政策、客户个人信息保护突发事件应急预案等规章制度,将数据安全管理要求融入各项业务及科技制度之中。第三,开展形式多样的数据安全培训。一方面,在内部学习平台的培训课程、新员工入职培训等活动中增加数据安全培训内容,同时邀请专业律师、行业专家开展专题讲座,提升员工数据 89 安全防护意识和防护技能。另一方面,安排数据安全专职人员参加各类专项培训与考核,确保数据安全岗位相关人员具备执行数据安全工作所需的数据安全管理能力、运营能力、技术能力和合规能力。第四,提升数据安全164、防护技术支撑能力。以数据资产为中心,在现有的网络安全防护体系的基础上部署各类数据安全工具,并将这些工具融合到整个数据安全防护体系当中,确保安全、体验、效率并存,以有效实现对数据的安全管控。其中主要部署的数据安全工具包括终端安全沙箱、应用流量数据安全监测系统、邮件防泄露系统等。数据安全体系建设工作并非一蹴而就,而是需要在各方面进行持续改进和不断完善,在跟进最新数据安全法律法规、标准规范以及监管要求的基础上,定期对数据安全组织架构、规章制度、标准流程、控制策略、技术工具等方面的执行情况和有效性进行审查与安全评估,并对发现的问题进行及时整改,形成安全体系持续优化、不断完善的良性循环机制,提升机构的数165、据安全应用保障能力。2.2.隐私计算技术体系建设隐私计算技术体系建设 隐私计算作为数据安全的前沿技术,为金融行业提供了传统信息处理方式难以实现的数据安全保护方式。隐私计算是在不影响保密性的情况下安全地共享、汇集和分析数据,在数据、软件或硬件层面保护个人和敏感信息。通过硬件、密码学或分布式等 90 手段,在数据的使用过程中保护数据原始信息的隐私性,实现数据可用不可见。使得数据使用者无法接触到原始数据,从而达成数据使用权与所有权分离。该项目技术包括隐私查询、可信执行环境、多方安全计算、联邦学习等配套技术,为数据交易过程中的数据查询、数据分析及挖掘等提供密态数据计算,确保数据披露的最小化,有效的事后166、追责及责任认定。金融机构的合规流程中有很大一部分是基于名单对比的异常检测。但通常客户名单都非常具有敏感性,各机构都不会分享自有客户名单的明文信息,也不会接受比较容易破解的密文信息。针对此类数据处理需求与传统处理手段之间的问题,基于隐私计算技术就可以完全解决。隐私求交、匿踪查询等前沿隐私计算技术可以完全实现客户名单在比对的过程中数据披露的最小化颗粒度。另外隐私计算技术可以满足数据不离开本地且实现跨机构隐私数据的联合计算。该计算技术可以用于金融场景中的风控和营销场景。这两类应用场景都需要运用大量数据资源进行联合建模,利用多元化数据提升用户画像的准确性,识别高风险客户以及发掘潜在客户价值。隐私计算包167、括了众多领域交叉融合的跨学科技术,打通数据孤岛,实现数据的安全和流通。针对在不同金融机构间或者同一集团下各个子公司间的数据互通需求,依托于隐私计算技术可以实现数据合规流通的“可用不可见”。91(三)(三)构建数据服务闭环构建数据服务闭环 数据服务以服务资产(报表、指标、标签、明细数据等)为载体,以满足数据消费者的服务需求为目标。数据服务一直是数据应用建设的重要组成部分。传统的数据服务一般遵照项目制模式,收集梳理的服务需求后,企业启动一个相应项目,按项目流程进行需求分析、系统设计、开发测试、投产上线,然后消费者可以使用相应的数据服务。在项目制模式下,需求的管理、标准的统一、质量的管理等都是一次性168、的、仅在项目周期内存续。一般在投产后系统进入平稳期后,数据服务即固化下来,几乎不存在质的提升。另一方面,跳出从单个系统和应用来看,数据服务并没有一个完整的全貌,缺少共享复用,造成软硬件和人力资源的浪费。加之前文“系统建设与数据应用仍然割裂”中所描述的诸多原因,使得传统的数据服务模式越来越无法使服务用户满意。1.1.新数据服务模式新数据服务模式:集中共享、闭环运营:集中共享、闭环运营(1)产生背景 随着数字化转型的大势所趋,各个企业对数据服务越来越重视,除了之前的“数据准确、使用便捷”外,更对“快速响应,灵活自助”有了更高要求。这里的快速响应,不仅仅是指使用服务时系统的响应速度,更是指从用户需求169、开始到需求得到满足之间的时长。传统项目制模式下,这个时长一般以月计,但现在企业 92 的诉求则是:周、天,甚至是小时、分钟。显然,之前的项目制服务模式已经完全不能满足当前的数据服务需求,新型服务模式应运而生。(2)原理 将企业的数据服务(报表、指标、查询等)进行标准化、集中化进行管理,并在企业层面进行共享服务,形成以企业数据服务地图为中心,以数据服务中台为载体的数据服务闭环运营体系,支撑企业更高效地进行业务探索和创新,以数字化资产的形态构建企业差异化的核心竞争力。2.2.闭环服务体系的组成闭环服务体系的组成(1)数据服务地图 数据服务地图是企业数据服务的“黄金视图”,是企业数据服务的统一、权威170、入口门户。针对不同的服务用户,通过丰富的展现形式、搜索功能、分类标签等手段,让服务用户按需查找满足自己需求的数据服务,如固定报表、多维分析、自助服务功能与数据接口等等。(2)服务需求管理 对于当前服务地图不能满足的需求,数据用户可以向数据服务运营岗提出服务需求。(3)服务运营管理 服务运营岗作为企业数据服务的责任部门,将保障日常数据 93 服务的可用性、时效性、可靠性、安全性。同时,服务运营岗还负责接收新的服务需求,并委托开发团队对数据服务进行设计开发。开发团队完成服务上线后,服务运营岗负责服务的上架更新,以及数据服务地图的同步维护。(4)数据服务监控 可分为服务热度分析、服务价值分析、加工链171、路分析、用户关注分析、用户评价分析。可设置合适的指标(体系)来予以参考。评价与反馈是数据服务运营的重要组成部分,也是最能够体现出闭环机制的亮点。通过数据服务最终的用户评价以及干系人的反馈,进一步促进数据服务管理、开发的专业水平提升。(5)组织岗位设置 为达成数据服务闭环的目的,需设置“数据服务运营岗”。该岗位的要求主要是对本机构数据资产非常熟悉,能够与各相关方有效沟通,并着手构建全局视角的数据服务地图。该岗位需直接对接业务人员,总控服务需求。“数据服务运营岗”根据服务资产现况,给开发人员分配新的开发任务。(6)技术平台 应建立数据服务中台实现上述服务地图、运营管理、监控管理等功能,该平台与现有172、各类数据资产打通,提供一站式数据服务。(四)(四)建设数据友好型系统建设数据友好型系统 建设数据友好型系统,要形成数据从生产、采集、存储、使 94 用和销毁的全方位闭环管理,覆盖从数据形成到使用再到价值创造的各个环节。首先数据的产生,在数字化转型时期,金融机构对数据的需求发生了翻天覆地的变化,所需的不再是单一种类的数据,而是包括结构化和非结构化的数据、机构内部和外部的数据、客户的金融数据和行为数据等各种类型。其次是数据的采集。数据产生后,需要通过标准化接口或者其他方式把数据采集到数据池,然后将数据根据一定的规则存储,形成数据资产,方便各部门对数据的灵活使用。比如,可以通过数据模型化把数据资产沉173、淀下来,给后续使用提供基础。再然后是数据的使用。利用现阶段的前沿技术提升数据的利用价值,包括使用人工智能、可视化分析、知识图谱、隐私计算等技术。最后,对过期数据、无效数据、垃圾数据的删除、清理、销毁形成了对数据管理的闭环。1.1.以应用数据为牵引,构建系统设计以应用数据为牵引,构建系统设计 在金融机构数字化转型的过程中,对数字化的管理和营销有了更高的要求,产生了应用数据这一概念。应用数据与业务数据不同,应用数据是对各业务链路进行层层拆解,根据管理和评估指标做的记录和量化,包括过程评估指标、结果评估指标、客户反馈信息等。可用于数据模型、数据质量管理、数据安全。推进应用数据的生产、采集、使用、存储174、是金融机构数字化转型的目标。建设数据友好型系统,规划金融机构的数字化转型,首先要解决数据有无的问题,把应用数据纳入系统设计。应用数据建设是一个反复迭代、持续优化的过程,不是一个 95 一劳永逸的事。业务系统在模型设计之初,就应该考虑将新产生的应用数据收集、传输至数据模型来修正偏差。只有让数据在应用中形成迭代使用的闭环,才能使数据模型的策略不断改进、不断精准。对于新开发的系统,需要提前考虑数据内容、数据采集、数据策略、数据回收等问题,以此为牵引来开展各类信息系统建设。对于已有的系统,通过评估各系统新增应用数据建设的支出与收益,评价结果为正收益的系统也要加快细化、优化和改造系统的步伐。2.2.以业175、务数据为导向,强化数据支撑以业务数据为导向,强化数据支撑 传统的系统开发是以实现业务为目标,所有的功能都是为满足现有业务而生,缺乏对业务数据的统筹规划、对取数和用数效率的考虑、对过程评估数据的设计。建设数据友好型系统要注重以业务数据为导向,强化数据本身的功能,既满足现有业务需求,又满足数据灵活取用的目的,还要符合构建数据模型等数据资产的要求。这样一来,虽然加大了数据规划和设计的难度,但是极大提升了数据对整个业务的支撑。对业务数据的统筹规划涉及面广,在数据采集阶段,要根据不同的业务场景拓宽数据的维度,包括实时数据、过程数据和流式数据等等。在数据可视化分析阶段,要考虑数据不仅帮助管理者更深入研究和176、理解数据,也可以迅速吸引用户眼球,更好地帮助其了解数据之间的关系。在数据模型阶段,数据友好型系统代 96 表既要支持同一模型多系统部署、同一业务多模型应用,也要支持结构化和非结构化数据的回收与分析,以便于数据模型迭代优化。3.3.以统一标准为抓手,打造数据架构以统一标准为抓手,打造数据架构 数据标准化是数据应用的基础和前提。然而对很多传统银行来说,由于受到“部门银行”机制的影响,数据分布在多个不同的业务系统中,系统和系统之间数据标准不统一、口径不一致。数据资产的分布也没有一个统一的标准,有的在线上,有的在线下,甚至还有第三方数据。统一数据标准,显得尤为重要。然而,数据标准化是一个亟待解决但是又177、艰巨复杂、涉及广泛的系统性、长期性工作。即使做到了统一标准,在执行标准的过程中,仍然会因为效果不明显、重视程度不够、落实不到位等原因出现治理和污染同时存在的问题。对于金融机构来说,首要的是建立数据层企业级架构。不同于系统层企业级架构,是基于对“系统竖井”这一现实问题的基础,对机构系统进行盘点梳理,合理制定一套企业级数据标准体系。避开了对信息系统的大拆大建,避免了对已有信息系统资源的浪费,但需要制定一套在不同系统中映射和统一的数据标准。现阶段成熟的大数据技术可成为工具之一。数据层企业级架构引入的大数据平台在满足海量数据存储的同时,数据操作也能快速响应,从而形成跨系统、跨机构、跨渠道、跨产品的数据178、信息,对外提供数据服务。97 构建统一标准不是对现有系统进行推倒重建,但可以做到各个不同的系统之间数据是一致的、准确的。这样既不会影响现有的业务和应用,也不会影响金融服务的效果。需要强调的是,业务在快速发展、市场在快速变化,对于尚未建立系统层企业级架构的传统银行来说,建立数据层企业级架构则具有成本低、可操作性强的特点,投入较少、收益却大,既是实现应用数据这个关键目标的现实选择,也是最佳选择。(五)(五)加强数据驱动型产品建设加强数据驱动型产品建设 通过数据驱动业务发展已经是当前普遍共识,但是数据从整合、清洗、加工、分析、建模、应用到最终辅助决策,所要经过的处理环节太多,对绝大多数非 IT 背景179、的数据消费者而言,数据处理的成本过高,所以通常做法是将一系列的数据处理工作进行封装,形成开箱即用的数据产品,降低数据消费者获取和应用数据的门槛。但是数据产品本质上还是属于“产品”,数据产品的研发和应用不是一次性的数据消费,数据产品也需要遵循产品全生命周期管理的方法进行建设。由于数据产品的形态各异,比如决策模型、风控规则、营销商机、数据看板、标签、指标等等,都属于数据产品的范畴。数据产品又与传统的 CRM 系统、风险规则引擎等大型平台工具不同,数据产品如同毛细血管遍布在各种类型的数字化经营场景中,特点是多而杂、小而精。因此,单纯依靠研发人员或者业务人员的经验进行产品设计、管理和创新是不够的,应当180、探索一条通过数据驱动产品建设的路径:建立平 98 台管理数据产品的统一视图,构建数据产品的数字化运营闭环,洞察数据消费场景提炼产品,最终实现数据产品的创新建设。1.1.建立平台管理数据产品的统一视图建立平台管理数据产品的统一视图 数据产品具有多样性,且分布在各个业务领域和应用系统,要实现数据驱动产品建设,首要任务是启动数据产品的数字化管理。数据产品可以由各领域分别设计、研发和应用,有些数据产品独立服务,有些数据产品依托于应用系统,但是需要有企业级的数据产品统一视图,管理、分析和共享所有数据产品的信息要素。因此可建立数据产品管理平台,开放统一规范的接口,向支撑数据产品研发和应用的相关系统,以线上181、化的方式,收集数据产品的各种信息要素,内容包括:数据产品的数据源信息、技术属性、业务属性、用户对象、使用行为和应用效果等。一方面,数据产品统一视图实现信息共享,让各个业务领域的数据消费者可以看到企业的数据产品资源,提高数据产品的复用率,并激发数据产品建设的灵感。另一方面,所收集的信息要素,也为下一步数据产品的数字化运营提供分析洞察的素材。2.2.构建数据产品的数字化运营闭环构建数据产品的数字化运营闭环 借助构建数据产品统一视图的过程,将数据产品全链路的信息进行线上化收集和系统化管理,在此基础上构建数据产品的数字化运营闭环。改变过去“重研发、轻运营”的思路,让数据产品不仅做好,也要用好,真正发挥182、数据价值,并且能够持续优化 99 和创新。首先,对数据产品可用性进行统一监控,包括数据和功能的可用性,快速定位数据产品的服务异常,分析业务影响,保障数据产品服务稳定。其次,是对数据产品的使用情况进行监控分析,包括数据产品的接口调用次数、活跃用户、服务业务领域,提升数据产品的使用率、复用率,针对不活跃的数据产品进行调研,收集问题进行优化。最后,是对不同类型数据产品的应用效果进行差异化、模板化分析,比如针对预测模型,要监控模型准确率、召回率等指标监控;针对营销产品,要监控营销转化、业绩提升指标;针对风控产品,要监控管控率、不良率指标。通过对数据产品全过程的数字化运营分析,驱动产品进行持续的优化和改183、进。3.3.洞察数据消费场景提炼产品洞察数据消费场景提炼产品 开展数据产品全过程监控的目标,是收集数据、分析数据,借助反馈数据开展产品的迭代,驱动产品优化和新产品研发。建议拟从数据、用户和场景 3 个视角洞察数据消费场景,实现产品创新。(1)洞察重要价值数据 通过对数据产品数据源信息项、使用频率、业务效果的穿透式分析,可以反向定位到高价值的数据源,提炼数据频繁组合项,一方面用于指引数据底座团队对高价值、频繁组合使用的数据进行沉淀,另一方面反馈到数据产品的研发人员、使用人员,推荐高价值数据源,用于数据产品的优化。100(2)洞察核心数据消费者 过去在数据产品研发过程中普遍存在一个问题,即提产品需184、求的人不一定是最终的使用产品的用户,比如总行归口管理人员提出产品研发需求,但是产品上线后的实际用户是更广泛的分行用户。通过对记录数据产品使用行为,可以追踪到终端数据消费者。通过分析高频使用产品的数据真实使用者,识别重要数据伙伴,开展精准的用户调研,定向收集数据服务的一线需求声音,开展数据产品的提炼和优化。(3)洞察待补缺的数据服务 借助数据产品统一视图的建设,对数据产品进行细粒度打标,标注数据产品当前的服务场景、部门、产品、客群、应用系统等维度信息,形成企业级的数据产品地图,从业务视角分析,定位未被满足的数据服务场景,构建新数据产品,补齐产品服务矩阵。4.4.数据驱动改变产品开发模式数据驱动改185、变产品开发模式 在传统的产品开发模式中,关于要不要做某个产品、产品的市场前景有多大、产品该具有什么样的特征往往依赖于经验主义,定量的数据分析很缺乏。但是,在经验主义之下,很少有人能保证自己的想法是百分百正确的,时常会出现一个团队投入大量人力物力开发出一款产品,信心满满地将产品推向市场后却收效甚微的情况。在互联网时代,我们具备了用定量的数据分析的方式来支持 101 产品成长的基础设施和能力,也就是数据驱动产品建设。在数据驱动模式下,产品的开发始终坚持以数据分析为依据,用更科学的、更客观的方式来替代原有的、常常带有主观意愿的工作模式。这种新的模式值得被广泛推广和应用,将给使用该模式的金融机构带来新186、的业务增长引擎。5.5.数据驱动产品建设的方式数据驱动产品建设的方式 数据可以从以下多个维度来驱动产品的建设,为产品建设注入新的能量。(1)数据驱动验证需求 当准备启动一个产品的建设工作时,金融机构首先需要想清楚的问题包括:用户的需求是否真实存在?市场空间是否足够大?市场的准入门槛高不高?市场的竞争是否激烈?在传统模式下,金融机构常引入专家建议来回答上述问题,但是,专家也并非每次都能准确地判断和把握市场发展趋势,专家经验也存在失败的可能性。为了更准确地验证需求价值,金融机构可引入数据进行论证。针对用户的“用户调研数据”、针对竞品的“竞品分析数据”、针对市场的“市场发展调研数据”,这些数据是可视187、化的、具体的、可统计的,可以帮助金融机构更精准地对需求进行验证。(2)数据驱动产品设计 关于产品应该被设计成什么样子,直接收集来自用户侧的操作行为反馈是最直接的,A/B 测试是很常用的方式。通过对 A/B 102 测试收集到的数据进行分析可快速验证设计思路的可行性,因而,A/B 测试可大大降低金融机构的试错成本,是非常有效的工具。另外,来自用户侧的直接发声往往是需求的最真实来源,金融机构在产品设计的过程中,可更多地参考来自用户侧的数据,比如从直接的访谈调研或者间接的观察中了解用户的真实诉求。(3)数据驱动产品运营 产品运营包括对业务增长的促进、对产品生命周期的管理、对客户关系的管理等等。在传统188、运营模式下,什么时候该对产品推广采取什么样的策略一些机构往往采用“拍脑袋”的方式来决定,推广活动能否成功具有很高的不确定性,且即使带来了业务上的增长,运营人员也很难判断是活动中的哪个元素产生了正向促进效应。数据驱动模式下的产品运营让数据学会“说话”:通过数据的流失或波动揭示产品特征存在的缺陷、通过科学控制变量的方式揭示业务数据结果与营销策略之间的因果关系、通过对业务数据的分析揭示各渠道的质量、通过充分地使用从各个产品运营的环节中收集到的数据,金融机构可以使其产品运营活动做到有的放矢,真正实现“科学地取得成功”。(4)数据驱动产品决策 产品在建设的过程中会面对很多并行的待办事项,如何从千丝万缕中189、识别出重要程度最高的事项对金融机构而言是不小的挑战。传统模式下的专家判断可能出现失误,使得产品的实现与用户的实际需求出现偏差,且随着时间的推进,该偏差会越来越 103 大。基于数据来做优先级的判断可以帮助金融机构减少“偏差”,引导金融机构优先实现用户真正关注的产品特征,且大大减少员工之间基于主观认知的无意义争论,提高决策的效率。(5)数据呈现产品演化 金融机构除了可对短时间内产品产生的数据(关注点在业务增长)进行分析外,也可以对一段较长时间跨度内的产品数据进行分析和应用,例如盈利情况的变化、客户群特征的变化、营销渠道的表现等等。长时间跨度内的数据分析帮助金融机构了解产品的演化,识别产品的核心卖190、点,对未来的产品规划起到启发效应。104 六、典型案例(一)(一)隐私计算赋能银行助贷业务自主风控隐私计算赋能银行助贷业务自主风控 1.1.案例背景案例背景 在数字经济时代,数据被列为最重要的生产要素之一,同时也是银行智能风控、智能营销等“数智化”转型的关键要素。一方面,因政策和市场发展层面要求,金融机构在“数智化”转型过程中,需要充分释放数据要素价值潜能。另一方面,随着网络安全法数据安全法个人信息保护法等法律法规相继出台,金融机构在数据安全、隐私保护方面的行业监管日趋严格,如何在兼顾数据安全与隐私保护的同时,实现数据智能的落地应用,成为业界普遍难题。在此背景下,华夏银行联合洞见科技利用隐私计191、算技术赋能银行助贷业务自主风控,提升银行在贷前、贷中、贷后全流程风险管理能力。2.2.案例概况案例概况 针对信贷客户信用风险评级信息分散、银行自有存量数据无法满足风险管控场景需求、出于数据安全与隐私保护顾虑外部机构数据难以有效融合利用等瓶颈,洞见科技基于自主研发的金融级隐私计算平台,联合华夏银行北京分行建立了安全融合外部多维数据的风控模型,为银行的信贷风控部门提供相关审核服务,105 以有效识别信用风险。该模型依托具体业务场景能够显著降低管理信息不对称性与不透明性,提高金融机构管理效率,降低经营及审核成本,优化信贷客户的申请体验,并能够保障数据提供者和数据使用者多方的数据隐私安全,实现外部数据192、安全可控的融合利用。3.3.解决方案解决方案 风控是金融业务的核心。通过补充三方数据可以提升模型性能,有效降低违约概率,提升信贷业务的差异化和精细化管理。基于洞见科技隐私安全计算平台,能够在金融机构与外部机构之间构建安全可控的数据协作通道,在原始数据不出库的前提下,使用金融机构内部客户数据和外部合作数据联合构建风控模型,并基于模型进行实时预测,包括但不限于反欺诈、申请准入、信用额度、利率定价、贷中预警、贷后催收等贯穿贷前、贷中、贷后的风险管理全部流程。在贷前场景,银行可以结合多头借贷、黑名单、团伙欺诈、APP 使用行为等数据进行联邦学习建模,通过模型结果进行综合判断,精准识别潜在的欺诈客户、履193、约风险较高的客户并进行排除。通过社保、公积金、有房有车等数据推断客户的收入和资产,辅助银行进行额度定价。在贷中管理阶段,银行可以结合客户贷中行为数据以及外部三方数据构建风险预警规则和模型,对高风险人群进行预警并采取相应措施。在贷后催收阶段,银行可以结合贷后催收模型结果,对待催收案件进行分案处理,并针对不同 106 的分案情况匹配差异化的催收策略,提高催收效率。4.4.实践效果实践效果 洞见科技协助华夏银行北京分行通过隐私计算的方式,降低行内互联网渠道消费贷产品的贷前风险,提高自主风控能力,在获得客户授权的情况下,安全引入维度丰富的外部数据,联合构建贷前反欺诈模型,取得非常好的融合模型效果(KS194、 0.43、AUC 0.78,较单个子模型效果提升高达 30%),极大提高了对欺诈客户的精准识别能力和风险筛查能力,保护了信贷资产,贷前反欺诈模型结果示意图如图 5 所示。图 5 贷前反欺诈模型结果示意图(二)(二)基于隐私计算的交易电信网络诈骗风险预警服务基于隐私计算的交易电信网络诈骗风险预警服务 1.1.案例背景案例背景 2021 年 4 月 18 日,中共中央办公厅、国务院办公厅印发了关于加强打击治理电信网络诈骗违法犯罪工作的意见(以下 107 简称意见),对加强打击治理电信网络诈骗违法犯罪工作作出安排部署。公安部认真贯彻落实习近平总书记重要指示精神,全面落实打防管控各项措施,全力构建“195、全警反诈、全社会反诈”新格局,坚决遏制电信网络诈骗犯罪案件高发态势,将原有的“两降两升”提升为压降发案率,以维护国家政治安全和社会稳定。意见中指出两个强调和三个要求:强调:坚持以人民为中心,统筹发展和安全,强化系统观念,坚持打防结合、防范为先,坚持科技支撑、强化反制,运用科技信息化手段提升技术反制能力,坚持源头治理、综合治理;建立职责清晰、协同联动、衔接紧密、运转高效的打击治理体系,金融、电信、互联网等行业主管部门要全面落实行业监管主体责任 要求:要依法严厉打击,形成打击合力,提升打击效能;要构建严密防范体系。强化技术反制,建立对涉诈网站、APP 及诈骗电话、诈骗短消息处置机制;要加强行业监管196、源头治理。建立健全行业安全评估和准入制度;要加强金融行业监管,及时发现、管控新型洗钱通道。2.2.案例概况案例概况 基于隐私计算的交易电信网络诈骗风险预警服务项目综合运用隐私计算、多方安全图计算等技术,将运营商数据与银行数据打通,在数据不出域的安全技术基础上,构建电信网络诈骗风险预警模型。其主要成果应用包括:108(1)账户电诈风险识别:面向新开户用户:进行实时风险预测与识别,并进行阻断风险用户开户或交易限额限制;面向存量用户:定期批量对存量用户进行电诈风险识别,并进行阻断风险用户开户或交易限额限制;(2)交易反电诈识别:受害者风险识别:定期批量对指定存量用户进行受害者电诈风险识别,并进行事先197、提醒;交易电诈风险识别:实时对交易进行电诈风险识别、预警和拦截电信网络欺诈交易行为,进一步提升银行风控水平,有效保障客户资金及信息安全。3.3.解决方案解决方案 本项目解决方案包括模型训练和模型上线调用两部分,首先在线下通过联邦学习训练一个电诈风险识别模型,然后再部署到银行实际的应用流程中。其中,模型训练的主要流程如图 6 所示:109 图 6 联邦学习训练过程 部署:需求方与数据源方部署 AVATAR 隐私计算平台;网络:双方以专线或公网白名单的方式打通双方的网络;准备数据:银行数据准备:准备各场景数据样本,包含手机号、Y 值及回溯时间,并上传至隐私计算平台;数据源数据准备:准备全量的 ID198、,可回溯时间;确定数据源方 ID 的加密方式与银行一致;安全求交:双方通过 ID+回溯时间进行安全求交;值准备:数据源方根据交集的 ID+回溯时间准备特征;联邦学习:银行发起联邦学习,进行数据异常值处理、归一化处理、IV、WOE、VIF、选择多个算法等操作构建模型;模型完成:模型训练完成,如该模型使用两方的特征,则两方都有模型的一部分,从而形成模型异构;如模型只用数据源一方,则模型全在数据源方,使用需要需求方授权;110 模型报告:模型训练完成,查看模型报告,通过模型的 KS、AUC 等模型指标查看模型的有效性;模型上线:模型部署上线,并支持 API 实时调用预测和线上批量预测;模型迭代:根据199、模型使用后的效果进行模型迭代。模型上线的主要流程如下:移动上线流程:移动上线流程:由中国移动大数据隐私计算平台匿踪查询接口包装后,统一归入移动大数据产品体系内。在用户授权的前提下,客户通过调用移动大数据隐私计算查询接口(支持 API 或匿踪),查询对应模型评分,如图 7 所示。图 7 移动模型上线过程 模型入参:手机号码(SHA256 加密)模型出参:账户反电诈评分、交易受害人风险识别评分 模型输出:输出为 0600 评分,示例:账户反电诈评分的分数区间为 0600,分值越高表明账户电诈风险越低,将评分用于决策,以新开户为例:513 分以上:批准发卡;456513 之间:批准发卡,日转限额;3200、89455 之间:签反电诈承诺书,批准发卡,日转限额;111 389 分以下:建议拒绝开户,根据中国人民银行关于加强开户管理及可疑交易报告后续控制措施的通知;华瑞银行上线流程:华瑞银行上线流程:分为新开账户反电诈应用流程、存量用户反电诈应用流程及交易反电诈流程。账户反电诈应用 新开户拦截:实时 API 或匿踪 API 调用涉及风险名单接口和反诈模型评分,根据返回结果进行预警拦截。存量账户电诈排查:批量运行方式,通过安全求交、API 或匿踪 API 调用涉及风险名单接口和反诈模型评分,识别出可能涉诈的账号列表,用于人工排查及阻断。电诈名单及模型应用如图 8 所示:图 8 开户申请电诈模型应用流程201、 在银行现有的反电诈系统里增加运营商电诈风险名单查询及账户反电诈模型评分。交易反电诈应用 112 存量账户受诈预警:事后推送可能受骗客户名单,用于给客户提醒。交易反电诈流程如图 9 所示:图 9 交易电诈模型应用流程 主要用于保护好人,即在交易流程中增加受诈风险名单识别策略及受害者识别模型。4.4.案例成果案例成果 该成果为隐私计算平台孵化反电诈场景,不仅响应国家数据要素的流通,同时还响应国家的全民反诈号召,侧向证明中国移动的大数据能力可以进行商业化赋能,助力企业运营,为后续省公司开展此类业务打造标杆模板。其成果亮点主要体现跨域数据安全流通、提升反电诈识别能力及在数据保护方面三个亮点:跨域数据202、流通方面:跨域数据流通方面:银行提供自有的电诈 Y 值及自有资金流的特征基础上,通过隐私计算引入电信网络诈骗风险名单及运 113 营商电诈特征等数据,丰富银行风险评估数据维度,从而打通资金流和信息流。通过隐私计算平台在确保各方原始数据不出域的基础上,将经客户明确授权的行内客户历史交易数据与电信网络诈骗风险名单等运营商数据进行可信共享、联合建模,提升电信网络诈骗等交易风险的识别效率。反电诈识别能力提升:反电诈识别能力提升:在隐私计算的安全助力下,银行通过引入运营商更多的底层特征数据,让电诈识别模型及受害者识别模型更精准、更及时。从而大幅提升银行反电诈风控识别能力。通过隐私计算技术挖掘更多运营商底203、层数据,实现模型的 KS 和AUC 提升,提升度为 30%,对业务电诈风险识别提升 40%的准备率;数据安全方面:数据安全方面:运用隐私计算技术中的全匿踪联邦学习、多方安全图计算技术,实现跨机构间数据的安全融合,确保数据提供方“信息零出库”,数据需求方“隐私零泄露”,充分保障数据安全和用户隐私。(三)(三)基于多方安全图计算的中小微企业融资服务基于多方安全图计算的中小微企业融资服务 1.1.案例背景案例背景 近年来,中小微企业融资中的金融欺诈问题日益严重,涉及金钱和服务的商业模式(通信、保险、贷款、信用卡申请等多领域)几乎都会受到欺诈攻击。针对金融欺诈问题,金融机构通常利用反欺诈规则模型或机器204、学习模型来预警,这两种方式都是从历史案例中发现金融欺诈时重复出现的个体行为模式。但随着时 114 间演化、发展和反欺诈技术进步,金融欺诈团伙呈现有组织欺诈趋势,市场急需新技术来对传统反欺诈技术进行补充。根据中国人民银行上海总部发布的 关于上海市金融科技创新监管试点首批创新应用提供服务的公告,上海市金融科技创新监管试点首批 8 个创新应用中,交通银行股份有限公司、中移(上海)信息通信科技有限公司、上海理想信息产业(集团)有限公司和上海富数科技有限公司联合申请的“基于多方安全知识图谱计算的中小微企业融资服务”(以下简称本项目)是国内金融领域首例对外公开运行的多方安全计算应用。应用基于各自管控的多方205、安全计算系统平台,确保银行和运营商两方数据不出库联合建模应用于小微企业普惠金融业务,精准识别团伙欺诈行为,助力金融机构提高风控能力,通过解决中小企业融资难问题,安全高效服务实体经济。2.2.案例概括案例概括 本项目从惠民服务和中小微企业融资两大类场景切入,数据融合应用,结合风控平台结果,为客户鉴权、增信,运用在线金融工具实现信贷业务申请、审批、签约等线上操作,打造线上线下一体化“交银 e 办事”服务。通过线上接口服务为交通银行企业用户提供全天候应用服务,同时采取多种措施保护交行客户信息的隐私性和安全性。通过将图计算和多方安全计算技术融合,本项目在确保各方 115 原始数据不出域的基础上,实现银206、行和移动运营商关系图谱数据的融合,并基于此建立有监督和无监督反欺诈模型,对用户和企业欺诈风险进行识别;以融合关系网络的异常监测和离群行为预警等技术手段作为补充,实现全方位欺诈风险预警;图计算关系网络准确识别企业集群背后的复杂关系链条及欺诈风险,助力银行中小微企业精准贷款投放和集群风险管控,提升金融机构风险防控能力及客户贷款体验,并使移动运营商多维度数据价值得到有效发挥。3.3.解决方案解决方案 图计算和关系网络的建立,离不开大量数据的使用和分析,而目前对数据的监管愈发严格,加强个人隐私保护和数据安全是国内外的趋势。因此,要提高关系网络对欺诈行为的识别能力,必须处理好数据服务和数据安全及隐私保护207、之间的关系。基于多方安全计算的图计算关系网络提供了全新的反欺诈分析手段。本项目首次将图计算技术与多方安全计算技术结合,为隐私计算行业首创和重大突破,在技术原理、方案设计、系统搭建、科研专利方面具有极强的前瞻性、领先性、创新性和应用性。图计算是以图作为数据模型来表达问题并予以解决的过程,需要解决图数据组织及划分、顶点程序调度和计算通信模式等关键技术,目前主要应用在网页排序、社区发现、最短路径等问题。一些电商平台在智能风控场景中也有图计算的应用实践,但并未与多方安全计算技术进行结合,数据隐私上无法得到保障,难以满 116 足合规要求。本项目以多元技术融合突破应用边界,采用非对称、独立对称、融合对称208、三种安全图计算模式,结合差分隐私、密态计算、不经意传输等隐私计算技术,虚拟融合银行及运营商数据关系网络,通过对齐、扩充、传播、聚合等方法刻画关系图谱网络,进行用户自然特征、局部网络特征、全局网络特征和高阶复杂特征分析,在多数据视角智能融合引擎基础上构建反洗钱反欺诈识别预警模型库,在金融反欺诈的识别效率和精确度方面均有大幅提升,如图 10 所示。图 10 基于多方安全知识图谱计算的中小微企业融资服务的技术逻辑图 本项目基于银行欺诈客户个体信息与移动运营商关系网络,精准识别高危客户群体,主动分析和探查,有效规避欺诈风险;通过对参与方数据进行拓扑图分析,从单点式向集群性银行风险防控技术演进,解决信息209、不对称、计算结果不准确等问题,实现银行风控模型精准化;通过群体性欺诈开户风险模型,部署相应的监测规则,识别金融欺诈团伙,预警群体性客户的联合欺诈风通话数据短信数据位置数据设备数据运营商通讯关系网络银行联系人数据担保数据交易数据信贷数据金融关系网络图计算密态计算不经意传输密态计算不经意传输融合安全计算图计算差分隐私差分隐私虚拟融合关系网络自然特征分析局部网络特性全局网络特性高阶复杂特性多数据多数据视角智能融合引擎角智能融合引擎反欺反欺诈识别与与预警模型警模型库 117 险。本项目严格遵循央行“用户授权、最小够用、全程防护”的数据治理原则:在数据采集时,通过隐私政策文件等方式明示用户数据采集和使用210、目的、方式及范围,获取用户授权后再进行采集;在数据使用时,借助标记化、加密等技术,在不归集、不共享原始数据的前提下,仅向外提供脱敏后的计算结果;在数据存储时,通过不可逆加密等技术将原始信息进行脱敏,并与关联性较高的敏感信息进行安全隔离、分散存储,严控访问权限,降低数据泄露风险。除此之外,本项目在算法多样性、技术多元化、模型精确度、加密强度、系统性能和安全性等方面均有显著行业优势:支持逻辑回归、随机森林、神经网络等算法多样性;在计算时间复杂度大幅提升的情况下融合同态加密、私密共享、混淆电路等多方安全计算技术;参与方加密联合计算梯度及损失函数,提升联邦学习建模精度;支持去中间方的横向、纵向和迁移联211、邦学习;融合高性能加密算法及 K-匿名、L-多样性、差分隐私等技术,对敏感数据潜在风险进行检测、预判和处理;创造性使用“松弛迭代法”,大幅提升系统性能,超出行业水平 3 倍以上。4.4.案例成果案例成果 本项目通过多方安全图计算等技术作为开户真实性意愿审核的辅助手段,达到身份核验手段多元化效果,可视作纸质材料、现场走访审核的有效补充;通过大数据、人工智能等技术手段,118 依托行内外多维度数据,通过“标准化产品、数字化风控、集中化运营”为小微企业提供专属线上融资服务,满足客户差异化融资需求;通过将客户移动网络信息与申贷信息进行交叉比对分析和联合建模,精准防范和打击伪冒申贷等扰乱金融秩序的行为,212、营造健康的普惠金融生态。本项目以风控平台为支撑,用数据计算分析部分替代繁琐的线下调查工作,通过线上系统初审、线下实地核实的方式优化中小微企业贷款审批风控流程,实现银行风控模型精准化、身份核验手段多元化、线上融资服务差异化、普惠金融生态健康化,提升银行普惠金融的时效性、便捷性和安全性。项目充分发挥了移动运营商数据价值,扩大了银行的融资服务半径,提高融资服务精度;提升中小微企业融资体验及普惠金融便利性,有效缓解中小微企业融资难问题,助力中小微企业在实体经济发展中发挥更重要作用。(四)(四)某商业银行实时智能营销决策平台某商业银行实时智能营销决策平台 1.1.案例概况案例概况 为精准感知客户金融需求213、、改善金融服务质效和提升金融触达能力,某商业银行基于行内客户数据沉淀,构建实时智能营销决策平台,将数据的实时计算、智能分析以及商机挖掘相结合,形成了集客户行为快速感知、客户价值深度分析、客户营销高效评估为一体的实时智能化营销运营体系,为银行的精细化运营管理提供了重要支撑。119 2.2.案例概括案例概括 当前线上营销和运营业务面临诸多挑战:一是数据获取难。用户使用线上金融服务时,无法实时捕获操作数据并形成完整的用户旅程,难以支撑金融服务过程中用户潜在需求的实时分析。二是营销决策难。传统人工决策步骤多、效率低、精准度不高,无法有效定位营销客群并匹配合适的营销策略,难以实现精细化、个性化的营销运营214、。三是后期评估难。缺乏对营销效果的跟踪反馈和数字化评估,难以及时掌握营销运营情况,无法有效支撑对营销过程和模型的优化改进。3.3.解决方案解决方案 实时智能营销决策平台可以深入营销运营过程的前中后期,有效解决前期数据获取、中期营销决策、后期效果评估等环节面临的问题,提升营销运营能力,推动业务高质量发展。数据获取方面,通过全埋点数据采集对在线业务的每一个页面与功能点都进行埋点处理,对用户行为进行实时捕获,快速刻画出完整的用户旅程,并结合用户的交易数据形成用户分析报告。营销决策方面,基于实时计算系统高效高频地分析处理客户数据,并将捕获的营销商机与线索进行加工形成事件指标,结合自身沉淀的内部客户数据215、和基于联邦学习技术获取的外部数据,通过机器学习算法进行营销分析,实现了对客户营销管理的智能化、个性化、精细化分析决策。120 营销评估方面,实时收集营销分析效果并对其进行量化评估,形成数字化运营闭环。一方面缩短了营销运营策略的迭代周期;另一方面将效果数据与模型训练数据打通,提升了智能化模型迭代效率,助力优化营销策略精准度。4.4.案例成果案例成果 某商业银行实时智能营销决策平台投入运营以来,逐步构建起全行级数字化营销运营体系,实现了智能化的营销策略分析与价值预估,形成了量化且精准的营销运营流程闭环。该平台在获客活客、交叉营销、私域运营、流失挽回等多个细分营销场景进行了深度应用实践,有效提升了营216、销效能,为某商业银行精细化运营管理提供了重要支撑。从 2022 年 7 月投产至今,该平台每日持续采集用户行为记录,建立营销事件捕获规则 43 个,累计命中潜在存款商机用户接近 91 万户,营销触达 14 万人,累计沉淀定期存款金额 11 亿元,取得了积极有效的运营成果。(五)(五)数字运营平台建设数字运营平台建设 1.1.案例背景案例背景 数字运营平台为联易融数科集团自主研发的线上化运营管理平台,定位于提高集团内的金融产品运营效率,提高转化率及降低客单价。平台建设的背景:随着金融行业竞争的持续加剧,企业开始进入存量竞争阶段,目前简单粗暴的运营模式已经无法满足市场竞争需求;为应对挑战,企业需要217、将业务流与数据流融 121 合应用,不断沉淀业务运营各个环节中产生的数据并加以分析和使用,开展数字化及精细化的运营管理。2.2.案例概况案例概况 在传统的运营模式下,业务部门常常以不断拉新及重复触达来促进业务规模的增长,较少对运营活动中的过程数据进行分析挖掘,以深入了解客户的真实需求或者产品存在的瓶颈。因而,旧模式下的运营活动成本较高,但是带来的转化率以及客户满意度却较低。数字运营平台以联易融数科集团内部产生的业务数据(含交易数据及流程数据)为主要分析对象,以公开渠道可获取到的企业融资、企业经营等数据为辅助,在大数据分布式运算的技术框架下,生成针对企业/金融机构/产品/行业/渠道的标签,实现企218、业画像/金融机构画像/产品画像/行业画像/渠道画像的描绘,帮助提高产品与客户的匹配率,提高运营活动的转化率。3.3.解决方案解决方案 本平台在技术和业务分别做出了解决方案创新。在技术方案上,实现了如下创新点:122(1)数据治理:梳理数据的主从关系,设立数据规范,建设数据仓库,使得业务流程中每个环节产生的数据可以得到有序存储和使用。(2)标签引擎:支持从不同的维度构建企业标签,标签可即时生效和入库,可被重复使用。(3)自动打标:对业务流程中涉及的主体(含金融机构、核心企业、供应商、渠道商等等)自动完成标签标注,周期性进行更新,标签为生成画像的基础。(4)画像分析:基于大数据分布式运算框架,周期219、性形成实体的全景画像,对实体特征进行总结,以数据为驱动,准确概括实体价值点,实现对各类相关实体的高效洞察。任务自动分发:平台可配置自动化任务流,当某一实体的画像特征达到任务的执行条件时,平台可自动触发并对执行结果生成可视化的分析结果。在业务方面,实现了如下创新点:123(1)运营活动全流程数据化管理机制:将运营活动的各个环节实现数据化,如产品参数管理、营销活动管理、渠道管理、用户行为数据管理、金融机构审核时效管理等等,可穿透到影响运营活动效率的真实原因。(5)客户产品自动化匹配机制:基于客户(常为供应商)和金融产品的画像,自动计算匹配度,优先向客户推荐匹配度更高的产品,提高成交率。(6)RPA220、 与业务融合机制:在传统的模式下,业务运营活动的决策常常按照人工收集数据人工分析数据人工制定应对方案的流程进行,决策常常存在时滞,数字运营平台可预置自动化任务流,系统根据用户特征,自动发起对应的活动,如促活/激励/封禁等等。(7)客户价值最大化挖掘机制:依托数字化运营的能力,深度挖掘存量客户的商业价值,以存量客户为原点实现更多潜在优质客户的转化,同时可提高客户的满意度。4.4.案例成果案例成果 在经济效益方面,通过建设覆盖集团所有业务条线的数字运营平台,集团充分发挥数据在运营活动中的价值,为业务规模的增长提供了新的动力。在社会效益方面,数字运营平台的模式可以在金融机构内得到广泛地复用,帮助金融221、机构实现精细化的运营管理。124(六)(六)情报中心平台建设情报中心平台建设 1.1.案例背景案例背景 情报中心平台是联易融数科集团建设的以商机挖掘和贷后监控为核心功能点的数智化平台,该平台定位于为金融业传统的风险控制及拓客工作提效。传统的金融业务流程中存在较多的痛点:(1)对于客户经理,寻找潜在的客户名录需要花费较长的时间,在接触到客户后,也很难较准确地判断客户的融资需求是怎样的,从开始营销活动到最终成交周期较长且成本较高;(2)对于风控人员,收集客户信息进行风险识别涉及大量繁琐的人工工作,另,周期性的风险核查材料常依赖于客户的主动反馈,风险控制工作存在一些难点。2.2.案例概况案例概况 情222、报中心平台以海量的企业/行业/产业数据为基础,可向金融机构输出企业信息查询、企业关系查询、企业风险监测、企业舆情监控等服务,帮助金融机构更好地盘活存量客户资源并防范企业信用风险。情报中心以专家词库(机构词库/事件词库/名人词库)及多维度的企业标签为基础,结合大数据及 AI 算法(如实体识别算法、新闻事件提取算法、关联度算法等),对各类可通过公开渠道获取到的企业/行业/产业信息进行加工处理,生成企业 360画像,深层次挖掘企业间的关联关系,快速捕捉企业 125 利好信息/风险信息,并将信息流以待办任务的形式通知到相关人员进行处理。通过自动化、周期性的信息监测,情报中心可帮助金融机构的业务人员以及223、风控人员提高工作效率,减少大量繁琐且重复的人工工作。3.3.解决方案解决方案 本平台在技术和业务分别做出了解决方案创新。在技术方案上,实现了如下创新点:数据自动采集:平台自动归集企业各维度数据,对数据做结构化处理,分主题建设数据仓库,对各类型数据按照业务逻辑进行存储、编排。AI 能力应用:结合 OCR/NLP 技术,对非结构化的数据做结构化解析,完成对此类数据的分析和应用。关联关系图谱:以海量的企业实体以及实体间的关系为基础,深度挖掘企业的关联实体,以可视化的关系网络呈现关联关系。企业画像分析:基于大数据分布式运算框架,动态形成企业的全景画像,对企业特征进行总结(如用款周期、融资意愿等等),以224、数据为驱动,实现对企业的高效洞察。企业商机追踪模型:对商机追踪的规则实现模型化,平台依照用户设定的频次周期性运行模型,自动判定企业是否存在待挖掘的商业机会,替代人工工作。企业风险监控模型:对风险监控的规则实现模型化,平台 126 依照用户设定的频次周期性运行模型,自动判定企业的风险等级并进行预警,替代人工工作。在业务方面,实现了如下创新点:存量客户深度运营机制:基于商机追踪模型,多角度探索存量客户新增的商机机会,进一步绑定与客户的合作关系。客户关系辐射机制:以已有客户为原点,以企业间的关联关系为依托辐射相关的企业,扩大优质客户的“良币”效应。智能化风险监控机制:平台自动基于风险规则检查企业的风225、险表现,当企业触发风险阈值时,自动发布预警信息,大幅提高金融机构对企业信用风险的敏感程度。舆情事件高精度提炼机制:舆情数据是互联网时代最广泛的一种数据资源,情报中心平台基于 NLP 模型对企业舆情进行解析,提炼关键事件,让“捕风捉影”成为可能。4.4.案例成果案例成果 联易融数科集团建设的情报中心 SaaS 平台目前已为多家金融机构提供决策支持,帮助其从存量客户上获取更多的转化,同时降低金融机构遭受企业信用风险的概率。在更宏观的层面,情报中心平台以海量的数据资源为支撑,是一个纯粹的数据应用平台,对各类型机构充分挖掘数据资源的价值有很大的启发意义。127(七)(七)腾讯云助力某银行数据安全治理建226、设腾讯云助力某银行数据安全治理建设 1.1.案例背景案例背景 网络安全法数据安全法个人信息保护法三部数据安全领域基础法律的颁布,以及银行业金融机构数据治理指引个人金融信息保护技术规范等行业标准的实施,数据安全治理工作将成为金融机构安全体系建设的重中之重。由于金融行业数据价值凸显以及商业利益的驱动,数据非法采集、数据贩卖、数据攻击等安全问题层出不穷。但是目前银行数据安全相关组织制度建设不完善、应用系统种类繁多、业务场景复杂、数据开放性强,以及复杂多样的攻击手段,导致数据安全治理难度大,难以形成覆盖全行数据的整体性的体系化的数据安全治理方案。本案例借助腾讯云的数据安全能力,助力某银行的数据安全治理227、,以数据为中心,落实“规划、建设、评估、运营”四个环节,建设数据资产可视、数据风险可控、数据价值可用的数据安全治理体系。2.2.案例概况案例概况 该商业银行规划目标未来 23 年,全行数据安全成熟度(DSMM)逐步提升并达到 4 级标准。腾讯云协助该银行开展如下的数据安全治理工作:首先,通过数据安全咨询协助银行开展数据安全治理工作,128 建立自上而下的数据安全组织保障体系、数据安全管理制度和数据安全治理技术框架。其次,该银行开展数据分级分类工作,梳理敏感数据资产地图,实现敏感数据资产可视化,同时,对敏感数据资产安全风险面进行多维度风险评估,输出风险清单,逐步量化数据安全治理指标。再者,该银行228、针对数据安全风险评估的风险清单,制定风险处置措施,根据不同等级数据安全风险采取不同的风险应对措施,如加密、脱敏、审计、访问权限控制等技术手段。最后,该银行通过建立数据安全治理运营机制,主动识别数据安全风险,通过数据融合、智能分析进行实时检测和预警,构建可持续的风险检测和响应能力。3.3.解决方案解决方案 腾讯云数据安全中心从数据安全治理、数据安全合规出发,提供数据资产管理、数据分类分级、数据安全风险评估、策略管控与实时风险监测等能力,帮助企业解决合规应对、敏感数据排查、数据安全风险监测等多方面的数据安全问题,提高数据安全保障能力,降低数据安全治理成本。本案例中的数据安全治理的技术架构,如图 1229、1 所示:129 图 11 数据安全治理的技术架构图 其中,数据安全治理的主要技术功能包括:数据分类分级:结合 数据安全法 个人信息保护法 金融数据安全 数据安全分级指南等国家、行业法律法规及规范,进行敏感数据发现与数据分类分级,梳理敏感数据资产地图,实现敏感数据资产可视化。数据安全风险评估:对敏感数据资产安全风险面进行多维度风险评估,包含潜在数据泄漏风险、数据安全合规策略风险,脆弱性识别等,通过风险分析、风险计算和风险评价,最终得出风险清单。数据安全策略及管控:针对数据安全风险评估的风险清单,制定风险处置措施,根据不同等级的数据安全风险采取不同的风险处置策略,包含:实时加密、动态及静态脱敏、230、水印、数据库访问控制、运维访问安全、安全审计等策略,从而使风险闭环。数据安全风险监测和告警:基于日志汇聚、行为基线、UEBA用户行为分析,通过数据融合,数据挖掘,智能分析和可视化等 130 技术对数据流动实时监测风险状况,并对风险活动进行及时告警、管控。4.4.案例成果案例成果 该商业银行提升了数据安全组织决策和执行能力。健全的数据安全组织保障体系能够打通业务部门、信息中心等多个部门,全局一盘棋,从决策、管理、监督、执行多个层面落实数据安全治理工作。该商业银行提升了数据安全治理能力。以数据为中心,围绕业务与场景,做好数据安全技术基础能力建设,通过自动化、智能化、可视化的技术手段,构建数据安全风231、险控制和响应能力,建立完善、可持续的数据安全运营保障机制。(八)(八)腾讯云助力某金融机构数据中台建设腾讯云助力某金融机构数据中台建设 1.1.案例背景案例背景 某金融机构是一个完全参与激烈市场化竞争的现代产业金融机构,合并资产总额超 3500 亿元。该金融机构为集团产业布局服务,走产融共赢之路,以定制化的产品和个性化的服务,为500 余家集团企业提供存款、贷款、结算、外汇、财务顾问等全方位的本外币金融服务。该金融机构以打造“产业金融赛道中数字化转型的行业先锋”为目标,以数字化转型项目为牵引,构建实现公司业财一体化与数据中台化,从而应对未来业务新挑战,构筑数字时代新优 131 势。2.2.案例232、概况案例概况 本项目是该金融机构委托腾讯云建设企业级数据中台和数据资产管理能力的案例,包含建设数据基础平台、数据开发平台、数据资产与治理平台等,其中:1)数据基础平台提供集群管理、资源管理、监控告警等数据运维能力,项目管理、用户管理、权限管理等平台管理能力,数据存储、数据计算、系统服务等数据引擎能力;2)数据开发平台提供数据开发、数据分析、流程画布开发、SQL 组件等离线数据开发能力,数据加速、实时写入、流模型开发等实时数据湖能力;3)数据资产与治理平台提供元数据、数据地图、血缘关系、影响分析等元数据管理能力,质量监控、规则制定与自动化触发等数据质量管理能力,数据审计、数据脱敏等数据安全管理能233、力。总体来说,腾讯云需要帮助该机构全面梳理数据资源,完善数据体系架构,形成统一数据标准、统一数据服务、统一开发平台、统一数据资产服务能力,实现业务数据化、数据资产化、资产价值化的增长闭环。3.3.解决方案解决方案 腾讯云在助力该金融机构的数据中台建设中,在平台技术上做出了解决方案创新,实现了如下创新点:132 1)湖仓一体:引入 Iceberg 数据湖仓表格式,构建湖仓一体的近实时数据湖仓,实时 CDC 数据入湖,发挥湖与仓的共性优势,加快数据资产可见的时效性 2)流批一体:技术架构上基于数据湖仓组件,统一了批计算和流计算的存储引擎和计算引擎,打破离线与实时壁垒,解决了过去 Lambda 架构234、下存在的数据不一致的问题,提高了数据资产的一致性 3)统一元数据:通过多源异构元数据的采集和集成,协同管理起多维的技术、业务元数据,并维护全生命周期血缘和业务关系,为数据资产化提供多维的元数据分析和服务。4)统一数据标准:在源头(建立数据库表时)就引用数据标准,构建“事前建标、事中落标、事后对标”的标准管理体系,同时构建可视化的对标流程(任务分配、管理、对标、审核、调度),解决了数据的不规范问题,完成大数据规模下的高效统一规范,提升各业务系统使用的数据资产质量 5)全链路数据质量:通过可视化的质量任务管理、多维度的质量评估、灵活的规则配置、质量工单等功能,为数据接入、整合、加工到消费的全生命周235、期各阶段提供数据质量稽核能力,将数据质量问题定位“到表到人”并闭环处理,全链路把握湖中数据资产质量,避免数据沼泽 6)数据安全:提供数据全链路的数据安全保障,主要实现数据安全定义、管理和监控、数据安全管理流程、数据权限审批、数据隐私和脱敏等管理,数据资源的安全得到了充分保障。133 4.4.案例成果案例成果 腾讯云通过本项目帮助该金融机构实现了“汇、存、算、管”的数据中台能力,以支撑批发、个金、业财等业务应用:汇:实时接入降本增效,压榨资源性能,提高现有资源的使用效率;存:基于数据湖仓一体能力,加速业务数据的汇聚与分析,从天级别到小时级别提升;算:统一开发、统一运维,协同工作、降低门槛,减少代236、码和系统维护工作量;管:构建监控应急体系,初步实现数据重复、数据任务、数据一致性监控告警;腾讯云同时通过本项目帮助该金融机构初步实现了数据资产的管理能力,包括:1)统一元数据:采集 25 个业务系统、600 个数据库、50000张表、70 万个字段的元数据,并且将业务元数据与技术元数据相结合,为统一数据资产管理打下基础;2)数据质量:定位问题到表到人、质量工单闭环处理,构建了 5 个质量模板与 10+检查规则;3)数据标准:事先建标、事中落标、事后对标的标准体系,构建了 335 个基础标准、408 个指标标准、100 个公共代码、400个词根等;4)数据安全:通过分级分类、动静脱敏,10 个脱237、敏策略、134 5 个安全等级、4 个风险等级来保障整体数据安全。该金融机构通过建设覆盖全机构的数据资产管理平台,提高数据资产的管理水平,支撑集团层面统一数据资产管理与财务预测模型的构建,赋能集团的数字化转型发展,同时为业务发展提供新引擎和新动力,全面提升集团的经营业绩。(九)(九)浙商银行智能风控体系建设浙商银行智能风控体系建设 1.1.案例背景案例背景 数据要素在推进经济高质量发展中的重要作用日益凸显,释放数据价值是数字经济时代的关键潜能。金融业作为典型数据密集型行业,数据要素正成为金融行业高质量发展的重要驱动力。然而,商业银行传统风控体系普遍存在数据来源单一、成本高、效率低等问题,银行在238、应对小微企业信贷需求时,往往缺少企业经营状况等有效数据,从而导致小微企业融资难、融资慢等现象。2.2.案例概况案例概况 隐私保护技术是在保证数据隐私安全的前提下,通过多方协作的方式进行联合计算或建模,实现数据可用不可见,数据不动价值动。因此,如果可以在保护数据隐私安全的前提下,利用隐私保护技术合法合规地从多源数据中训练出更加准确的联合风控模型,则可以助力银行更加快速地做出信贷风控评估,从而扩大金融服务半径,使得惠普金融政策惠及更多的小微企业。135 3.3.解决方案解决方案 为解决以上问题,浙商银行综合应用联邦学习、多方安全计算等隐私保护技术,基于外部工商、监管、征信、电信运营商等数据以及行内239、业务数据,训练安全多源的联合风控模型,为银行风控全流程中客户准入、关联关系、客户画像、预警管理、反欺诈等功能提供数据和技术支撑。例如通过纵向联邦学习,可将多方数据用于小微企业业务的反欺诈、信用评分、贷后预警等模型建设。使用联邦学习的方式可以使原始数据不出本地,达到数据可用不可见的效果,从而实现在保护数据隐私的前提下完成联合风控模型的训练。4.4.案例成果案例成果 基于联邦学习、多方安全计算等隐私保护技术的信贷风控模型一方面可以更好地预测小微企业的信贷能力,提升银行普惠金融业务的风控数智化水平。另一方面,由于数据样本的提升和丰富,信贷风控模型精准性会有大幅提升,从而可以有效节省传统的信贷审核成本240、。智能风控体系自运行以来取得了良好的经济和社会效益,累计通过该体系准入的公司授信客户超过 5 万家,低风险/次低风险客户占比为 16.7%,有效提升了客户质量和风控提前预警能力。136(十)(十)基于隐私计算的境外统计数据监管报送系统基于隐私计算的境外统计数据监管报送系统 1.1.案例背景案例背景 银行等跨国金融企业对境外分支机构数据的统计汇总和监管报送意义重大。银行开设境外分支机构、开拓境外客户是当前全球化与数据经济发展过程中的必然,客户数据作为具有极大潜在经济价值的生产要素,在国际的流动需求变得越来越旺盛。但是数据的出境和入境应当保证安全有序、合法、合规、合理,否则将给数据主体,包括个人、241、社会、国家的信息安全带来极大风险。因此需要借助隐私计算技术,解决在保护境外分支机构数据不暴露的基础上,对数据进行整合、计算和统计,实现在保护原始数据的基础上对数据进行有效加工,最终完成汇总数据的监管报送。2.2.案例概况案例概况 境外分行监管报送案例为隐私计算多方加密数据统计领域的应用。本场景中,每家分行存储了一些用户的信息,每个用户可能在部分分行有信息(在部分分行有交集,在全部分行没有共同交集),在保证分行数据安全的前提下,由总行统计所有用户的信息汇总,并将汇总结果报送监管方。出于数据安全的考虑,分行数据不出己方私域,中间通信数据不暴露原始数据信息,总行无法知道结果具体来自哪家分行或哪些分行242、,各分行也无法知道其他分行的用户信息。137 3.3.解决方案解决方案 本案例使用隐私计算领域的多方安全求和技术,其本质是实现数据所有权和使用权分离,保证各方数据不出私域,同时实现多方数据的流通和整合,最终结果获取方仅能得到最终计算结果,而无法获取原始数据。本案例的解决方案主要包含加密求并和秘密分享两步。加密求并基于 RSA 算法,通过密钥加密传输,由总行实现对所有分行用户的求并,并分发给各分行;各分行将并集与本地用户求交得到目标数据。秘密分享的主要思想是将秘密分割,将分割后的秘密分片分发给所有分行,各分行计算己方得到的所有分片之和,并发送给总行,结果获取方根据收到的所有分片和计算最终结果。在243、此过程中,各分行无法得到其他分行的用户信息,总行也无法获知各分行的用户信息,有效数据的传输过程全程加密,最终实现在数据安全的前提下完成所有分行信息的统计,并进行监管报送。4.4.案例成果案例成果 本案例由银行总行对接境外多家分行,通过在各分行部署隐私计算服务节点,实现对所有分行客户数据的联合统计和计算,有效解决跨境数据的“保密性”与“共享性”的矛盾。境外分行可以在不暴露各自隐私数据的情况下,完成监管所需数据的加工统计,保护了数据安全,实现了数据“可用不可见”。138(十一)(十一)北金所北金所数据资产目录建设实践数据资产目录建设实践 1.1.案例背景案例背景 在北金所数字化转型的进程中,数据资244、产是数字化转型或数字化建设中的数据底座,理清数据资产也是数据治理的首要任务。理清数据资产,不仅仅需要进行企业数据资产的盘点,而且也需要形成企业的数据资产目录,以便于数据资产的盘点成果直达并服务于企业各个业务组织中。通过数据资产目录沉淀数据资产盘点成果,也可加强数据质量、数据安全、数据标准、数据架构、数据服务等企业管理能力。2.2.案例概述案例概述 秉承联通技术与业务,提高业务使用数据或者发现具有业务价值数据的便利性,将数据转化成数据资产,挖掘数据隐藏的价值的原则。北金所以债融等业务系统为代表,采用面向业务条线、业务流程、业务事项的数据资产目录分类方式,以数据整合、数据共享和交换、数据分析和应用245、等为主要目标,对所拥有的业务系统基础数据进行了数据资产盘点和数据资产目录体系建设。3.3.解决方案解决方案 数据管理部门通过向技术部门收集数据库表、研读系统建设过程文档及访谈业务部门人员深入了解业务,分别在表级和数据项级对各表和数据项进行了梳理、分析和类别界定。139 范围主要是北金所业务系统的结构化数据,目的是能够理清当前可用数据资源情况,支持业务提出数据使用需求,非业务系统如 OA、财务、人力等系统不在梳理范围内,另外半结构化、非结构化以及手工报表等非电子化数据暂未梳理。第一步,表级梳理。根据对相关文档解读,将数据库表分析归纳为 5 大类,系统管理类、流程管理类、参与人相关、产品信息相关、246、系统日志类,对数据表进行了类别界定。第二步,数据项梳理。为了仅向业务展示有业务分析和使用价值的表及数据项,减少无业务意义的表和字段对业务的干扰,帮助业务快速便利地从中挖掘出业务价值,对债融相关业务表进行了进一步盘点,具体主要有如下几项:根据第一步成果,挑选出具有业务分析和使用价值的表;剔除无业务意义的技术字段;站在业务角度,按照业务概念中的数据组织方式,通过参考常规概念模型和对业务的了解,建立物理表字段和业务概念的联系,业务概念以一级、二级、三级业务类别表示,一级以业务主题视角划分,二级以业务流程或业务场景视角划分,三级以业务实体视角划分。第三步,数据资产目录体系构建。将第二步形成的一级、二级247、、三级业务类别目录与业务条线形成网格的资产目录体系,提高数据资产的使用效果。4.4.案例成果案例成果 从数据资产价值化过程来看,以业务视角的数据资产盘点和 140 目录设计,能更好地促进业务理解,增强数据资产的共享和交换能力,更快实现数据资产的价值化,推动业务数字化转型。除此之外,还可以为数据安全分级分类、数据标准制定、数据质量管控等提供了基础数据参考。以上数据资产盘点和数据目录体系构建,是基于北金所业务发展现状,面向北金所业务规划而开展,尚存在一些问题需要完善,具体如下:1、本案例梳理的数据内容仅包含基础数据,后续随着数据模型、数据标签、数据指标体系的搭建,此部分的数据内容也需包含在数据资产248、梳理范围内。2、本案例数据资产目录相对简单,后续可用数据标准补充资产目录中数据的描述信息,数据的安全等级附加到资产目录中确保数据安全可控。3、本案例数据资产目录仅仅只是一张 Excel 清单,数据资产目录要想长期动态维护和管理并产生价值应该与资产管理工具相结合。(十二)(十二)隐私计算助力医疗保险智能理赔反欺诈应用隐私计算助力医疗保险智能理赔反欺诈应用 1.1.案例背景案例背景 传统的保险事后理赔服务中,不仅需求审核纸质的理赔材料,过程更是依靠审核人员基于保险+医学经验积累,人工输出核保理赔结论。不仅流程繁琐,还将耗费较高的人力成本在工作中,且潜在风险较高。如果能够优化这一过程,将有效降低保险249、 141 运营成本,将更多资源用以服务更广泛的人群,扩大普惠医疗的覆盖范围和服务质量,助力大健康产业发展、大健康服务完善。商业健康险作为促进多层次医疗保障体系建设的重要组成部分,对于国民医疗健康具有重要意义。2022 年 1 月,原中国银保监会人身险部向全国各人身保险公司下发 关于印发商业健康保险发展问题和建议报告的通知:“争取与医疗机构信息系统实现充分信息共享,改进结算服务;在确保信息安全和个人隐私权的基础上,强化医疗健康大数据运用,推动医疗支付方式改革,更好地服务医保政策制定和医疗费用管理。”为了解决千万级在保用户医疗险的理赔体验、成本和效能问题,阳光财险构建了基于理赔科技平台和隐私计算框250、架的智能理赔系统,借助数据优势(十万级典型理赔案件)并辅以一定的知识约束,实现医疗凭证深度结构化和“专家级”高置信辅助核赔决策。系统基于百万医疗凭证图像的机器学习,实现了视觉识别+文本分类+文本语义理解的多模态医疗凭证识别模型,对 100+种医疗凭证的识别准确率达到 95%以上。随着大数据人工智能等技术的发展推动健康险迈入 3.0 时代,保险行业数字化转型中服务逐步实现向线上迁移,数据流通为保险理赔模式优化带来无限可能,在监管趋严的环境下,保险公司在创新服务模式的过程中需要优先重视数据合规,隐私计算成为中立可信技术支撑。在整个系统中,健康险定制多方数据联合分析解决方案是核心模块之一。这一方案多251、方安全分析(Secure Collaborative Query Language,简称 SCQL)功能,该 142 功能基于多方安全计算技术,使用安全加密算法将多方数据进行联合分析的服务。帮助阳光财险及其外部医疗数据 ISV 在原始数据不离开本地、数据价值有保护的前提下,进行联合分析。2.2.案例概况案例概况 保险理赔包含用户报案环节和机构审核赔付环节,同时不同险种、不同重疾往往所需的理赔材料各有差异,凭证材料繁多且专业。首先线上报案时,用户理解、筛选凭证具有难度,很难一次完成提交工作,据相关数据:在重疾险线上报案过程中,用户能够一次性提交完整材料的占比小于 30%;然后进入核赔过程,机构人252、工核查同样存在耗时长的问题,且风险较高。本案例基于多方数据联合分析方案,智能理赔系统实现了可自动根据病种对用户的凭证把关,给予用户指导降低报案复杂度,并以数字化核赔辅助取代传统的人工核赔,提高核赔效率,报案快和核赔快全面提升了用户的理赔体验。3.3.解决方案解决方案 通过引入创新的 SCQL(MPC SQL)多方联合分析领域专用语言,具体通过如下流程合规引入外部数据源,保障了联合项目各参与方的数据隐私,基于多方安全计算的保险理赔联合分析业务流程如图 12 所示。143 图 12 基于多方安全计算的保险理赔联合分析业务流程(1)节点部署 用户一键get部署包,填入节点标识&token信息后执行脚253、本,即可轻量化、小时内完成本地节点部署;数据准备(进行前置安全配置)双方分别将各自的样本数据,加载至各自本地分析节点,并在平台上注册对应样本的数据表结构,同意授权进入多方安全分析项目。在这一环节中,用户可通过隐语的 CCL 前置安全配置功能,在 MPC 相关技术能力支撑下,用户可对数据资产进行分级分类,通过前置配置来保证安全级别高的数据的安全性,保证多方隐私数据在计算过程中不泄漏。(2)规则开发 基于的丰富 MPC SQL 算子支持,用户可以在脚本中描述基于多个数据源的安全计算,通过“SELECT FROM”“JOIN ON”“GROUP BY”等语句的组合搭配,即可完成联合分析的统计结 14254、4 果生成;通过“SELECT INTO”语句可将交集结果导出至节点本地。支持:算术计算(+,-,*,/,%)、比较(,=,=,=,IN,NOT IN)、逻辑计算(AND,OR,NOT)、窗口聚合(group by.min,max,avg,sum,count,median)、控制(IF,CASE WHEN)、排序(RANK,ROW NUMBER,ORDER BY)、日期函数(DATE_DIFF,DATE_ADD)、其他函数(ceil,floor,round.)丰富算子。(3)规则部署 随后,用户可使用 ISV 授权的数据,通过联合分析提供的在线 SCQLIDE,在平台完成在线调试优化规则,且经255、调试验证后的规则可作为标准规则在更多数据源进行规模化部署。(4)调用规则 规则部署完成后,用户在平台端即可对规则发起调用,平台支持简单的数据分析结果可视,如就诊分布,就诊频次等分析结果。(5)数据源拓展 用户还可持续通过外部医疗数据引入进一步提升丰富底层数据能力,进一步提升自身理赔和风控能力,增加核保场景智能决策服务。该方案可以实现参与方原始数据不出本地节点,通过隐语的CCL 前置安全配置功能,在 MPC 相关技术能力支撑下,可对数 145 据资产进行分级分类,通过前置配置来保证安全级别高的数据的安全性,保证多方隐私数据在计算过程中不泄漏,从而在保证各参与方数据安全的前提下,完成联合分析。4.256、4.案例成果案例成果 基于 SCQL 多方联合分析领域专用语言的健康险定制多方数据联合分析解决方案,有利于提升阳性案件识别和调查路径规划能力,覆盖了全国 10+省份的医疗数据,为医疗数据的合规使用提供了一种典型案例。利于有效发现阳性线索、降低错赔风险,通过数字化调查审核控制了理赔运营成本。智能理赔系统上线后,好医保 30 日线下调查案均成本降低了 40%,赔付率控制在了合理水平,保障了业务持续健康发展;30 日人均结案数量提升了 70%,有效控制了案件积压风险,为该产品规模的进一步扩充留出充足的理赔人力空间。对于在保用户,无效报案实时拦截率从 0 提升到 50%,高标准满足保险法 1 日内补传257、材料的要求,不仅显著提升用户报案体验,节省的运营成本更有利于扩大普惠医疗的服务范围、提升普惠医疗的服务效率。对于行业而言,现阶段我国医疗行业的数据流通主要发生纵向同场景/同类型机构之间,横向跨场景/多类型机构之间的数据流通发展较缓,此次健康险定制多方数据联合分析解决方案的落地不仅有利于商业健康险的降本增效良好发展,更可拓展应用于医疗行业中的前沿技术合作、创新药研发、高端医疗器械研发应 146 用以及疾病风险评估、疾病预防、分类诊断等众多场景,联通多种类型的医疗健康数据。147 七、结语 本文从发展背景、发展现状、面临的挑战、发展建议等几个方面探索了金融行业数据应用的发展情况,并作出了详细说明。258、在金融业数据应用发展报告(20212022)的基础上进行补充,深度剖析了金融机构与互联网公司最关注的政策指引;并对数据要素、数据资产、数据产品服务、数据运营、数据治理以及时下最热门的数据共享和隐私计算进行大量专业描述;本文还提出了现阶段金融业数据应用面临的问题和挑战,并对各问题进行探索分析,提出了可落地实施的建议。报告全文在数据专业委员会(以下简称“专委会”)与北京金融科技产业联盟(以下简称“产业联盟”)共同指导下,由多家金融机构、科技公司合作编写而成。数据专委会自成立以来,坚持“需求导向、创新驱动、协同发展、互利共赢”的工作原则,在提升金融业数据治理能力、释放数据要素潜能、强化数据安全保护等259、方面取得了阶段性成效,为服务央行履职加强金融科技审慎监管、加快金融服务智慧再造等方面提供了有效支持。专委会在各委员单位的共同努力下,积极落实中国人民银行金融科技发展规划(20222025 年),聚焦金融业数据领域热点和共性问题,联合产学研用各方力量,从标准研制、课题攻关、产业研究、宣传推广及成果转化等方面积极开展工作。已完成的成果如下。148 序号 类型 成果名称 牵头单位 1 团体标准 金融业数据能力量化评价规范 国金认证 2 团体标准 金融数据资源目录编制指南 成方金信 3 团体标准 金融信息数据交换系统接口规范 清算总中心 4 团体标准 金融业隐私计算互联互通平台技术规范 中国银联 5 260、研究报告 隐私计算金融应用调研报告 联盟秘书处 6 研究报告 隐私计算技术金融应用研究报告 农业银行 7 研究报告 多方安全计算金融应用现状及实施指引 工商银行 8 研究报告 联邦学习技术金融应用白皮书 工商银行 9 研究报告 基于联盟链技术的隐私保护金融应用研究报告 工商银行 10 研究报告 金融业隐私计算互联互通技术研究报告 中国银联 11 研究报告 金融业隐私计算安全验证技术研究 中国银行 12 研究报告 隐私保护技术在金融应用研究 中金金融认证 13 研究报告 金融业隐私计算应用风险与问题研究 网联清算 14 研究报告 金融数据保护治理白皮书 工商银行 15 研究报告 金融数据要素流通261、技术与应用研究 工商银行 16 研究报告 金融业数据分类分级与保护应用研究 工商银行 17 研究报告 金融业隐私计算联合建模技术与应用研究 中国银行 18 研究报告 金融数据资产估值与交易研究 恒丰银行 19 研究报告 海量数据处理技术金融应用研究 腾讯 20 自律公约 金融数据应用行业自律公约 中金金融认证 21 产业报告 金融业数据应用发展报告(20212022)农业银行 22 研究报告 个人数据在金融领域规范流通机制研究 中国银行 23 研究报告 公共数据在金融领域规范应用研究 建设银行 24 产业报告 金融业数据应用发展报告(2023)农业银行 2024 年,专委会将继续围绕落实人民银262、行金融科技发展规划,紧跟数据最新政策要求,凝聚各专委会成员优势力量,不断增强专委会前瞻引导能力,持续发挥专委会的联合创新作用。2024 年,专委会正在推进以下工作。序号 类型 任务名称 牵头单位 目前阶段 1 行业标准 金融元数据规范 成方金信 报批阶段 149 光大银行 2 行业标准 金融数据应用建模指南 建设银行 送审阶段 3 行业标准 联邦学习技术金融应用规范 工商银行 征求意见阶段 4 团体标准 金融业数据研发运营一体化技术应用指南 工商银行 立项阶段 5 团体标准 金融企业级数据中台技术规范 中国银行 立项阶段 6 团体标准 多方安全计算金融应用 计算合约技术要求 平安保险集团 立项263、阶段 7 团体标准 金融业数据管理人员能力评价规范 国金认证 立项阶段 8 团体标准 基于可信执行环境的隐私计算金融应用技术规范 工商银行 立项阶段 9 团体标准 金融数据交换技术指南 国金认证 立项阶段 10 团体标准 金融业数据管理人员能力评价规范 中国银行 立项阶段 11 团体标准 数字信贷数据保护能力建设指引 国金认证 立项阶段 12 研究报告 数字孪生技术金融行业研究 交通银行 预研阶段 13 研究报告 金融业智能数据脱敏技术研究 交通银行 预研阶段 14 研究报告 商业银行数据要素市场化建设与应用研究 中国银行 预研阶段 15 研究报告 面向业务的 DATAOPS 管理体系建设实践264、研究 中国银行 预研阶段 16 研究报告 后量子隐私计算技术在金融领域应用研究 中国银联 预研阶段 17 研究报告 基于数据空间的金融数据可信流通方案研究 中信银行 预研阶段 18 研究报告 金融业全流程实时数据服务研究 农业银行 预研阶段 19 研究报告 数据要素背景下金融业数据治理新路径研究 交通银行 预研阶段 20 研究报告 金融数据确权授权模式和技术研究 中金金融认证 预研阶段 21 研究报告 金融业隐私计算互联互通应用案例 中国银联 预研阶段 22 发展报告 金融业数据应用发展报告 2024 建设银行 预研阶段 150 八、附录 隐私计算产品信息 序号 产品名称 申报单位 产品简介 265、1 数牍科技隐私计算平台产品 Tusita 北京数牍科技有限公司 该平台为全软件实现,通过在参与方私有网络域内部署自研隐私计算节点软件单元,和参与方内部数据库进行交互,数据和计算因子加密。在参与方间的通信,引入了内部控制监控单元和外部协调单元等模块,通过多层的证书链认证,确保数据交互用户可控制、信息可监控。参与方间的通信内容为不可反推的加密形式,且不引入额外的第三方参与数据传输(包括数牍平台本身),通信支持网络专线或互联网环境。数牍科技综合性隐私计算产品主要面向双边、多边客户提供服务。供应侧为数据源方,诸如政府、电信运营商、支付平台等拥有高价值数据源;需求侧为数据使用方,例如银行、保险公司、消266、费品公司等需要高度借助外部数据提升内部运营效率的机构。2 隐语 Secretflow 蚂蚁链摩斯隐私计算互联互通链接器Morse Flow 蚂蚁科技集团股份有限公司 蚂蚁集团隐私计算产品涵盖隐私计算互联互通连接器 Morse Flow 和开源可信隐私计算框架隐语 SecretFlow 隐私计算产品百花齐放,互联互通需求日益凸显。蚂蚁链摩斯结合互联互通应用需求及落地可行性,开创性地提出隐私计算互联互通连接器Morse Flow,定位于打造与具体业务和产品形态无关、聚焦于通过引擎互通实现隐私计算产品互通的应用系统,即不同执行引擎间通过一套参数描述实现互联互通。Morse Flow上游可以开放不同产267、品形态的产品自行对接,下游可以实现对不同计算引擎的打通,实现隐私计算跨节点、跨引擎、跨产品形态的互联互通。开源可信隐私计算框架隐语 SecretFlow。其以安全、开放为核心设计理念,内置多方安全计算(MPC)、可信执行环境(TEE)、同态加密(HE)等多种密态计算虚拟设备供灵活选择,提供丰富的联邦学习(FL)算法 151 和差分隐私(DP)机制,从技术层面解决数据流通中的数据安全和隐私保护问题。通过良好的分层设计及开箱即用的隐私保护数据分析及机器学习等功能,降低隐私计算开发者和使用者的技术门槛,助力隐私计算更广泛地应用到 AI、数据分析等场景中,解决隐私保护和数据孤岛等行业痛点,助力实现技术268、普惠和行业生态共建。3 风洞多方安全计算平台 蚂蚁科技集团股份有限公司“风洞多方安全计算平台”(后简称风洞平台)。基于隐私计算底座“隐语”,助力打破金融机构间的“数据孤岛”。平台按照多方安全计算金融应用技术规范(JRT01962020)的要求打造,基于秘密分享、同态加密、椭圆曲线加密、不经意传输等密码学算法,实现了联合分析、联合建模、联合圈人、安全核对等行业应用。在风控、营销、数据治理等场景服务蚂蚁集团及其生态合作伙伴,以“数据可用不可见”的方式实现金融普惠。风洞平台是首批获得 BCTC 国家级认证的金融应用产品。在 2023 中国国际金融展上,风洞平台荣获“金融科技创新成果奖”,被央行评为近269、两年最具突破性的金融科技产品。4 联通链可信协同计算平台 联通数字科技有限公司 联通链可信协同计算平台依托联通大数据、人工智能和区块链技术融合创新,面向数据提供方、业务需求方、监管方等数据要素市场角色提供“区块链+隐私计算”的一体化服务能力,旨在基于区块链构建的可信价值交换网络中进行多方协同计算,如多方联合建模、联合统计、联合查询,实现“隐私数据不出域、数据可用不可见、协同过程可审计”的多方数据价值共创。在平台架构设计方面,采用多隐私计算框架设计,未来可扩展,面对隐私计算的多样化技术路线以及多维度的技术指标,隐私计算应用者可根据各框架优劣势,结合实际需求及选型要点灵活选择计算框架,满足不同客户270、多样化场景实践,目前已适配 FATE 框架,也正在进行与其他主流隐私计算框架的适配;在算法方面,具备隐匿查询、安全求交、特征工程、联合建模等核心算法能力,并联合百度、数牍、阿里等企业,创新性地提出了可信协同计算平台互联互通规范,以实现异构平台互联互通。152 5 京东万象隐私计算服务平台 京东科技信息技术有限公司 京东万象隐私计算服务平台是京东科技基于联邦学习、安全多方计算、可信执行环境、密码学等交叉技术,自主研发的工业级隐私增强计算(PEC)产品。他是在数据隐私与安全合规的前提下,面向数据合作、数据交易、数据共享等数据流通应用需求,实现多方数据间的安全求交、匿踪查询、联合分析、联邦建模等核心271、功能,其能够有效达成数据的合规应用与价值传递,满足监管要求、提升客户业务价值,促进数据经济高质量发展。产品框架方面,涉及:隐私计算服务层、平台层、基建层,支持全对等、计算中心化、监管中心化部署模式。技术框架方面,产品建设有云原生轻量化分布式架构体系,研发全密态联邦学习、可信多方安全计算、可信安全沙箱、国密算法等核心技术,支持信创国产化适配,以及软、硬件环境的高性能、可扩展、易维护特性。核心算法方面,产品研发有大规模数据、复杂算子、高安全强度、多协议组件的纵向/横向联邦学习、多方安全计算算法,融合有深度学习框架。同时,系统支持万级隐私计算节点接入与任务并发,可支撑十亿级样本量数据计算任务,满足金272、融联合营销、政务民生数融等多场景需求。6 基于飞腾 D2000 的可信智能收费终端一体机 飞腾信息技术有限公司 可信智能收费终端一体机在金融行业收费场景下,可支持各种收费数据在可信执行环境(TEE)环境中安全使用,实现端、网、边、云全链路的可信传输。该产品将终端系统划分为 REE 侧和 TEE 侧:REE 侧采用可信计算技术进行系统增强,确保系统本身及应用运行的可信安全;TEE 侧采用机密计算技术,确保关键应用的关键数据在计算和传输阶段的机密性,使系统可信安全,数据真实可靠。在区块链金融应用场景中,可保障源头数据上链的安全、真实,提高区块链的整体性能。1.可信支撑模块。为实现可信计算功能提供基273、础的驱动程序、软件栈和命令集,为上层应用提供接口和服务,为可信设备实施各种可信计算功能提供基础支撑。2.操作系统可信增强系统。通过对 Linux 等主流操作系统进行可信安全增强,为用户业务应用提供安全可信的运行环境,主动有效应对各 153 种新型病毒、木马和 0Day 漏洞的攻击,保障系统平台和应用程序的持续安全。3.可信安全管理。符合等保 2.0 标准对“安全管理中心”的要求,具备设备可信验证管理、安全环境配置、告警事件,审计日志汇集展示等功能,帮助用户直观、高效地对各类应用场景信息系统进行统一安全管理。4 可信代理软件。对标可信计算针对连接“安全管理中心”的统一管理要求,帮助用户对云计算、274、物联网等各类应用场景的系统进行统一安全管理。该产品在飞腾 TEE(可信执行环境)中实现区块链上链和收费数据的安全保护。核心技术包括:可信计算。可信计算。可信计算基于可信根(支持 TCM、TPM、TPCM 等标准),从平台加电开始,从固件、到操作系统/虚拟化软件、再到应用程序执行,构建起完整的信任链,逐级度量认证,未获认证的程序不能执行,从而使信息系统实现自身免疫,构建起高安全等级的主动防御体系。机密计算。机密计算。机密计算主要是基于硬件的可信执行环境(Trusted Execution Environment,TEE)中执行计算来保护使用中的数据,通过可信执行环境在运算过程中所使用的系统资源的275、隔离机制及运行环境加密机制,使得数据在计算的过程中不被恶意窃取、敏感数据在使用过程中达到匿名化要求。7 共享智能决策引擎 光大科技有限公司 共享智能决策引擎是以数据科学、模型训练、模型资产管理、模型服务部署为核心功能的机器学习平台,对业务中通过机器学习、隐私计算等技术产生的一系列智能化模型资产提供全流程规范化管理与支持。其搭载金融领域常用机器学习、深度学习算法组件,兼容主流隐私计算框架,能够在各类场景为用户提供模型的全生命周期管理,赋能安全合规可信的企业级模型应用开发与管理。该引擎不仅可以将监管合规要求与业务需求相结合,还使模型开发流程变得可控、合规,并且易于管理。解决了金融机构面临的建模复杂276、、特征分散、部署效率低下、数据合规共享等问题,通过将传统的数据处理、模型训练、154 模型验证、模型仓库管理和模型部署整合到一个系统中,用户能够在一个安全的环境中高效完成本地和联邦模型的开发和部署,从而显著提高了企业智能模型的应用和管理效率,同时降低了模型操作风险,确保隐私数据的保护。8 清交多方计算平台 华控清交信息科技(北京)有限公司 华控清交多方计算平台结合密码学和大数据技术从数据运算的底层把数据中可见的信息和不用看见就可以用于计算的使用价值分离,做到既分享数据、又保证被分享的数据价值不流失(“数据可用不可见”),并在此基础上实现控制数据的具体使用目的、方式和次数(“使用可控可计量”),277、为金融客户提供风险控制、信用评估、联合反诈、联合营销等应用场景。1)平台对外提供密文计算接口,通过秘密分享等密码协议,提供多方安全计算、联邦机器学习等计算引擎,实现灵活的明密文混合计算。2)平台提供各类函数和算法库,包括科学计算库、特征工程库,机器学习库等安全算法,可灵活定义应用算法以满足不同场景的需求。3)依托各类安全算法支撑,平台抽象出隐私求交、隐匿查询、联合统计、联合建模等通用场景,提供数据分析、挖掘和计算能力。4)平台可从密码协议、算法模型、计算任务、专用硬件以及部署模式等多个层面进行优化和加速。5)平台通过数据资源、算法模型、计算合约、任务调度和参与方等管理模块严格控制数据使用,对数278、据提供、计算过程和计算结果存证,并记录用户行为、合约执行情况等日志,管理员可以对系统进行安全审计和算法审查等。9 隐私计算数据安全平台软件(简称“YunPCDS”、隐擎平台)杭州云象网络技术有限公司 YunPCDS 是基于多方安全计算、联邦学习、隐私保护、区块链等技术构建的隐私计算平台,通过隐擎平台可以实现数据加密计算,提高数据安全性和隐私保护水平。隐擎平台的技术架构底层依赖于 Tensorflow/Pytorch(深度学习)、EggRoll/Spark(分布式计算框架)和多方联邦通信网络。上层则是联邦安全协议,并在安全协议的基础上构建联邦安全算子库。隐擎平台在技术架构顶层构建了核心调度平台、279、离线管理平台、在线 155 推理平台、特征引擎平台和联盟注册中心。使用多方安全计算(MPC)以及同态加密(HE)技术构建底层安全计算协议,以此支持不同种类的机器学习的联邦间安全计算。隐擎平台支持同态加密、Secretshare、DiffieHellman 等多种多方安全计算协议。平台包含多种联邦特征工程算法,例如纵向横向联邦的分箱算法、特征选择算法、Pearson 系数算法等;包含多种联邦机器学习算法,例如隐私求交 PSI 算法、线性回归算法、逻辑回归算法、XGBoost 算法等;支持联邦模型评估算法,输出 20 种模型评估指标项,例如 AUC、ACCURACY、KS、LIFT 等。10 工商280、银行隐私计算平台 中国工商银行软件开发中心 工商银行隐私计算平台涵盖联邦学习、多方安全计算两大主流隐私计算技术,融合区块链技术,协同打造联邦学习子平台和多方安全计算子平台,可支持 100 余种联邦学习算子、400余种密文函数计算库,提供隐私求交、联邦特征工程、联合统计、联邦建模、隐匿查询等不同隐私计算服务,并在普惠信贷、客户营销、风险防控、资金流向监测等业务场景中进行有效赋能.联邦学习子平台联邦学习子平台 联邦学习技术平台定位于多方数据联邦安全建模。如图 2 所示,平台总体分为基础设施层、算法与安全层,以及联邦工作站层。基础设施层基于云计算和大数据平台实现统一调度算力供给和数据供给,支撑平台进281、行高效的亿级数据隐私求交和百万级数据联邦建模;算法和安全层实现多种主流的联邦学习算法,如横向联邦、纵向联邦等,以及多种隐私计算底层密码协议,如秘密分享、同态加密等,为联邦学习任务隐私保护保驾护航。联邦工作站层负责对外提供相关服务,包含隐私求交、联邦特征工程、联邦建模、模型推理四种主要服务,同时建设数据预处理到模型发布的统一流水线,减低用户使用门槛。此外,在运营管理方面,工作站通过运营分析、配置管理等模块,便于用户实时掌握平台运行状况。多方安全计算子平台多方安全计算子平台 多方安全计算平台定位于多方数据通用安全计算。平台通过一系列密码学协议支撑,实现 156 多方原始数据密文协同计算,全面保障原282、始数据隐私安全。如图 3 所示,平台涵盖协议层、算法层、服务层、管控层四个层级,以 SDK 方式为工商银行各业务条线提供联合统计、隐私求交、隐匿查询等密文计算服务。其中,协议层主要提供秘密分享、混淆电路、同态加密、不经意传输等隐私计算底层算法的支撑;算法层主要继承多种密文算法函数库,用以实现不同的统计探查方式;服务层基于密文算法函数库提供联合计算、隐匿查询等不同隐私计算服务。管控层主要针对存证、任务、日志、监控等方面进行系统层面管理。11 全匿踪联邦学习技术 上海富数科技有限公司 全匿踪联邦学习技术由富数科技自主研发,攻关联邦学习全流程“匿名化”,实现在无交集泄露的、匿名化的多方数据集上进行联283、邦学习,从而保护所有敏感信息,解决“合规问题”。全匿踪联邦学习技术方案用于实现数据源侧与银行等金融机构应用侧数据融合和联邦建模,实现在无交集泄露的、匿名化的多方数据集上进行联邦学习,是一种能够保护所有敏感信息的多方联合建模范式。全匿踪联邦学习关键技术包含三个部分:首先是匿踪对齐,即在不泄露包括交集在内的所有敏感信息的情况下实现多方样本对齐;其次是匿名化处理,即确保个人信息经过处理后无法识别到特定自然人且不能复原;第三是匿踪学习算法,即在不泄露交集 ID 的情况下完成联邦建模和联邦评估。对经过匿名化处理的信息进行联合建模能够满足各项合规要求。12 Avatar 安全计算平台 上海富数科技有限公司284、 Avatar(阿凡达)安全计算平台是富数科技自主研发的一站式企业级多方安全计算平台,集成隐私集合求交(PSI)、多方安全计算(MPC)、联邦学习(FL)、隐私信息检索(PIR)等核心安全计算技术,提供企业级数据安全匹配、安全联合计算、安全联合建模、安全查询等跨机构可信数据协作能力,释放数据价值,助力业务创新与增长。在此基础上,用户可以结合实际场景及自身实际需求,通过增加相关模块(包括定制匿踪联盟模块、安全策略模块、AI 计算模块、区块链集成模块等)对标准平台进行补充以实现更多定制化功能。157 核心算法:多方安全计算:利用秘密共享(Secret Sharing)、混淆电路(Garbled C285、ircuit)、同态加密(Homomorphic Encryption)等技术对数据进行安全计算。通过多方联合加、减、乘、除、比较等运算完成数据多方统计分析和数据探索。联邦学习:算法丰富:支持纵向联邦、横向联邦多种算法,如分类算法、回归算法、神经网络、聚类算法等;全匿联邦学习:高性能批处理纯密态对齐算法(BNS),高性能批处理纯密态 Shuffle 算法(MTSN),富数自研多方匿名化算法(MPA),全匿样本联邦学习算法(AnonymFL)匿踪查询:同时支持 RSA 和国密 SM2,自主可控 13 金智塔“智隐”隐私计算平台 杭州金智塔科技有限公司 在国家重点研发项目(NO.2018YFB14286、03001)支持下,金智塔科技自主研发的隐私计算平台融合了多方安全计算、同态加密、可信执行环境、区块链、数字水印等软硬结合技术,提供联合建模、联合统计、匿踪查询、在线推理等服务,实现数据“可用不可见”“用途可控可计量”,赋能数据要素安全高效流通,并促进数据要素的融合创新应用。核心能力核心能力 联合建模:支持多方数据在不出域的前提下完成模型训练,覆盖神经网络、决策树、逻辑回归等主流算法。联合统计:支持多方数据在不出域的前提下完成统计,覆盖中位数、方差、偏离度等统计学指标。匿踪查询:数据查询时,保护查询对象的身份信息不暴露给数源方,例如身份证号、电话号码、组织机构代码等。在线推理:将训练完成的模型287、在隔离环境独立部署,支持千万级高并发、亿级大数据、毫秒级响应的场景需求。14 GAIA 隐私计算平台互联互通产品 蓝象智联(杭州)科技有限公司 以 GAIA 隐私计算平台为基础,满足金融业异构隐私计算平台互联互通技术规范 的相关要求,与中国银联及多家隐私计算平台实现了网络化互联互通。并结合蓝象智联自身数据生 158 态优势,推出了 GAIA 隐私计算平台互联互通产品。首先,各隐私计算平台要持续地发展各自生态优势和技术创新,以此构建更多的业务场景,业务场景的丰富,也会随之带来更加强烈的互联互通产业诉求。其次,各隐私计算平台应该以标准化的方式,构建互联互通的技术底座,将自身平台与互联互通技术底座联288、通,使各平台具备通用的互联互通基础能力。以各平台的标准产品加互联互通技术底座的方式,形成具备互联互通的隐私计算产品。最后,充分考虑现实情况下,隐私计算存在的差异性与算法互联互通的工程效率成本,通过产品加服务的形式组成互联互通的整体方案,其中服务主要包含了两个部分,一个是差异化的转接,通过建立差异化的转接器解决局部性的兼容问题,另外一方,构建互联互通算法套件,这类套件以标准化的可信方式进行共享,也可以面向具体业务场景,进行针对性的算法创新开发。在 GAIA 隐私计算平台互联互通产品的基础上,创新推出了互联互通产品套件,并基于实际业务诉求,实现场景定制化服务,以满足业内最新互联互通标准;在链接 G289、AIA 已有数百家的数据生态基础上,实现跨平台扩充链接 15 鲲鹏可信执行环境密码系统 北京数字认证股份有限公司 鲲鹏可信执行环境密码系统(简称“鲲密”)是一款基于机密计算技术研发的密码产品,以软件形态安装在鲲鹏服务器上,具备二级商密资质。依赖机密计算环境,为上层应用提供内生、合规且敏捷的密码服务。鲲密的技术架构包含可信密码服务-TA、通用密码服务-CA、应用集成 SDK 和密钥管理系统四部分。可信密码服务-TA 运行在可信执行环境中,提供基于敏感信息的运算功能;通用密码服务-CA 运行在普通执行环境中,承担可信密码服务的代理角色,提供包括通信处理、协议转换、摘要计算等不涉及敏感信息计算的通用290、功能;应用集成 SDK 为业务应用提供方便调用的密码服务接口;密钥管理系统独立部署在鲲鹏服务器外部,负责 159 鲲鹏可信执行环境密码模块的初始化工作。鲲密已支持 SM2/SM3/SM4 等国密算法。并具备如 RSA 等通用国际算法和后量子密码算法的兼容能力,可为国产密码应用和后量子密码算法迁移试点等场景提供支撑。16 融安隐私计算平台 神州融安数字科技(北京)有限公司 针对数据隐私保护需求,神州融安数字科技(北京)有限公司创新推出“融安隐私计算平台”安全设备,综合多方安全计算、联邦学习等计算引擎和国产密码安全芯片、国产商用密码算法等安全技术,在保证数据流通过程中不泄露原始数据的前提下,对数据291、进行多维分析和计算,保障敏感数据在存储、计算、应用、销毁等全流程各个环节的“可用不可见”,满足应用于金融、运营商、医疗等场景数据流通计算的需求。17 银联隐私计算互联互通平台 中国银联股份有限公司 银联隐私计算互联互通平台是以 FATE v1.7.2版本为原型,集成了云原生架构作为底层能力,并结合金融数据合作特点做二次开发的平台实例。平台在模式设计、部署形式、技术实现上均进行自主定制,提供企业级的管理与交互,可支撑与商业银行共同开展基于隐私计算的数据应用合作,并率先支持了跨隐私计算平台互联互通能力。平台技术框架主要由三层体系搭建:一级管理层、二级管理层、隐私计算核心框架,其中,核心框架部分包括292、平台所主持的主要三类算法功能。互联互通引擎支持以容器化的方式运行异构隐私计算平台算法镜像,快速实现跨平台算法互联互通。联合建模/推理包括联合特征工程、联合建模和联合预测三类。其中联合特征工程提供数据分箱及单变量分析方法;联合建模支持横向逻辑回归、线性回归;以及纵向逻辑回归、线性回归、XGBoost 树;联合预测提供多种标准化模型质量预测指标计算。联合计算包括联合四则运算、联合比较运算两类。其中联合四则运算基于算数空间的多方秘密分享算法实现;联合比较运算基于不经意传输协议和混淆电路实现。18 魔方隐私计算平台 杭州云链趣链数字科技有限公司 魔方隐私计算平台是基于国产信创、专注产融领域、释放数据价293、值、打破产业端/平台端/金融端横纵向数据壁垒的数据服务平台。隐私 160 计算是在保证不泄露数据提供方原始数据的前提下,对数据进行分析计算的一系列信息技术,保障数据在流通与融合过程中的“可用不可见”。云趣数科“魔方”隐私计算平台主要应用于产业数字金融场景,通过建立产融联盟链,整合业务相关方,包括金融机构、核心企业、第三方服务平台等,各方以节点的形式加入联盟链。整体业务逻辑如下:首先节点创建任务上链,并将任务分发给其他节点方,完成节点与联盟链之间的权限校验、任务审核后,节点之间协同执行计算与交互任务,并获取计算结果,同时结果将被实时记录上链。19 蜂巢联邦智能隐私计算平台 深圳壹账通智能科技有限294、公司 蜂巢联邦智能隐私计算平台基于自研联邦学习、多方安全计算、可信执行环境、先进密码学算法等核心技术,结合云原生架构体系,支持信创和软硬件结合可信硬件基础,提供高性能、可扩展、易维护的隐私计算产品化服务。针对金融行业数据安全合规、隐私保护等业务特性,制定了分布式微服务架构、分布式数据库、高安全性算法和异构平台互联互通领域的技术标准,通过项目、任务、算子、节点、数据等多维度互通,采用组件化、低代码复用设计,解耦业务流程及技术细节,可快速响应业务场景灵活配置需求。核心算法上,设计实现了自主研发了基于格上计算困难问题的高性能同态加密算法,设计了同态加密自动适配机制。同时建设高保密可审计的梯度采集与参295、数更新机制。大幅提升密文同态计算性能,实现128 位安全等级的抗量子攻击隐私计算应用。自研硬件、软件、节点所有权的三重身份确认远程验证服务架构,支持万级节点实时在线和百亿级数据隐私计算任务。20 洞见数智联邦平台(InsightOne)深圳市洞见智慧科技有限公司 洞见数智联邦平台(InsightOne)是洞见科技自主研发的金融级隐私计算平台,拥有面向场景的融合计算引擎、可监管的分布式信任架构、全计算链路隐私安全保护、深入场景的专业算法、无可信第三方联邦学习、匿踪联邦学习、区块链增信网关、图联邦学习、跨平台互联互通容器等核心技术,基于数据与场景的链 161 接,聚焦于为政务、金融、能源等客户提供296、基于隐私计算生态底座建设及面向场景的数据智能服务,具备安全、融合、兼容、灵活、专业、易用等特点。InsightOne 提供软件平台和软硬件一体机两种交付形式,一体机产品融合了计算、网络、存储等硬件资源与专用隐私计算算法软件,深度优化了面向国产信创硬件的底层算法,与通用 GPU 加速硬件和高性能密码加速卡统一整合、调动,实现大规模分布式加密计算或训练,满足大型机构在数据协同、共享、交换等场景的高性能计算需求。21 SaaS 服务平台的可信安全技术 上海浦东发展银行股份有限公司、北京冲量在线科技有限公司 浦发银行与冲量在线建设的基于国产化可信硬件围绕 SaaS 服务的可信安全技术能力,以机密计算作297、为关键技术能力,着力于基于可信执行环境(TEE)安全虚拟化技术进行容器化服务整体加密迁移,实现容器从镜像下载到运行整个生命周期的安全加固,提升服务容器的安全性。同时将 OCR 算法、待识别数据(如合同、发票等)运行在 TEE 节点上,提供可信增强算力和服务开放能力,促进金融服务能力可在多机构间安全合规的共享。随着信息安全法个人信息保护法等相关法律法规的出台,隐私信息的保护越来越受到关注,用户对于个人信息的保护意识逐渐增强,传统的 SaaS 服务方式在数据的隐私保护上存在不足。而在金融应用场景中,存在多方(例如,数据拥有方、建模服务方、模型服务提供方、算力拥有方)不互信的问题。该产品提升金融科技298、对外提供服务的能力和金融科技的服务效率,浦发银行将金融科技服务能力提供给中小金融机构及核心企业,将已成熟的金融应用(如 AI 能力的 OCR、NLP 等)安全向外输出。22 浦发银行波塞冬隐私计算产品 上海浦东发展银行股份有限公司 2022 年,国家“十四五”数字经济发展规划指出,数字经济是继农业经济、工业经济之后的主要经济形态,是以数据资源为关键要素的新经济形态,因此数据资产正在逐渐演变成为国家的战略资源和核心能力。数据以密态形式在主体间流动和计算的合作模式,将成为整个数字领域的核心竞争力,也是行业发展的 162 共同诉求。在此背景下,浦发银行基于隐私计算这一前沿技术领域,打造行业领先、具备299、更强兼容性的波塞冬隐私计算产品,支持包含隐私求交、匿踪查询、联邦学习、联合统计分析等在内的多类隐私计算合作需求,助力总分行部门构建内外部有机融合的全域开放式数据合作生态体系,链接政府机构、核心企业、互联网企业、实体企业四大类生态合作伙伴,实现生态化的数据密态价值共建,为浦发银行及合作伙伴提供安全合规的数据分析调研、数据价值共享及数据资产交易渠道,增加高价值可用数据、缓解数据孤岛问题,不断增强数据合作的规范性与安全性,增加产业、领域合作场景的丰富度、创新度和核心产出。同时,基于本产品的系统建设、生产支撑和场景应用经验,浦发银行联合北京金融科技产业联盟形成 金融业隐私计算互联互通平台技术规范团体标准,并基于标准实现管理面、数据面互联互通,建设 1+N 模式标准化异构互联互通能力,降低重复建设成本,高效赋能数据要素整合和价值发挥。

    下载