2018年,银保监会发布《银行业金融机构数据治理指引》,为银行业金融机构加强数据治理,提高数据质量,提升经营管理能力提供了具体指导意见。本文旨在通过对行业典型企业在《指引》指导下建立的数据体系标准解读,为银行业金融机构引入外部数据,提供数据技术要求等层面的相关决策参考。(本文主要针对的银行业金融机构外部数据为:外部风险大数据)
大数据风控服务商(法海风控)典型案例全解析
法海风控,全球顶级AI大数据风控服务商,致力于为全球金融客户提供涉诉、涉税、环保、工商等领域风险信息查询、高精数据建模、风险预警监控系统建设等全流程风险管控解决方案,在自有大数据AI技术体系和多年银行业金融风控项目实践基础上,已形成了完备的数据质量标准、数据技术服务、数据深度挖掘三大数据、技术与服务支撑体系,目前已服务于工商银行总行、中国银行总行、建设银行总行、交通银行总行、光大银行总行、浦发银行总行、浙商银行总行、上海银行总行、天津农商行总行等国有、股份制、城商行、农商行银行机构,中国互联网金融协会、邓白氏、益博睿、芝麻信用、平安集团、阳光财险、泰康在线财险、清华大学、哈佛大学等全球顶尖机构。注:以下数据与技术服务内容,在《指引》出台前均已形成并落地执行,仅在《指引》出台后,对其进行了内容整合与重组。
01 数据质量标准体系
数据质量方面,法海风控依据《指引》第五条、第二十九条指导意见,提出了“全、准、精、快、稳”为核心的数据质量标准评价体系,并以自有大数据测试发明专利,确保了五项数据指标在生产及服务中的真实落地:
1.全:全量数据。(任何一条被遗漏的风险数据,都有可能酿成重大金融风险事故);
2.准:解析准确度达到银行应用标准的结构化数据。(低准确度数据,会让风险结论严重失真);
3.精:根据银行特定业务需求,对数据进行深度解析后提取的高精结构化数据。(更多支撑建模的高精字段,更多风险量化指标,银行业金融机构进行数据深度挖掘与应用的数据基础);
4.快:快速、及时的数据更新频率和数据响应时间。
5.稳:稳定、持续的数据服务。确保在数据采集与清洗、数据存储、数据传输、数据问题响应等方面,不出现可能影响行方业务条线运作的数据事故。
保障方案:自有大数据测试发明专利
包括了覆盖率、公信度、遗漏率、追溯率、精细度、一致性、精准度、重复率、空值率、生产周期等子模型,能够对数据生命周期中数据生产、数据测试、数据存储、数据服务各个流通环节进行质量标准管理。
02数据技术服务体系
数据技术服务体系方面,法海风控依据《指引》第二十条、第二十一条、第二十六条、第二十九条、第三十条等指导意见,以全球顶尖人工智能与大数据技术为基础,打造了数据全流程技术支撑体系,符合银行业金融机构进行数据引入和标准化建设等一系列关于技术指标的硬性要求:
1. 天罗智能采集系统,智能发现数据源,快速、高效、完备采集各类数据。
2.元界人工智能语义解析引擎:法海领先全球的智能数据结构化解析引擎,能提取出常规解析方案无法识别的更多核心字段,可快速响应定制化数据字段的解析要求。
3. 数精智能文摘:智能生成近百字的智能文本摘要,是目前国内唯一能够进入商用的中文智能文摘系统。
4. 啄木鸟数据测试系统:自动化测试系统,能够对包括数据、模型、接口等多类型测试作业完成快速测试,确保数据、技术服务质量。
5. 曹操大数据接口平台:服务平台统一管理核心服务,并提供管理UI、监控、预警等等系统功能,可快速响应银行业金融机构关于接口标准的一系列技术要求。
6. 聚宝盆数据结算系统:整合内外支付渠道和多业务统计标准,实现跨平台/多业务/多渠道的统一结算和智能连接。
03 数据深度挖掘体系
数据深度挖掘方面,法海风控依据《指引》第三十九条、第四十条、第四十二条等指导意见,进一步加强数据分析与模型系统研发团队力量,包括银行、征信、金融科技等领域多年从业经验的硕博人才,深度理解金融业务场景与外部风险数据质检的应用关系,可为客户提供数据领域梳理、数据字段规划、数据应用场景研究、数据应用模型开发、风控预警系统建设等一系列数据分析与建模服务:
1. 数据模型方面,法海风控基于多领域内外部数据,可为客户提供信贷全生命周期的风险数据挖掘与风险规则模型定制研发服务。
2. 数据报告方面,基于高精数据研究,法海风控“鹰眼智能风险报告系统”已支持涉诉风险量化报告、互联网招聘信息风险报告、工商信息风险报告、涉诉一眼清报告、涉诉舆情报告、企业综合报告等外部风险数据报告模型,以及财务、征信等机构内数据报告模型。
3. 数据预警监控方面,基于数据风险的字段级挖掘,法海风控“先知风险预警监控系统”可实现信贷业务全流程风险预警及管控。
4.系统建设方面,法海风控已积累了包括智能风控系统、智能数据分析系统、智能数据报告系统、业务预警规则系统等海量数据系统建设经验,拥有全国TOP城商行、股份行系统建设经验,在业务预警规则、数据智能处理、业务流支撑、行内系统实施等方面,都已形成体系化、可灵活配置部署的解决方案。
附:《银行业金融机构数据治理指引》相关条例
第五条 银行业金融机构数据治理应当遵循以下基本原则:
(一)全覆盖原则。数据治理应当覆盖数据的全生命周期,覆盖业务经营、风险管理和内部控制流程中的全部数据,覆盖内部数据和外部数据,覆盖监管数据,覆盖所有分支机构和附属机构。
(二)匹配性原则。数据治理应当与管理模式、业务规模、风险状况等相适应,并根据情况变化进行调整。
(三)持续性原则。数据治理应当持续开展,建立长效机制。
(四)有效性原则。数据治理应当推动数据真实准确客观反映银行业金融机构实际情况,并有效应用于经营管理。
第二十条 银行业金融机构应当建立覆盖全部数据的标准化规划,遵循统一的业务规范和技术标准。数据标准应当符合国家标准化政策及监管规定,并确保被有效执行。
第二十一条 银行业金融机构应当持续完善信息系统,覆盖各项业务和管理数据。信息系统应当有完备的数据字典和维护流程,并具有可拓展性。
第二十三条 银行业金融机构应当加强数据采集的统一管理,明确系统间数据交换流程和标准,实现各类数据有效共享。
第二十六条 银行业金融机构应当建立数据应急预案,根据业务影响分析,组织开展应急演练,完善处置流程,保证在系统服务异常以及危机等情景下数据的完整、准确和连续。
第二十九条 银行业金融机构应当确立数据质量管理目标,建立控制机制,确保数据的真实性、准确性、连续性、完整性和及时性。
第三十条 银行业金融机构各项业务制度应当充分考虑数据质量管理需要,涉及指标含义清晰明确,取数规则统一,并根据业务变化及时更新。
第三十九条 银行业金融机构应当充分运用数据分析,合理制定风险管理策略、风险偏好、风险限额以及风险管理政策和程序,监控执行情况并适时优化调整,提升风险管理体系的有效性。全球系统重要性银行应遵循更高的标准,对照有效风险数据加总与风险报告评估要点的相关要求,强化风险管理。
第四十条 银行业金融机构应当加强数据应用,持续改善风险管理方法,有效识别、计量、评估、监测、报告和控制各类风险。
第四十二条 银行业金融机构应当加强数据分析应用能力,提高风险报告质量,明确风险报告数据准确性保障措施,覆盖重要风险领域和新风险,提供风险处置的决策与建议以及未来风险发展趋势。