再谈征信

admin 2020-12-24

朴道征信申请个人征信业务许可的公示出现在央行官网上之后,消息很快在金融圈子里传开。由于在2018年百行征信获得个人征信牌照之后,很长时间没有个人征信批筹的相关消息,所以朴道征信的横空出世有点出人意料,也引起了市场对个人征信新一轮的关注。

加上前段时间,美国个人征信公司Experian(中文名称“益博睿”)声明退出中国市场的消息,颇具刺激性,然后其最近又宣称将继续留在中国市场(从事企业征信),这样的反复以及其中的内情也引起市场对“征信”颇多好奇。

从算话在2015年2月15日通过人民银行上海总部向央行征信管理局提交个人征信业务许可以后,至今时间差不多已经过去整整6年了。在这6年中,总体来说,社会各界和个人征信行业对个人征信的关注热度逐年下降,但是,纵观行业、市场、媒体甚至学界对个人征信的认识,却依然是众说纷纭,里面夹杂着大量的谬误,严重误导了社会各界对中国个人征信行业的认知,影响深远。因此,作为一个在本世纪初就在国务院批准设立的第一家个人征信试点机构——上海资信从事个人征信业务的老兵,想借此机会严肃地聊聊我个人对个人征信相关的几个重要问题的理解和看法

从传统意义和国际惯例上来说,个人征信是指专业机构依法对个人信用信息进行采集和加工,并向合格查询者提供以个人信用报告为主要形式的个人信用信息服务的活动。提供这种服务的专业机构就是个人征信机构其中个人信用信息主要是指信贷数据,包括贷款申请、贷款发放记录、贷款金额、信贷额度使用金额、还款表现、逾期情况等等。有些国家的个人征信机构设立施行许可制,如中国;有些国家则无准入限制。个人征信机构赖以提供个人信用信息服务的数据由信用信息产生方按照与个人征信机构约定的固定格式,以约定的周期和方式报送给个人征信机构,存储在个人征信机构的数据库中。因此,这些个人信用信息相关数据都是标准化的数据。

大数据(big data),按照一般的说法,是指无法在一定时范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能提高更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。一般大数据具备三大特征,即俗称的“3V”。第一个是Volume(海量),数据容量巨大;第二个是Velocity(速度),数据量增长速度巨大,需要处理的速度和响应越来越快;第三个是Variety(多样性),指各种各样类型的数据出现,过去数据更多是结构化的,而大数据很多是半结构化的,甚至是完全没有结构的数据,如文本、邮件乃至语音、视频等。“3V”是对大数据最基本特征的归纳,得到业界的共识。

因此,可以看出来,个人征信和和所谓的“大数据”根本是不相容的两个概念。而我们在媒体、论坛、会议或其它各种场合经常可以看到“大数据征信”的说法,可见谬误流传之广。大数据可以用作风控,可以用来做信用风险评分、欺诈评分、价值评分、客户画像或精准营销模型评分等等,但大数据绝对不可能用于个人征信

我曾经在《中国金融》上发表文章,谈到“大数据征信”的概念类似于“公牛的奶”,奶牛全是母的,这世界上没有公牛身上挤出来的奶,也就没有由大数据产生的征信。

大数据征信之类的谬误的产生和流传,直接误导社会公众对征信机构设立的预期和想象,严重的影响了这些年中国个人征信业的发展。普通老百姓都以为阿里腾讯这样拥有海量个人数据的机构是天然拥有做个人征信的资源或条件的,专业投资人也几乎具有同样的看法,这些都是导致仅几年中国市场化个人征信行业发展不畅的社会因素。殊不知,即便某机构拥有海量的数据,即便这些海量数据属于信用相关数据,也是不能天然用来提供个人征信服务的,因为用于提供个人征信服务的每一个数据,事先必须得到数据主体——即数据所描述的对象本人——的直接授权,才可以用于后续的个人征信服务。所以,任何一家新设征信机构,从理论上讲,在它开业的第一天,它是不可能拥有任何征信数据的,即便它的股东拥有这世界上所有的个人数据。所有的征信数据,都是必须在个人征信机构在提供个人征信服务的过程中一笔一笔经过数据主体授权积累起来的。所以,问一个公司说“你想做征信,你有数据吗?”是一个典型的对征信完全外行的问题。

很多人把信用评分公司看作是征信公司,更有甚者,国内某互联网大厂在跟FICO合作的时候,在合作宣传大会上的大横幅上写的竟然是“某某大厂金融与国际征信巨头FICO达成战略合作”。

评分公司不是征信机构,评分模型咨询公司(输出建模技术和评分咨询服务)更加不是征信机构。芝麻信用管理有限公司从曾经是央行公示的八家个人征信业务筹备机构之一到今天不再以征信机构名义公开对外展业,它的核心产品始终就是所谓的“芝麻信用分”(现在叫“芝麻分”)。

事实上,信用评分本身从来就不是一个征信公司的主要产品或标准产品或基本产品。比如,央行征信中心一直到2017年前后,也就是在它开始提供征信服务十年之后才对商业银行提供名为“个人信用报告数字解读”的个人信用评分,也从事实上证明了信用评分并不是一个征信机构必需的标准产品。

个人征信机构必须具备的基础产品就是“个人信用报告”。所以,芝麻分即便算是信用评分,它也从来就不算是个人征信产品,而顶多是具有一定风险评价功能的增值产品。而且,因为芝麻分的生成所依据的数据主要是阿里生态内的数据,所以基本不涉及跨机构的信贷数据,而跨机构的信贷数据共享是征信机构的核心特征,所以芝麻分也谈不上是征信局信用评分。

另外,因为芝麻分的商业目的显然是激励其个人用户更多地使用阿里、淘宝和支付宝生态内的各类服务,所以它的评分生成机制必须包括“给那些为阿里生态贡献更多价值的人以更高的分”这一价值取向,同时平台和生态内部必须有为更高评分用户提供更好商业回馈的措施,否则芝麻分就无法形成激励用户与阿里生态形成更紧密联系或更强粘性的良性循环的商业闭环,除非芝麻分是一个公益产品。因此,芝麻分甚至不能算是一种信用风险评分,而仅仅是一种基于大数据的会员评分,我个人更愿意把它看做“支付宝个人会员价值评价排序分”

腾讯的微信支付分性质和芝麻分是一模一样的,其它所有互联网平台的各种“分”本质也都类似,在此不再赘述。

个人征信和社会诚信体系建设的很多内容也经常被社会大众所混淆,甚至很多媒体和学者也搞不清楚。个人认为,个人征信是社会诚信体系建设的必由之路。

从实际效果看,社会诚信体系建设仅仅依靠法治或道德教育远远不够。中国的法律不可谓不多,但对于很多信用问题来说,立法和执法成本都很高,因为信用问题涉及到的责任金额往往都不大。中国的道德教育不可谓不源远流长。几千年以来,我们一直口口相传“君子一言,驷马难追”、“徙木立信”、“抱柱之信”、“千金一诺”等等。然而,从现实结果看,在陌生人之间的交易,诚信还是一个大问题。所以,从法律和道德教育两方面入手,诚信社会建设目标的达成速度和效果都难以令人满意,而一个内容更加丰富的个人征信业态可以通过技术手段从根本上促进完成中国社会的诚信转型

征信的核心就是信用信息的共享,包括信用信息向中心汇聚和信用信息向四方提供。把所有人的失信行为信息汇集到一个平台,同时,利用技术手段让所有人都能在交易对手授权的前提下查询其历史信用信息,这就自然建立起个人信用行为“自我约束,自我正向反馈”的良性循环机制。算话公司自我赋予的使命是“科技完美诚信”,公司愿景设定为“守信受益,人人说话算话”,原因就是认定征信或信用风险管理的技术可以承担建设诚信中国的重大职责,关键是怎么做

这几年,最被诟病的就是经常把个人在金融或和资金相关活动中的信用表现(这部分实际上是征信的内容),和个人在社会中其它与金融、财务或资金无关的诚信或遵纪守法的行为(这部分是以德治国或依法治国的内容)混为一谈。比如,闯红灯是不是该记入个人信用数据库、父母老赖能不能剥夺其子女上私立学校或者参军入伍的资格、本人信用卡多次欠费影不影响其报考公务员、交通违规处罚能不能上个人征信报告等等,诸如此类,不一而足。其实这些问题,可以从几个方面来梳理一下。

01

征信体系建设和诚信体系建设的政府管理部门要分开,职责和职能更要界定清楚,各司其职,各尽其责。

2

失信行为的严重程度和失信的惩戒力度要平衡相称。比如,不能出现某人欠1000元不还,就拒绝为其提供所有金融服务。

03

征信中的失信、道德的失信以及对社会法律法规的违反(实际上也可以看作是违法者对法定公约的一种失信)要泾渭分明,不能相互混淆。相应的惩戒或惩罚措施更加要限定在自身的范畴内,不能张冠李戴,不能出现“哥哥生病,弟弟打针”的情形。也就是说,在征信的领域内失信的,就用征信的手段去惩戒。比如,对信用卡有逾期未还清的,金融机构可以不再发放新的贷款或信用卡;行人闯红灯的,可以罚本人在路口举小红旗维持交通秩序两个小时;汽车违规变线的,就记两分,罚200元;杀人放火的就交给刑法处理。说白了,就是“上帝的归上帝,恺撒的归恺撒”,不宜把闯红灯的行为记入征信数据库。

我们也可以注意到,现在各大互联网平台都推出了自己的所谓的“信用分”,这种做法对社会诚信体系建设有利有弊。好处是,客观上提高了普通大众讲诚信或守信用的意识,坏处是,大部分此类“信用分”生成的数据都只能限于自身的平台所积累的数据,无法正确全面地反映一个人真实的信用状况,而偏面的或局部的信用评价有时候比没有评价更不好。征信数据有几个基本要求,包括及时性、准确性、完整性、合法性。任何一个方面的缺失,都有可能对信息主体(被征信主体)造成极大的不公平甚至伤害。因此,社会大众需要将这些巨头自家推出的各类“分”与个人征信乃至信用评分区分看待,对个人征信形成“再认识”,在中国才能凝聚出令个人征信良性发展的共识。媒体和学界尤其需要承担起应有的责任,帮助社会厘清个人征信的真实概念,切忌以讹传讹。

当然还有很多其它方面的内容可以去讨论分析,鉴于篇幅,在此就不再置喙了。

这个问题的答案要视接下来中国个人征信业的发展路径如何演化而定。前不久,第二家市场化个人征信机构朴道征信的许可进入公示阶段,这是一件好事。因为对于个人征信市场长远发展目标来看,逐步增加市场化个人征信机构的数量,是完全正确的方向。如果朴道征信顺利获得许可,那么中国就有百行和朴道两家持牌的市场化个人征信机构了。

而中国在金融领域的个人征信业其实已经发展到一个相当高的阶段。央行征信中心已经基本把全中国金融信贷类的个人征信数据大一统至中国“金融信用信息基础数据库”中,银行类金融机构和其它有信用信息查询需求的金融机构基本都可以获得基础的征信服务。尽管央行征信中心各类个人征信增值服务还有很大的提升空间,但囿于机构编制等原因,所有的个人征信服务全部由央行征信中心来提供也不现实

然而,在社会经济活动中,还有很大一部分信用相关信息没有纳入到该“金融信用信息基础数据库”,比如水电煤欠缴信息,移动运营商服务费缴纳信息,居民小区物业管理费缴纳信息,商业赊销信息,各类社会租赁信息,甚至民间借贷信息,和互联网上带有信用性质各类交易和服务行为信息,都可以成为市场化征信的信息采集和征信服务的对象。

但实事求是讲,如果市场化征信机构只能采集这类信息,那么市场化征信机构的业务空间还是比较窄的。而且,由于这些数据分散在很多不同的行业,受不同的政府监管部门管理,采集这些征信数据的难度还是不小的。

所以,市场化的个人征信有没有未来,取决于很多不确定的因素,比如:

未来还有多少家获许可的个人征信机构?

个人征信许可授予什么样的机构?

被授予个人征信业务许可的机构有没足够的独立性(没有独立性就不可能获得相应的征信数据)?

这些获业务许可的市场化征信机构开展个人征信业务的能力和动力有多强?

获业务许可的个人征信机构实质被允许的、可拓展的征信业务边界到底在哪里?

个人征信和社会诚信体系建设的关系处理得是否得当?

已经被央行征信中心大一统的金融征信领域有没有必要开放竞争?

等等。这些问题如何发展演变都有待观察,中国市场化征信的未来前景如何,需要看上述问题所指向的实质内容在未来如何演变。

按照《征信业管理条例》的规定,个人征信数据的采集法定是必须得到本人明确授权的。而且特定数据不允许采集或需要有条件采集。这些都是为了保护被征信主体的个人隐私等个人数据相关权益,是十分必要的。在个人征信业务开展过程中,一方面,个人隐私等个人数据权益必须被充分保护,另一方面,只有充分保护才能获得社会各界对个人征信业务发展的支持,个人征信业务才能发展得更好

还有,正像前面所提及到的,个人征信机构在从事个人征信服务过程中,个人征信数据必须被完整、及时、准确和合规地得到采集,否则就极容易对被征信主体造成不公平或对征信数据使用者造成损失。比如,如果征信机构只能从某些信用数据源采集到某人的守信数据,未能从其它信用数据源采集到其失信数据,结果会怎么样?结果极可能是金融机构对其信用判断错误,容许对其发放贷款,进而造成贷款无法回收,形成信贷坏账。而反过来,如果征信机构只采集到某人负面失信信息,而未采集到事实上存在的比重更大的正面守信数据,也极可能造成其信贷申请被金融机构拒绝,进而使得其金融消费权益受损。至于发生其它数据采集不及时、不准确、不合规的情形,同理也可能造成类似的后果。所以,对开展征信相关服务的机构应有的要求还是很高的。

然而,事实上,个人征信业务在当前的历史阶段是完全有技术和条件将充分保护个人隐私这项工作做好的。有公信力从业机构的自我约束(基于对品牌、声誉和从业资格等的重视)、各种应对数据库攻击的软硬件、严格的各项数据安全管理规定、针对数据非法使用的严厉法律制裁手段等等,我们应该有信心可以做好隐私保护这个事。

最后,我们也要看到,如果因为片面强调个人数据保护而对数据利用裹足不前,其实不但不利于中国个人征信业务发展,也不利于中国社会诚信体系建设,而且会对人工智能等其它更需要充分利用大数据的战略性行业发展造成不必要的困难。比如,一个大一统的征信数据库,如果要先获得每一个数据主体个人获得授权再汇总数据,有时候是一个不可能完成的任务。个人数据保护的本质是保护数据主体的合法权益,而我们要不要为了保护某人一项更小的权益而牺牲其一项更大的权益呢?如果舍本求末,那就无异于南辕北辙了。而且,很多数据使用的业务场景,其实是完全可以把身份证号码等主键信息或身份敏感信息进行加密,既不影响数据的使用,也不会泄露个人隐私。所以正在征求意见的《中国个人信息保护法(草案)》明确规定“不可还原的匿名化信息不受本法保护”,也就是意味着不可还原的匿名化信息是可以被充分自由使用的。这是平衡个人数据保护和个人数据应用之间关系的一个非常正确的方向。

事实上,充分保护个人隐私和充分使用个人数据本质上是不冲突的。因为个人隐私是个人权益的一部分,在很多情况下,只有充分使用个人数据,才能充分保护个人权益。

我们不应该怕用个人数据,在很多情形中怕就怕只用了一个人的一部分数据。

比如,金融机构如果因为被允许合法使用各种个人数据,而可以对一个急需贷款的申请人进行全面的风险评估,进而识别出其是一个信用良好、风险很低的贷款申请人,最终使得其能及时获得贷款,那么,在这种情况下,最大的获利者是谁呢?

相反,如果金融机构因为缺少数据而无法识别出其是信用良好者,而只能因为惧怕风险而拒绝为其发放贷款,那受损最大的又是谁呢?在这种情况下,普惠金融或金融扶贫等民生工程又如何去完成呢?

更有甚者,金融机构因为数据收集不完整而导致误判,错误地给欺诈分子发放贷款,进而造成像前段时间在西南某地,金融机构集中被欺诈十几亿贷款的惨重后果,那中国金融业的信贷风险又如何得到控制呢?

本质上,向坏人放贷,就是在阻碍好人得到贷款,因为金融资源总是有限的。所以,帮助金融机构利用数据识别贷款人风险非常重要。其实,在社会各行各业,道理也类似。所以,保护个人隐私,关键在于数据怎么用,而不是不用。


粤公网安备 44030502004787号