梁偲:数据公司的最终生命力在于数据二次加工、分析和开发的能力
Release date :2016-12-20
       11月11日,由研究院CIFD中心承办的AIF系列研讨会“大数据在金融领域的应用”在浙大玉泉校区举行,研讨会吸引到学界、业界等50余人。会上,上海数据交易中心风险控制总监梁偲详细介绍了中心目前的业务方向、定价模式等。梁偲表示目前交易中心的重心还是在一些基础性工作,包括梳理数据流通的逻辑架构等等。
主要业务方向
       梁偲:上海数据交易中心是上海市经信委下面一家以数据互联为主要业务方向的企业,已经于今年10月1日上线运营。我们当前主要是针对数据行业的痛点做了六个工程。
1. 可量化合规性评估工程
       当前数据中排在第一位的问题就是非常乱。
       很多数据公司、科技公司或是征信公司,他们的数据来源有些是获得授权的,有些是二手的,甚至有些通过黑客技术采集过来的都有,参差不齐。有些在真数据当中掺杂假数据,以此误导对手,这对整个数据行业是一个灾难。
       我们认为如果数据行业在这几年不加以合规性整治的话,再过几年就会像前几年P2P一样面临一次比较大的洗牌。上海数据交易中心希望在这个过程当中做这个基础性的工作,可量化、可视化的合规性评估。
2. 统一语言的标准化工程
       当前诸多的数据方,他们都是用同一个数据产品,用同一个K,有不同的表达方式。
       举个浅显的例子,比如查询一个人的婚姻状况。也许A供方反映的是“是或否”,“已婚或未婚”,表达方式是是和否,0或1。B供方可能更复杂一点,使用起来不方便,采购数据无法直接进入模型系统。尤其颗粒度不一致的时候,很多存在交叉区域,非常难以梳理。目前统一语言的标准化工程,交易中心已经完成了。
3. 去中心化、数控分离的数据传输工程
       当前数据交易中心在全国遍地开花。但某些数据交易中心,他们往往采用一种模式,就是把数据采集到自己这儿,然后再进行转售。或是自己做一个超市,存起来供B方使用。如果数据交易中心是储存数据的,供方久而久之是绝对不会和你合作的。因为当你一旦做大,就没有供方生存的空间了。
       我们认为一个健康的数据交易中心应该是从技术上不存在自己触碰或者自己留存数据的可能性,所以当前我们采用的是数控分离的手段,数据供方和需方他们自己直接传输数据,交易中心只是经过二次加密,发送一个公钥给需方进行数据解包使用。我们这套技术源码是向社会开放的,可以通过源码看我们到底是不是触碰了数据。
       接下来在2017年,我们会上线一个区块链系统,基于区块链系统交易,从根本上杜绝了数据被碰触的可能性。
4.ID-mapping和ID隔离工程
       当前诸多数据供方当中对入参的要求相当不稳定,也许对于同一个K,它可以用身份证查,或者手机号查,用邮箱查,都可以。但如果这样的话,入参不统一会导致数据交易市场效率非常低。
       还有一个问题,ID本身也是一种数据,而且ID本身是一种高敏感度的数据,所以说在进行数据查询的时候,我们要进行两个方向兼顾。一个是通过一个图谱,将ID进行路由。另外是ID传输过程中要进行多维加密,确保ID所有者的信息安全。
5. 面向应用的数据工场
       交易中心提供一个大的实验场,这个实验场并不仅仅在于数据的交易,更集中于数据衍生品、数据应用、数据工具的交易。因为大家都知道数据的来源往往是比较单一的,而且相对比较同质。当前市面上这么多数据公司,它最终的生命力在于它对数据的二次加工、二次分析和数据工具开发的能力。
       所以数据交易中心在提供原材料的同时,我们也提供了一个做数据产品设计的实验场,成立一个社区,让这些数据供应方可以在交易平台上进行数据实验。
6. 数据质量评估工程
       这是当前最难以解决的一个工程。为什么呢?因为我们承诺了不触碰数据,我没有办法打开数据包。不能打开数据包,就只能通过反馈的方式进行后置的数据质量评估。
 
定价模式
 
       梁偲:数据交易的价格目前是公开竞价,有两种模式。
       一种是供方挂牌的标准化产品,不同的供方考虑不同因素,有不同的价格。需方在查询的时候,他会进行查询规则的路由,他可以选择价格最低的优先碰撞,也可以选择质量分最高的优先碰撞,或是选择某个区域覆盖率最广的优先碰撞。总共有八个规则可以进行路由。
       按照规则,路由规则制定之后,所有供方排成一个队,需方开始从第一个查,第一个查到就结束交易。如果第一个没有查到进入第二个,第二个没有进入第三个,最终他撞到并且获得数据源的价格就是他成交的价格,是一次查询的成交价格。最终每个数据单品会形成日的数据交易走势曲线。
(梁偲系上海数据交易中心风险控制总监,本文整理自他在AIF研讨会“大数据在金融领域应用”上的发言,稿件经本人审定)



 

编辑 | 施嘉

排版丨郑晗晗

 
 
Return