郝歆雅

亿欧智库分析师,联系请加微信haoxinya0111

52

文章/篇

80.6万

阅读/次

拜访信息

为了给您提供更快更好的服务,在获取作者联系方式前,想对您有个简单了解. 邀请您填写如下信息

提交成功

非常感谢您的配合,我们的作者会尽快通过您的微信,
请耐心等待~

微信号

15701235851

达摩克利斯之剑下的数据安全,谁能拥有免死金牌?

金融科技
亿欧
郝歆雅
2019-09-19 · 10:25
[ 亿欧导读 ] 大数据时代的企业无疑需要在数据开放与隐私间权衡,大数据应用的前提是数据开放,在推动数据开放和应用的同时有效的保护用户和企业隐私,不管线上还是线下,都将是大数据时代的一个挑战。
数据爬虫,亿欧智库,数据爬虫,数据安全 图片来自“123RF”

近几天,数据服务行业正在掀起一股整治之风,有不少风控公司牵连其中,除了公信宝遭到公安部门查封、天翼征信被警方要求协助调查、魔蝎数据核心高管被警方控制等消息,还有数据公司例如聚信立、新颜科技、百融云创主动停止了数据服务,更有大量同业公司受到波及。

经过近一周的发酵,涉及的公司逐渐增多。其实早在2017年中国已有企业因为数据爬虫而被查封,在本次风暴中心的大部分公司也都涉及到了“数据爬虫”这一业务并有相对应的产品。

相关大数据产品供应商

什么是爬虫?

网络爬虫是一种按照一定规则、自动抓取万维网信息的程序或者脚本。网络搜索引擎通过爬虫更新自身网页内容或其对其他网站的索引,自动化搜集网页上的信息或数据,然后把搜集到的数据按照业务需求存储到自身数据库里。

数据爬虫本身并不是违法行为,关键在于爬虫类产品服务的交付形式和使用目的、网络爬虫的采集途径和采集行为,其不能触碰的底线在哪里,企业究竟如何维持自身的公正性。

据了解,被查的几家企业或多或少存在恶意爬虫行为,触碰到了一些未公开、未经允许、且带有敏感信息的数据,或被认定为是违法行为。而且关于在互联网上的个人信息,大部分属于非公开信息,使用甚至打包售卖这类信息都会不同程度的触碰合法合规的红线。

正常情况下,数据类产品不应涉及详细的个人信息,应该经过脱敏后仅以评分或者等级划分的形式使用或者出售给第三方。例如美国FICO评分或者中国央行征信,其中个人征信信息均不会透露给查询的第三方公司,仅以评分或者等级的形式表示个人信用情况,以此避免个人信息泄露。

但是市面上之所以会出现大规模的数据买卖,是因为脱敏后的评分或者等级信息,对于企业建立风控模型的作用有限,概括归类的评分或者等级无法做到对消费者信用评价颗粒度的细化,才会有部分企业铤而走险,也因此有企业会因为嫌侵犯隐私、买卖公民个人信息等原因遭到查处。其中公信宝的数据爬虫产品,赫然标注的包括社保、学信网、京东、电信、移动、联通、智联招聘、芝麻信用分等信息的数据,已经明显超过了个人隐私信息的界限。

在2019年5月28日,国家互联网信息办公室曾就《数据安全管理办法(征求意见稿)》公开征求意见,或许成为中国数据安全立法的里程碑。为了维护网络运营正常开展工作,管理办法对网络爬虫进行了规定:利用自动化手段(网络爬虫)收集数据不得妨碍他人网站正常运行的原则,并明确了严重影响网站运行的具体判断标准,这将对规范数据收集行为,保障网络运营者的经营自由和网站安全。

除了对数据收集进行了规范,管理办法还就数据存储、处理、共享、利用等行为进行了规范,以加强对个人信息和重要数据的保护。

高度依赖数据产业的信贷风控

追溯上述企业的数据产品下游可以发现,大多数数据产品是用于金融行业的信贷业务,而几乎所有信贷业务的风控环节,都要依赖于各类运营商的数据来进行。

信贷风控产业链的参与者可以分为数据端、技术端和需求端。传统的提供数据产品的公司可以分为个人征信公司和企业征信公司,已有相对的业务牌照进行发放,同时对其进行监管。

智能风控生态各参与方

随着互联网大数据的快速发展,涌现出一批以互联网大数据为主要业务的数据公司,但是其主要产品个人信用相关数据尚未有完整成熟的法律法规和部门进行监管,因此有大量金融科技公司为了开展风控业务的同时,也会自身开展数据业务或者从第三方购买数据服务。为了满足对大量数据的需求,企业通常会通过聘用网络爬虫工程师,对互联网和APP端的数据进行抓取,尽管会对数据进行清洗和去重等工作,但是仍然存在敏感信息的可能性。

虽然有部分企业在招聘网站上的爬虫工程师已经下线,但是通过拉勾网的历史信息或百度快照,仍然可以看到企业的历史招聘记录中,关于爬虫开发工程师的招聘信息还赫然在目。

部分风控企业招聘爬虫工程师的界面

从数据企业的下游客户来看,不管是传统的银行业金融机构还是互联网金融公司,无一例外的会采购这类数据产品及服务。以魔蝎科技的数据产品来看,合作企业就包括了银行、持牌消费金融公司、互联网金融公司,覆盖了所有信贷业务的需求端企业,以此可见业务方对于数据的依赖程度之高。

在信贷产业链中扮演重要角色的第三方风控服务商和数据提供商,在这个时间节点遭遇严查,或许也与消费贷甚至现金贷的严监管相关。在各种“714高炮”、“超利贷”等平台遭到严处的时候,没有严守底线的企业终于开始为自己的选择买单。

在名单中可以看到,传统的企业征信公司也没能逃过被查噩运,甚至2018年刚成立的中国首个个人征信持牌机构——百行征信,其股东鹏元征信也受到了波及。一直蛰伏却没有产品的百行征信,被认为是规范个人征信行业的代表,在大量企业纷纷想要申请个人征信牌照的时候,却只有8家企业作为股东,央行为主导成立了百行征信,可见国家对于个人征信规范的重视程度,也因此决定了仅有的一张牌照的含金量。

但是鹏元征信也在此次风波中受到影响,可见合法合规的牌照并不是一张免死金牌,业务的合规性仍然面临着巨大的挑战。

亿欧智库《2018智能风控研究报告》曾对智能风控企业盘点,并对部分公司进行调研。彼时接受调研的企业仅有36.51%的企业认为数据隐私是影响智能风控落地的挑战,大部分企业仍认为银行业金融机构对于第三方企业信任不够,才是智能风控落地的挑战。所以时至今日数据问题的突然爆发,也可以说是因为企业对于数据安全问题不够敬畏。

智能风控落地困难及挑战

近日,受到此次风波影响的同盾科技CEO蒋韬发布公开信《心存敬畏,向善而行》,对数据安全问题发表了几点看法,认为人工智能及大数据的发展极大地提升了中国各个细分行业的效率,让生产效率变得更高、让百姓生活更加便利。在其发展过程中,数据及隐私的保护问题仍是一个世界级难题,需要监管、企业、法律界等共同研究和探讨,形成一个创新、规制、在创新、再规制,螺旋上升的良性发展态势。

2019年的315晚会,虽然已经对大数据的黑色产业链进行曝光,但是关于大数据的丑闻,也许才刚刚被公众所了解。面对野蛮生长的数据行业,缓过神儿来的消费者是不是还能把握自己的最后一点隐私,在所享受的便利中寻求一些平衡。

大数据时代的企业无疑需要在数据开放与隐私间权衡,大数据应用的前提是数据开放,在推动数据开放和应用的同时有效的保护用户和企业隐私,不管线上还是线下,都将是大数据时代的一个挑战。

版权声明

本文来源亿欧,经亿欧授权发布,版权归原作者所有。转载或内容合作请点击转载说明,违规转载法律必究。

各工作岗位将被AI取代的概率

选择岗位,查看结果

制图员和摄影师

87.9%

打赏支持

5
5
10
20
50
80
100
其它金额
任意赏:

参与评论

最新文章

1、 若贵平台是网站或者APP,在进行单篇原创文章转载时,需在文章标题或者导语下方,注明文章来源以及作者名称;若寻求5篇及以上的长期内容合作,需与亿欧公司内容运营部门取得联系,并签订转载合作协议。

【若贵司平台转载亿欧公司原创文章已经超过5篇,请及时与我们联系补签转载合作协议,计算时间以2019年2月10日之后为准】

2、 若贵平台是微信公众号,在进行单篇原创文章转载时,请联系亿欧公司内容运营人员进行单篇文章的白名单开通,同样需要注明文章来源及作者名称;若寻求2篇及以上的长期内容合作,需与亿欧公司内容运营部门取得联系,并签订转载合作协议。可将公司全称(简称)、公司网址、微信公众号、微信或者电话等信息发送至hezuo@iyiou.com,会有工作人员与您取得联系。

关闭

快来扫描二维码,参与话题讨论吧!

快捷登录 密码登录
获取验证码

新用户登录后自动创建账号

登录表示你已阅读并同意《亿欧用户协议》

快捷登录 密码登录

账号为用户名/邮箱的用户 选择人工找回

关联已有账户

新用户或忘记密码请选择,快捷绑定

账号为用户名/邮箱的用户 选择人工找回

快速注册

获取验证码

创建关联新账户

发送验证码

找回密码

获取验证码
账号为用户名 / 邮箱的用户 选择人工找回

未完成注册的用户需设置密码

如果你遇到下面的问题

我在注册/找回密码的过程中无法收到手机短信消

我先前用E-mail注册过亿欧网但是现在没有办法通过它登录,我想找回账号

其他问题导致我无法成功的登录/注册

请发送邮箱到service@iyiou.com,说明自己在登录过程中遇到的问题,工作人员将会第一时间为您提供帮助

账号密码登录

乐乐呵呵@微信昵称

该亿欧账号尚未关联亿欧网账户

关联已有账户

曾经使用手机注册过亿欧网账户的用户

创建并关联新账户

曾用微信登录亿欧网但没有用手机注册过亿欧的用户

没有注册过亿欧网的新用户

先前使用邮箱注册亿欧网的老用户,请点击这里进入特别通道
意见反馈
意见反馈
亿欧公众号 亿欧公众号
小程序-亿欧plus 小程序-亿欧plus
返回顶部