前海征信揭秘:如何利用数据识别诈骗
作者:admin 发表时间:2017-11-28 浏览:96 海淘动态
最近风头正劲的大数据风控,可以在对用户数据的关联分析中发现蛛丝马迹,从而阻止欺诈的进一步发生。但是,对于很多有大数据风控需求的公司来说,最大的问题是没有足够的数据。当前,市面上虽然有提供外部数据校验的产品,但如果笔笔业务都查,势必增加很多成本。能够有什么低成本的办法,可以先过滤掉那些潜在的欺诈用户呢?就让前海征信大数据专家来讲一讲,如何用手机端得到IP数据的相关数据进行欺诈判断的干货吧。一、IP数据,最直接的就是通过IP来看P所揭示的风险几何?可以从以下几个角度来判断:1、代理IP判定在互联网上每天有许多公开的代理IP,代理IP的目的是为了隐藏自己的真实IP,所以使用代理的,基本上可以判断为有欺诈嫌疑。可以通过每天的自动爬虫,爬取互联网上的代理IP作为黑名单。2、IDCIP一个toc的贷款业务,跑来注册的IP是云服务器的IP,这正常吗?显然不正常。事实上很多就是被黑的服务器,或干脆就是自己租的服务器来恶意借款。这里就要去做一些收集,各大云服务商、各大IDC服务器段。可以维护下来作为黑名单。3、技术判定反向探测对端端口开放情况:代理常用端口是80和8080,如果对端IP开启了这些端口,显然是不正常的,一个家用IP地址是不大会开放这些端口的。HTTP头的X-Forwarded-For:这个字段只有在通过了HTTP 代理时才会添加,如果带有XFF,那就是代理了。源端口:大于10000的源端口有两种情况,不是代理就是大型机构,所以会有误伤,建议判断权重在50%。Keep-alive:带有Proxy-Connection: Keep-Alive的报文,毫无疑问是代理。二、手机号码验证,建立自己的高风险库这里也可以通过一些方法收集黑名单,可以有以下几种途径:1、收码平台手机欺诈分子通过在收码平台上开项目,可以使用大批量的不同号码来注册。通过爬虫定期爬取,可以得到这些信息。2、小号手机号码目前有一些小号软件,可以虚拟一个号码出来,这些号码像正常电话一样,可以打出去,接听,收发短信。在网上搜索:小号,即可找到大量类似平台。把这些号码爬取下来作为黑名单库。3、撞库法利用注册用户的手机号码,去各类P2P平台上注册,如果提示号码已被注册,则说明该用户对资金有较强需求。4、定向爬虫例如在一些分类信息网站上爬取中介的手机号码,作为高风险库。三、设备指纹,世界上每台设备都是独一无二的世界上没有完全相同的两台设备,每台设备都是独一无二的。可以通过抓取用户手机上的一些特征,形成一个特征编码,这就是设备指纹。通过设备指纹,可以判断同一台设备,注册了多少账户,登陆了多少账户,是从设备角度进行判断的一个重要手段。同样,欺诈分子在对抗中也逐渐在升级。欺诈分子也开发出了诸如008神器、海马玩等软件,可以一键修改设备相关信息,来以此绕过设备指纹。针对欺诈分子的工具,可以通过作弊软件识别、冷门信息算法。所谓作弊软件识别,市面上很多作弊软件,都是通过同一框架进行开发,因此可以加入对这个框架的识别,来判断是否使用了作弊。而冷门信息算法,则是抓取一些欺诈分子没有注意到的地方,例如传感器的某些信息,例如蓝牙、电池、音乐排序、网卡生产商的某些信息来组成算法,对欺诈分子在修改时不注意的这些地方进行判断。四、位置数据,需要用户授权位置数据可以有多种使用方式:定期调取GPS,以此来判断工作地址和家庭地址,与进件资料作比对,看用户是否包装资料。活动环境位置,用户经常在一些不良场所活动,例如赌场、夜店活动,说明此人可能有不良习惯。GPS移动异常:可以根据用户的GPS移动距离计算,例如1小时前在上海,1小时候在北京,则有GPS造假可能。相同GPS:同一位置多笔申请借款,说明有欺诈嫌疑。多台设备同一GPS,说明设备之间有关系,可以作为关联欺诈的判断。五、APP 数据,慎重!小心侵犯用户隐私如果存在大量贷款类APP,则说明用户对资金需求强烈。同样,如果用户手机没有其他APP,则说明该设备可能用来欺诈。如果探测到安装有模拟器类、GPS伪造类,说明用户有欺诈可能。对用户的APP数据进行采集,实际侵犯了用户隐私。请慎重。六、设备账户信息,若采集到APP的用户名在设备上还可以采集到APP的用户名。以此来建立用户名与设备之间的关系,同一个APP存在3个以上的用户,则说明该设备有盗账户嫌疑。其他APP账户与业务申请吻合,则可以对该账户一个较高信任分数。同样,该类数据采集也是对用户隐私的严重侵犯。七、通讯录数据,需要用户授权通讯录数据需要用户授权。对通讯录信息的获取,可以防止欺诈关系圈。有几种情况:1、 通讯录为空,说明该设备有欺诈嫌疑。2、 通讯录内容,可以形成关系,作为关联欺诈的一个重要判断。3、 通讯录名称标识,可以通过社交关系信用过判断本人信用。但通讯录数据也是严重侵犯用户隐私的行为,因此需要用户授权。八、设备关系数据,多维度进行相同WIFI:两个设备多次出现在同一WIFI下,则说明设备之间有关系。出现次数越多,关系越强。蓝牙配对:蓝牙配对记录的采集,可以获得两台设备的关系。GPS:前文已说过,同一GPS出现的设备,说明设备有关系。通话记录数据:通过通讯录、通话记录可以得到关系数据,而且可以根据通讯录名称直接标明关系。综上,可以从多个角度的数据进行分析,对潜在的欺诈行为进行判定。其中部分数据,需要考虑到用户的授权。如果用户未进行授权,在借贷业务上,则可以对该进件进行降分处理。另外,部分数据能否采集,还需遵循国家相关规定,同时要保护好用户隐私。不过,要是技术主管看到上述介绍,表示开发起来周期长,人手也不够,不妨还是考虑试试好信盔甲吧!好信盔甲是平安集团旗下第三方征信公司前海征信推出的一款基于大数据的反欺诈系统产品,可以为您订制整套反欺诈解决方案!
部分图片内容来自于网友投稿
0/300
微博发布