对于从事互联网广告行业的人来说,设备需要一个跨平台统一维度的数据参考来建立有效的用户数据画像,以进行跨应用的定向投放、效果分析等。这种跨平台的统一维度的数据参考,也可以说是统一的追踪标识符,不论是官方开放的免费的还是商用开发的替代类的产品都有很多。一般来说,开发者们选择的技术方案归根结底是两种:一种是强依赖于设备和用户信息生成的设备标识,另一种是依赖于服务器和算法生成的设备ID。
要建立好用户画像库,做好广告设备追踪,这两种技术方案该选择哪一种呢?先说结论:应该选择设备ID。
ID和标识本身是两种东西,只是大部分开发者都容易混淆。这里用比较简单的语言来解释,设备这个概念很抽象,我们可以用人去对比。标识就是人的指纹、唇纹、瞳色、胎记、纹身等等本身的能够代表你的东西,与生俱来的;而ID很简单就是你的身份证。如果理解这个概念我们就能想象,大家可能都遇到过上班马上迟到了着急打卡,结果手出汗了指纹扫不了,也就是说,标识有自然变化的属性。但身份证不管你出汗还是脱水,长高还是变瘦可都是不可能改变的,原因是身份证的生成规则是派发的中央去指定的,对个体信息的依赖性不高。所以说,强依赖于设备本身的是标识,服务器算法生成的才是ID。
那为什么本身不同的两个东西开发者们很容易混淆?原因主要还是概念普及的信息差。标识和ID这个概念是美国传用过来的技术,英文上来说两个单词非常接近,ID就是Identity, 而标识的英文是Identifier,加上国内很多三方公司的错误包装,很多产品名为ID却只是一个标识,而开发者对于这个概念本身就很模糊,这就导致了大面积的信息误差。
标识和ID在唯一性、准确性上的区别很大。就唯一性方面,标识对设备信息本身有很强的依赖性,有一些设备信息本身就有高重复性,比如系统更新时间,现在还在使用苹果6、7的大有人在,这部分设备技术还没那么先进,更新时间只能精确到秒级,一秒几百万台设备在更新,显然重复率很高。而准确性方面,标识的反作弊策略跟ID的完全不同,标识的反作弊策略是置后的,而ID的具有前瞻性。ID的生成规则是第三方自己规定的,他们会在自己的算法中嵌入自己的反作弊策略,黑产如果篡改了设备的某些特征,第三方会在拿到这个设备ID的时候很迅速的判断出来这个设备在造假。但是,标识的生成是依赖设备本身的,他们必须经过长时间大数据的积累来形成一种常识性的判断标准,当他们面对造假的设备,需要去比对这些标准,再判断是否有其他的可能性,再总结更新自己的策略才能识别真伪。
对互联网广告来说,设备追踪的符号如果不唯一或者不够准确,会带来推广成本的大量消耗,App选择第三方肯定是依赖和相信对方的技术,希望第三方能做好监测,为App节约成本。但如果第三方做不好数据质量,App的推广就要花冤枉钱,购买第三方又是一个冤枉钱,由此可见如果选择设备标识而不是设备ID,不良后果比较多。
此外,设备ID相比于设备标识还有一个极大的优势就是,抓的数据合规。如果App接入的SDK抓取了隐私数据,可能会有不过审甚至下架的风险,后面的推广、精准营销更是直接不用谈了。这一点也尤为重要。
综上,免费或者三方的设备标识具有多变性,且自身没有前瞻性的反作弊机制,只能通过长时间积累的黑名单做基础的筛查,准确性、稳定性、唯一性都有欠缺。而设备ID则是长期唯一、稳定且有严密的反作弊逻辑的产品,设备ID才是建立用户画像数据库的最佳选择。
(标识和ID的优劣势汇总参加下图)