
第8章 时空位置与个人身份
电幕到处都有。不论你是在家里吃饭、睡觉,在街道上行走,还是在单位上班,墙上的电幕时刻在监视着你,它们不仅能观察你的每一个动作表情,也能监听你的每一句话,甚至一声叹气。
——乔治·奥威尔,《一九八四》
8.1 苹果手机中招
“一名健美的女子飞奔到屏幕前,抡起了链球一样的铁锤,铁锤划过美丽的弧线,打破‘老大哥’的电幕。”
苹果公司以“为何1984不像是《一九八四》”(Why 1984 won't be like “1984”)为主题发布了一则影响深远的广告。1983年,IBM个人电脑热销,使苹果计划在1984年1月发布的麦金塔电脑(Macintosh)承受了很大压力。
乔布斯借此广告为麦金塔的发布会预热,计划打破IBM公司PC“老大哥”的垄断地位。原书中“老大哥”并不垄断,而是借助“电幕”,实时关注每个国民的行为,实施独裁,对国民实行7×24小时严酷的高压管制。
讽刺的是仅30年后,苹果手机却成为“老大哥”的电幕。2014年7月11日,央视用近半小时解读了苹果“隐私门”事件。曝光了苹果手机会存储位置信息这一特性,即使关掉定位功能,位置数据依然会被存储。
iPhone系统在升级到iOS 7.1后,打开设置→隐私→定位服务→系统服务→常去地点,就能看到手机收集并加工的个人位置数据。
根据央视的随机抽访,90%以上的被访人士不知道苹果手机具有这个功能,甚至有些苹果官方零售店的店员也不清楚。在报道中中国公安大学的专家表示,他们可以根据记者提供的手机中用户的位置情况,推测出手机用户的身份,这可能危及国家安全。
这不是个案,所有智能手机目前均可以做到位置信息的搜集与记录。不仅仅是手机本身,绝大多数手机应用也会记录并读取这些信息。一旦使用智能手机,就无法避免位置信息被记录。
8.2 位置信息决定信用卡额度和保险费率
不可否认,机构判断个人信用存在一定的“地址歧视”。传统征信中的住宅位置很可能影响银行的授信额度。
在一个公司工作的王先生和赵先生一同申请信用卡。两个人都在城郊租房,经济情况也基本一致,可王先生拿到的信用卡额度却比赵先生高40%。据分析,很重要的原因是王先生填的是镇上的老家住址,而赵先生填的是租房地址。
通过对位置数据和时间等更加细致的分析,能推出速度、距离等复杂的信息,被广泛利用在各个方面。UBI(Usage Based Insurance)被称为保险行业的新生动力,是一种根据使用量定价的保险。通过对信息综合分析后,对用户提供差异化保险费用与服务的形式。UBI车险是建立在对用户、汽车进行综合评价基础上的。
通过OBD(On-Board Diagnostic,“车载诊断系统”,是监控汽车诸如发动机、尾气等运行状况的系统)等置于在汽车内部的物联网设备可以采集车辆位置数据。收集的地理位置数据与驾驶的时间数据,会被转化为地点、里程、活动范围、瞬时速度、行驶范围内的路况等内容。
这些信息就构成了UBI精算的原材料,是确定车险价格的重要依据。这与Zopa的差异化的P2P贷款利率本质是相同的,UBI的精算本质,与英国、美国的征信局结合数据为用户订制征信分相同,是对保险购买者的评级和鉴定。
个人活动范围是一个人身份的重要体现。经历的丰富程度,与其所处地理位置和所到过的地理位置是正相关的。
如同苹果手机能根据一个人的位置数据画出个人的位置地图,根据去往时间与频次,很容易绘制出个人位置的热力图,根据其经常到访的地方与频次,将大量的人物信息与结果进行匹配,重合度较高的人,信用评价结果所处区间应该类似。
基于地址的征信本身具有歧视性,这很难避免。但依据个人位置数据的信用证明,远比工作地址和家庭住址两行干巴巴的文字更加生动和具体,也更加可信与公平。
近些年,大量LBS业务(Location Based Service,简称LBS,基于位置的服务)走进人们的生活:地图类的如百度地图、高德地图等;运动类的如咕咚、Nike+等;服务类的如大众点评、美团网等。它们都拥有用户使用服务时的位置数据,但这种服务的位置数据很早以前就开始使用了。
8.3 前互联网时代的位置数据
生活中有大量基于个人的固定地址信息。比如各类预留地址:快递地址、外卖地址、银行账单地址、水电缴费单地址等,包括政府部门预留的公民信息:身份证地址、户口本地址、社保地址、医保定点医院等。这些固定地址的组合,是身份评定的重要组成部分。
除家庭及工作单位的固定地址外,人们与其他一些固定地址的互动,也会产生大量信息。20世纪80年代,美国某地区安装了一台ATM提款机。安装后几周内,每天0:00~2:00有大量的现金被提取。很快侦探发现在距离ATM机不远处,有一家色情俱乐部。到访者为防止“不体面”的交易记录留在银行账单上,一般不使用信用卡付款,而是到附近的ATM机中提取现金。一篇报道很快发布在当地的报纸上,声称“××银行知道谁光顾了××俱乐部”。
每家银行都有自家ATM机的位置列表。通过罗列一个人提款的ATM机位置,可以大致了解他的活动范围,这是现金时代个人留给银行的重要位置信息。经常在ATM机提款、办理转账的位置,基本可以透露一个人的活动范围。配合他办理业务的网点位置,可以强化对其活动区域的判断。一个人的这类位置越分散,说明他的活动范围越大;在一个ATM机上提款两次以上,说明这个人与这个位置的关系比较紧密。
综合这些位置并参考其他方面的信息,包括资金流水、取款金额等,就可以对一个人的信用进行更多维度的判断。
现在,大量的支付采用了线上、信用卡、移动支付等方式,现金时代的位置信息正在消逝。POS机、移动支付时代的位置信息对于银行来说更加复杂和不可控。
8.4 GPS:由冷战带来的位置变革
GPS随着车载导航与智能手机进入人们的生活。与大众认知相悖的是,GPS并不是移动互联网时代的产物,而是冷战时期的伟大的技术发明。GPS实际上也是前互联网时代的位置工具。
20世纪50年代,美国开始通过卫星进行定位和导航。1974年,GPS系统开始初步工作。1993年,GPS建成地球空间6个平面共24颗卫星的定位星座。每个接收GPS信号定位的点,就像听广播一样,收听天上卫星的无线信号,并根据传输速度(光速)与传输时间计算自己距离不同卫星的位置,再根据测绘学原理推算自己在地球表面的位置。
2015年以后发布的智能手机中95%以上均支持GPS或其他卫星定位功能,几乎100%支持基站与Wi-Fi定位。很多手机在进入工程模式后,可以进入GPS的测试,能够查阅GPS位置。一旦手机可以实现GPS的定位,GPS状态就可以同时输出时间、位置、速度等数据。
8.5 互联网时代的位置数据
即使没有GPS,也有很多获得位置数据的方法,一般基于互联网或传感器。
1.手机基站位置
手机连接到运营商网络,基站本身有自己的位置信息,每一个移动基站都有自己的基站小区号(Cell_ID),和ATM提款机一样,手机在享受移动通信服务的时候,自然而然就把基站号记录下来,也就可以了解用户大概的范围。
2.Wi-Fi位置
与手机基站类似,当你搜索到Wi-Fi,就表示你在Wi-Fi附近。谷歌通过智能手机,将搜索到的Wi-Fi的物理地址用手机的GPS数据进行标记,于是很多Wi-Fi就有了一个大致的地理位置。一旦手机能搜索到这些Wi-Fi信号,也就离之前记录的GPS位置不远。
3.IP地址位置
连接上网的IP地址也具备位置属性,IP地址与实际地理位置有对应关系数据库,所以接入互联网也会暴露位置。
4.传感器定位
海拔越高、气压越低是常识。几千米的高原空气稀薄,会使得很多人产生高原反应。气压和高度是一对可以互相推算的参数。
现在,很多气压传感器可以做到5mm2,比米粒稍大,可以做进手机电路,确定手机高度。气压传感器当前可以做到厘米级的精度,通过去噪和纠偏,高度测量的偏差在10cm左右。通过位置和准确高度,可推理出更多位置信息。
5.室内定位技术
在室内导航的解决方案上,目前有Wi-Fi指纹定位、地磁室内定位技术等正在兴起,它根据不同位置磁场的变化来确立所在的位置。百度投资的IndoorAtlas室内定位精度在0.1~2m。室内定位技术作为GPS等室外定位技术的补充,可以三维还原人所处的位置。
6.融合定位技术
除了单独确定位置数据的方法,还可以将不同的定位技术组合起来使用。融合定位方式可以更精确地确认一个人的位置。更准确的位置意味着能够更精确地推断一个人的情况。
8.6 通过大量位置信息推论人群身份
每个人的位置数据都是大量的散点,单独看起来毫无意义。如何能对在不同地方活动的人们进行区隔和划分?
聚类算法(K-means)是一种归类算法,可以理解为计算机判断一些点的中心位置算法。一般通过计算机迭代计算,得到一个可能的最优解,如图8-1的(b)中的三角、圆和十字三个中心点。通过对个人位置数据的归类分析,基本可以归纳出一个人家庭住址、工作地址、常去位置等几个点。

图8-1 用户地理位置分析的算法
冯·诺依曼图(Voronoi图)是几何中的一个基本概念,由图中的N个随机点组成,每个两点的垂直平分线相交,画出一块块区域图。每个区域内的点,距离N个点最近。水立方的外观就是一幅冯·诺依曼图,如图8-1的(a)中虚线组成的图案。
如何通过一个人位置数据确认其个人特质?可以先使用K-means算法,算出这个人所有位置数据中的几个中心点。同时,通过使用冯·诺依曼图算法分析人群特点,将不同特质人群的典型位置中心点汇聚在一起,通过冯·诺依曼图切割出不同的区域。标记活动在不同区域人的特点。最后,计算用户在每块冯·诺依曼图驻留的时间、到达每块的频率等,推理用户属于哪类人,由此定位用户的身份特质。
目前已有大量针对用户地理位置的含义分析的论文。除本文提到的冯·诺依曼图算法、硬聚类(K-means)算法外,还有以计算运动路线为核心的DP算法等各种算法,都可以从用户位置数据中提炼出更多有用的信息。
8.7 亟待加密的位置数据
位置数据应该是个人可以选择保留的隐私,为保证其不被非法应用,并在用户授权下有效地利用,急需推动个人的地理位置信息加密,通过个人的授权进行解密。
不仅是GPS或其他位置数据,还包括传统的地址信息,快递单、信用卡账单、ATM交易记录等信息均应使用加密、解密机制。
目前我们所有使用的导航地图数据信息,都是“假”的位置信息。出于国家安全考虑,不泄露某些机构的真正位置,在电子地图中对所有位置均进行加密。手机或设备GPS得到的经纬度信息,经过同样的算法后会得到对应地图的“假”位置,两个“假”位置匹配实现“真”定位。
但这个“假”与此处所说加密有些不同,本书认为,用户数据应以暗文的形式存在于各类数据库中,加密后的位置信息对于无法解密的人来说,应全部为乱码,用户的加密密钥由用户保管。
对于地址信息的加密也采取同样的思路。2015年11月,快递“实名制”开始执行。为了避免隐私泄露,也可以使用类似的方法。
位置是隐私的重要部分。不过作为普通人,大可不必杞人忧天,怕过多的隐私被泄露到公开的平台。一是有巨量的用户隐私信息都在平台中,关注到某个人的可能性太低;二是每个人的信息都是个例,只要不是对你有特别目的的人对数据进行深挖,也无法通过位置数据直接牟利。工业化的算法、数据分析无法精准地盗取特定人的隐私。
8.8 数据安全与隐私保护
不仅是位置数据,稍后几章中讨论到的各类数据,目前都是借助计算机算法进行分析和判断的。合规的算法并无牟利和诈骗的心思,即使对人工智能来说,它“有目的和功利心”地利用用户隐私数据,也是遥不可及的事情。
保护数据安全核心是阻止别有用心的人,国家安全或核心商业相关工作者应予以重视。但保护安全绝不是阻止数据的生成。没有数据的支持,就判断不出个人的数字信用,也就无法享受数字信用的红利。此处建议做好对数据的掌控,以及对数据隐私理念的理解,而不是抵触数字服务、做数字信用时代的原始人。
能够准确地产生数据、保证数据的安全,也是保护自己的财富。要做到这一点,就得搞清楚数字时代的规则。
首先,在使用各类数字服务时,要阅读各类软件与互联网服务的隐私保护说明。其次,设定好手机与电脑系统的功能权限、了解数据存储方对数据处理的手段、方式等。同时,做好自己账号的管理与密码保护,备份好重要数据,做好防护工作。
隐私小窍门
(1)在手机“设置”中,关闭不必要的程序获取位置的权限。
(2)在不使用定位功能时,保持手机的GPS关闭,关键时关闭Wi-Fi功能,甚至关机。
(3)避免在敏感的地方发生任何与人和物的交互。比如带手机、刷卡、提款等行为。
(4)Windows 10系统及平板电脑中也可以开启位置,这些设备应与手机一视同仁。
(5)及时清除有使用位置APP中的临时数据。