自动驾驶汽车和隐私的终结

作者：ernest oppetit 译者：ones piece 周卿任宁译者按：颠覆性的产品和品牌迭代在百年汽车史中并不鲜见，但是从未脱离以发动机驱动以化石燃料为能源的核心技术，以驾驶者的驾驶体验和乘客的舒适度为核心的产品功能。但毫无疑问的是汽车产业正引来一股跨界颠覆的风潮，自动驾驶汽车成为创业者、投资者给予极大关注的风口，各路资本蜂拥而入。但是自动驾驶汽车带来极具想象力未来的同时，也必然对现有经济社会的方方面面产生巨大影响。ernest oppetit 的文章为我们做了很好的梳理，并将重点放在会影响每个人生活的隐私方面，结论并不乐观，在自动驾驶汽车大跃进的过程中，隐私问题目前并没有得到足够的重视。
很快地，每一个地方的每一件事都将被持续记录及上传到互联网上。这将首先从人口稠密的城市区域开始，但随后地球上每一部分的每一平方米都将被记录。在机器视觉和人工智能领域的进步意味着这些海量的数据将具有可用性，这将彻底改变广告推广和法律的实施，也将把我们带回到有隐私之前的世界。
（噢，是的，你猜对了，这篇文章的绝配就是电影《少数派报告》。）
哪里都有摄像头
这是我们今天的情况：
卫星和无人机可以记录这地球上的任何地方。这使得 terra bella（google 的一家子公司）可以出售地球上任何地方的高清即时影像以作商业上的应用。但是在大多数情况下，分辨率还比较差，例如你可以从空中监控到一辆卡车是否在某个建筑工地，但是不能看到卡车的车牌。闭路电视和家庭摄像系统的数量已经随着传感器价格的下跌而激增，同时在国家安全方面和个人安全方面（家庭安全和儿童照看等）的监控需要都增加了。英国有超过 600 万套监控系统。用户视频的录制量已经经历了疯狂的增长。从数量级上讲：每天有超过 400 万小时的视频被上传到 youtube。这种增速并未减缓，因为这个星球上那一半没有智能手机的人也正在开始用上智能手机，同时类似 facebook live、twitter 的 periscope 和 snapchat 这样的产品都驱使着智能手机的用户拍摄更多的（现在是「直播」）视频。
但是真正的改变即将到来：
增强现实版的「google」们将变成巨大的市场，也将需要将用户正在看的东西持续录制成视频以便用软件来「增强」显示。目前微软的 hololens 和 snapchat spectacles 处于领先地位，但市场渗透率不高。很多聪明且资金充裕的人们正在致力于让增强现实技术取得成功。笼着神秘面纱创业公司 magic leap 就是走前最前面的。他们目前融资了 50 亿美金，拥有 700 多名员工。
自动驾驶汽车将变成一个巨大的市场，并且自动驾驶汽车将能持续摄制高分辨率、高帧率的 360 度全景视频。想到这场自动驾驶汽车革命将替代今天所有的汽车，你已经会发现这些视频的量将非常巨大，但要是考虑到自动驾驶汽车在更大的物流领域的角色，这事情就更具有颠覆性了。随着市场需要货物被越来越「按需」送达（亚马逊已经推出了「一小时送达」服务），自动驾驶汽车（包括无人机）将成为公司满足这种需求最合算的途径。如果使用该种汽车是免费的，并且充电也能实际上变成免费的（随着电动引擎效率和太阳能技术方面的进步）——为什么不让商家送 10 件 t 恤到你家给你试穿，然后退掉你不喜欢的 9 件呢？（想了解更多的话：我朋友 alex flamant 在伦敦的未来学家聚会上关于这个话题有过）非常有预见性的论述
随着这些技术革命的展开，我们正与能对这个星球上任一部分的每一平方米持续录制高清视频的时间越来越近。
现在，虽然某些视频很棒（这里就有），但没人能一直坐着把他们全部看完。一个有趣的
从视频到洞见
得益于视频数据德爆发，电脑视觉在过去 20 年发生了不可思议的进步。
让我们从一些你可能没有意识到的事情开始：
作为麦克风的视频：目前，在用算法处理极高分辨率的无声视频后，我们能够复原出视频录制当场的声音。能够识别声音引起的周围物体的细微震动的技术使这成为现实（一些同样的技术使得我们可以从视频中获得别人的心率）。在的惊人例子中，研究人员能够通过拍摄在隔音玻璃后面的一包薯片来复原一段对话。在根本不录制声音的情况下，这种复原好到足够让人明白交谈者在讲些什么。但是自动驾驶汽车和闭路电视系统没有理由不录制声音，这些技术也许有助于获得更好的声音分辨率，尤其是在距离较远和环境嘈杂的情况下。这个视频
自然语言处理：现在你笨拙的 google now 和 siri 可能还无法胜任，但是在研究实验室里，在将声音转化成文本方面，我们已经有了靠谱的技术。在人脸识别方面，训练自然语言处理（nlp）算法（来自于智能手机和机器人程序的交互界面以及 amazon alexa/google home 音箱）的数据爆发式增长也刺激了这场革新。在 2016 年，微软的技术在语音识别能力方面已经击败了人类对照组。在此之后不久，google 展示了将八对语言组合进行实时翻译的新方法，这也意味着这些新技术已经轻轻松松嗖地一声超过了（大部分）人类的翻译能力。
面部识别问题已经被解决了。在 2015 年 6 月份，facebook 的人工智能负责人 yann lecun 宣称 facebook 的算法在识别从 flickr 获得的 40000 张图片中的人脸时正确率达到 83%。有趣的是，有时候图片中并不需要出现人脸——因为算法在拥有足够多关于用户的数据时，能够使用其他类似于衣着之类的线索来识别用户（「mark 似乎总穿灰色的 t 恤衫」）。随着照片激增，facebook 和 google 也随着用户在图片中标记他们的朋友而获得持续的反馈，基于图片的识别技术正在持续进步。在拥有视频、每个用户的习惯、着装和定位的历史记录的情况下，算法将在识别谁是谁这方面轻松超越人类。（还记得上次你挣扎着辨认某个你几年没见的人吗？）而也许在解读视觉线索上，算法也比你厉害。
大海捞针
人工智能系统能够从原始数据中推断出更高水平的概念（「特征」）。例如，人脸就是一个从构成视频的原始像素中推断出来的特征。这实质上使得所有视频和所有声音都变成了可搜索的文件。clarify.io 公司就是提供该种服务的。
但是人工智能不仅局限在帮助人类进行搜索，它还能为你完成所有可能的搜索并得出更高水平的「特征」：有趣的模式或是异常事件。
人工智能也通过对数据集加上常见的识别符来对许多可获得的数据资源进行此种搜索。所以你看到的不仅是「视频里的一张人脸」，也是这张脸后面的人名，是这个人在网络上留下的蛛丝马迹（包括所有其他这张脸曾经出现过的地方、所有浏览活动、所有通信、所有线上社交过程中的观点等）和所有其他可能获得的数据集。
这些人工智能系统将持续进步，并且每次经过改进的版本将对原始数据重新进行处理。比如说英国警方用一个算法对上周所有公共闭路电视的录像进行了处理来确认一个罪犯的长相。今天的算法可能找不到，但是未来的版本就可以。
所以，这些进步意味着什么呢？
对商业的意义
广告商、保险公司、零售商和银行将尽情享受这些新数据，就像他们目前为止已经对其他互联网数据做的那样。他们的目标依然是对「你」建立起一个充满细节的用户画像，以卖给你更多东西并量化你带来的风险或责任。
无迹可寻的监控加上一直在进步的人工智能系统可以提供：
你的经济社会地位：你居住的地点、你工作的地点和收入、你是否要送小孩上学、你跟谁以何种频率到哪里消遣。你的购物习惯：你到哪里购物、你穿什么衣服、你的朋友穿什么衣服、你去工作的时候必须穿什么衣服。你的健康：你有多活跃、你是否吸烟或喝酒、你光顾或预定哪种餐馆、你去看过多少医生。
在更宏观的层面上来讲，这也带来一些有趣的进行预测的机会：
如果半打价值 100 美金的静态摄像头就能告诉你有关在今年伦敦时尚街区 shoreditch 里所有人的着装信息，如果你能够通过社交网络和街拍的照片追踪一股潮流从刚开始到变成爆款的过程，这对将对时尚产业产生什么影响？
— 引自 benedict evans 的文章《照相机、电子商务与机器学习（cameras, ecommerce and machine learning）》
看起来不可避免的是，这些基于视频获得的洞见将被自动驾驶汽车公司转卖掉，就像 google 和 facebook 基于浏览历史和点赞行为把目标客户卖掉一样。这里面商机大把。
而这些是否会在台面上出现，则将取决于视频数据使用的相关监管的本质。台面之下，虽然互联网安全问题风头正劲，但这些数据仍将被用作商业目的。
在隐私方面的意义
就像 gregory ferenstein 曾在他《》一文中睿智指出的那样：「『完全透明』是人性的自然状态。隐私作为一个概念，只有大概 150 年的历史。」the birth and death of privacy
在很长一段时间，想要获得我们今天所考虑的任何形式的隐私其实都是不可能的。部落社会都一起生活在山洞中，罗马人都生活在只有一个房间的房子里，中世纪的家庭和他们的仆人都睡在同一张床上，所以实际上，他们没有私人空间或是个人隐私的概念。
随着独立的房舍、房间、床的出现，并可通过像写信和电话这些新科技进行通信以后，私人生活变为可能，对于隐私的渴望也开始出现。美国第一个主要关于隐私的法案是《1710 邮局法案》（1710 post office act）。该法案禁止邮局工作人员拆阅邮寄的信件。
但是，隐私对于便利和成本来说一直是次要的考量因素。这也解释了对那些侵害我们隐私却被认为是值得的新科技的持续而广泛的应用。
现在，自动驾驶汽车就是需要评估的新技术之一。现在我们允许人们在以每小时 100 英里的速度操控一吨重的铁家伙的时候只通过信号来告诉自动驾驶汽车油门不要踩太大，这是不是太疯狂了？确实很疯狂。但是在美国交通事故每年造成 30000 人死亡（就是每 17 分钟就有一人死于交通事故）。而自动驾驶汽车能够显著降低交通事故死亡人数，这使得自动驾驶汽车技术本身变得非常有吸引力。但是这对隐私又意味着什么呢？
这次你无法默认选「否」
智能手机和互联网革命也已经带来了深刻的变革，但是你能够选择不使用智能手机或 facebook、google 等所有以收集和售卖你的数据为生的公司提供的服务。
而在一个到处都是摄像头的世界里，「数据追踪」完全是离线的。从你出门那一刻开始，你所有的行动都被打上时间戳、进行定位、添加到你的电子简介并记录进数据库。你无法默认选「否」。
（为了尽量延缓这天的到来，你可以，一，确保你的脸孔不出现在互联网上；二，住在例如朝鲜这种最后才会拥有自动驾驶汽车的地方；三，住在一个多云的地方使得无人机和卫星难以从远处看到你。这样干也有好处，我打赌你的房租会更加便宜。）
100% 可实施
众所周知，目前以美国为首的各国内正通行无授权监控，例如最近英国的「偷窥宪章」（the snooper’s charter）法案成为了立法，或是法国延长了全国紧急状态。
到处都是摄像头意味着有一个潜在的额外数据来源以发现公民不合规的行为。这会被情报机构用作防卫目的，但也会在陷入诉讼时直接影响你我。
法律变成 100% 可实施的。如果公诉人能够将所有违规行为——比如说乱穿马路（以一条交通规则里实质上很荒谬的规定为例）——都编制到视频处理算法里面，并且用这个算法处理美国在公共生活中获得的所有视频，立马就可以起诉所有乱穿马路的人。
我觉得要记住的一个最重要的观念就是，在美国历史上已经有数次证明，「正确」与「合法」之间不能划等号。——爱德华 · 斯诺登
另一个需要考虑的因素是，因为更多的数据（特别是视频数据）收集，电脑犯罪的范围和效率也增加了。随着「数据追踪」来到了离线的真实世界，「确认目标」也来了。举例来说，你可以想象一架被劫持的无人机飞去伤害某个被通过黑进一辆自动驾驶汽车的即时影像而确认身份的人。
，现在会发生什么？
目前，公众关于自动驾驶汽车和人工智能的辩论主要关注最迫切的方面：把数以百万计的工作岗位自动化会带来的经济和社会影响（例如在美国最常见的卡车司机的工作）。这是全体选民最担忧的事情。
但是自动驾驶汽车对于隐私的影响也需要在公共辩论中拥有一席之地。
自动驾驶汽车，应该是在仔细衡量过包括对隐私的影响在内的所有优点和缺点的前提下所做出的谨慎的社会选择。
辩论的结果应该有助于产生清晰的规则以解决如下问题：
哪些数据可以从自动驾驶汽车的视频摄像头上以何种格式搜集，什么数据可以以何种形式被匿名化？这些数据会被在哪里以多长的时限进行储存、分享和保护，以及公众将会对此有何控制力？谁会控制视频信息处理的算法，以及我们将如何确保他们工作的有效和合规？（法官是否需要学习编程？法律是否会变成代码？）
随着自动驾驶汽车技术趋向成熟（elon musk 预计特斯拉会在 2018 年推出首款完全自动驾驶的汽车），政策辩论是时候认真考虑这对隐私的影响了。
就我目前的研究来...