人工智能不为人知的秘密?渴望得到不受限制的数据
人工智能革命渴望获得个人数据。在机器智能和监视产生交集前,需要致力于制定隐私法规。
人工智能可以通过多种方式帮助人类。无人驾驶汽车和智能基础设施恪守了这样的承诺,即促进人们来回穿梭于城市的活动,以减少交通拥堵。经过改进的诊断和治疗方式正在延长人们的寿命。在企业中,人工智能有助于改善招聘决策、使工厂更安全、将日常任务自动化、生成更客观的绩效评估并帮组织了解客户。
新工具频频出现。亚马逊已经获得了两项腕带专利,这些腕带可以在工作人员填写订单时追踪手部动作。腕带使用射频来追踪手部运动,这种追踪十分准确,一旦检测到低效的活动腕带就会振动,轻轻碰触工作人员的手以将其引向正确的方向。Humanyze售卖能可以衡量社交关系的胸牌,这些胸牌可以追踪办公室员工的活动,以提供他们与同事互动的质量有关的洞察。玉兰油(L'Oréal)的UV Sense可以追踪佩戴者暴露于紫外线的时间和程度,然后将数据传输到用户的手机上。Cogito可以监控同理度(empathy),即客服坐席处理呼叫时设身处地为客户着想的态度。
不幸的是,要发掘这些工具的好处就需要大量的数据,这也使消费者和员工很容易受到监控。中国的社会信用体系于2014年启用,预计到2020年全面投入使用。为了创建个人档案,该系统汇总了支付记录、医疗信息、法律记录以及其它数据。此外,该系统使用面部识别来追踪每个人的踪迹及其互动的对象。摄像头在各大城市非常普遍,人们开玩笑说政府可以在七分钟内找到任何一个人。
确实,大量的数据以人们意想不到的方式使社会受益。2018年4月,Joseph DeAngelo被指控为金州杀手(译注:金州是加州的别名),涉嫌参与了一系列仍未告破的谋杀案和强奸案,这些案件发生于上世纪七八十年代。警方将嫌疑人的基因特征与为人们研究家谱提供服务的个人网站上的基因表达谱进行了比较。最终,他们将目标锁定为一群人,这群人与犯罪者的遗传物质有一定的关联,根据年龄,性别以及住所排除了其中一部分人。在警方确定DeAngelo是嫌犯后,他们从他丢弃的垃圾中获取了DNA样本,并发现该样本与犯罪现场的样本吻合。
虽然这些基因数据库帮警方解决了发生在几十年前的罪案,但使用该数据库会引发隐私方面的问题。在向存储库提供遗传数据的人中,很少有人希望这些文件被执法部门拿去作评估。贡献这些资料的人可能没有意识到,自己的行为可能会让当局掌握亲属的信息,这些亲属并不同意公开基因信息,或者,他们甚至不知道家族的遗传物质存在数据库中。
全世界所面临的隐私问题日渐增多。2018年5月,欧盟实施了全面的隐私保护法规,名为《通用数据保护条例(GDPR)》。其它国家也正在立法,如加拿大的《国家网络安全战略》保护数字隐私。印度提议的《个人数据保护法案》强调人工智能道德、个人隐私、安全性和透明度。这些法规由独立的监管机构进行监督,对违法行为实施严厉处罚。联合国的统计称,有一百多个国家实施了数据保护和隐私法。然而,它承认,最近,很多保护法并没有得到更新,而且也不够严苛,无法让公民相信自己的隐私得到了充分的保护。
2016年,亚马逊、苹果、脸书、谷歌和微软的一些工程师、设计师和其他员工越来越关注监控的潜力,他们许下了“到此为止(Never Again)”的承诺。这个名字指的是IBM技术在第二次世界大战期间所发挥的作用,当时IBM的穿孔卡帮美国政府管理日裔美国人,帮纳粹追踪大屠杀的受害者。签署“到此为止”的公司保证不会创建任何可以让美国政府收集有关个人宗教信仰的信息数据库,它们担心此类数据库可能会导致大量人口被驱逐出境。
在2018年10月布鲁塞尔国际数据保护和隐私委员会会议召开期间,Tim Cook表达了自己对“数据工业园区(data industrial complex)”的担忧。他警告说,为了创建一个“经久不衰的数字档案,公司正在收集个人数据并将其综合起来,这使它们十分了解你,远胜于你对自己的了解。”
他支持《通用数据保护条例》并呼吁美国制定隐私法。
隐私监管七原则
Cook是对的:现在美国该效仿其他国家并制定数字隐私法了。新法规至少应包括以下原则。
尽量将要收集的数据最小化
数据收集应限于完成手头任务所需的数据。为将来派上用场而收集额外的数据,这样的做法应该受到限制。个人身份信息必须删除,不得出现在用于分析的数据中。
向用户告知数据收集事宜
在收集数据时应通知用户,并告知用户数据将如何被使用。个人必须能够决定其数据是否允许在每个活动期间被收集。浏览器和网站的条款和条件必须十分简单,简单到消费者可以快速做出明智的决定。
使个人可以访问数据
个人必须能复制自己的数据并纠正或删除不准确的个人数据。如今,纠正数据对一些企业来说几乎是不可能的。最近,我的一位同事要更新信用报告,因为她搬回了她曾住过的隔壁房。虽然她找到了修改街道地址最后一位数字的商店老板,但信用局拒绝删除该条目,称她未能证明自己从未住过另一所房子。她要求信用局就证据的构成标准给予指导时,但信用局没有作出回应。
需要决策透明度
人工智能日渐频繁地在法律法规、人员招聘、大学招生和其它方面做决策,这深深影响了个人生活。由于人工智能要使用大量的数据,而这些数据又受到大量规则的制约,因此人们往往无法理解人工智能引擎是如何得出结论的。人工智能引擎工作时使用什么样的逻辑,虽然理解这一点对人类来说并不重要,但在一些情况中,偏见或意外后果可能会影响最终结果,这是不可接受的。
Equivant的工具可以预测个人犯下新罪行的可能性。如果法官在量刑期间使用该工具,那么他们通常会判评分很高的被告人判服更长的刑期。不幸的是,由于评分机制是专有的,因此被告无法提出质疑。
ProPublica是一家公共利益调查新闻组织,它在2013年和2014年对佛罗里达州布劳沃德县的7,000名被告进行了分析。Equivant预测了哪些被告人会在接下来的两年内犯罪,ProPublica则将其预测结果与每个被告人犯下的实际新罪行进行了比较。他们得出结论,Equivant的风险评分并不可靠;它可能会预测,在这些被告人中,黑人在未来犯罪的可能性可能是白人的两倍,而这是错的。Equivant并不赞同,它认为ProPublica的方法存在缺陷。显然,对个人生活具有如此巨大潜在影响的,无论是判刑还是其它深深影响个人生活的法律手段,都必须高度准确并且在逻辑上站得住脚。
保护数据
确保数据的安全性,确保数据使用得当,这是所有收集和存储数据需求的实体都要做到的事情。最近就发生了一系列数据泄露事件,万豪和Quora就是新增的两例,这些事件已经使很多人受到影响。
实施合规性
严惩不贷的积极执法方式对于实施有效的新法规至关重要。各大技术公司赚得盆满钵满,小小的处罚简直可以忽略不计,充其量只是一点点经营成本。
制定国家法律
新的美国隐私法应涵盖所有收集个人数据的企业,而不仅仅是技术公司。此外,联邦立法也是必需的,否则其他州将效仿加州,自行制定法律,而这些法律可能并不相容。
立法对企业的影响
由于新隐私法规的制定,有些公司不得不反思其商业模式。如今,为了免费使用搜索引擎、社交媒体和其它工具,有很多消费者会提供个人数据。担心隐私问题的消费者也许会支付一小笔费用,以换取真正的匿名状态。虽然在理论上,在今时今日,不留痕迹地浏览网页是可能做到的,但大多数消费者发现,如果没有娴熟的技术帮助,这一点根本不可能做到。
企业要部署新工具,员工要维护个人隐私,这两者之间必须取得平衡,为此,工作场所既需要细致的规划,也需要做出一些妥协。新法规可能会产生这样的情况,即员工必须同意别人收集他们的数据。根据新立法中的说法,很多现有工具会产生据称是个人信息的内容,这些内容使员工可以免遭追踪,因而使这些工具形同虚设。
毫无疑问,遵守新法规会迫使公司更加谨慎地处理员工数据。主管很可能只能访问与个人绩效直接相关的员工数据,而分析工具仅在匿名数据上运行。经营良好的企业可以为希望提高绩效的员工提供单独的指导。
人工智能带来了很多好处,它还将带来我们目前无法想象的其它好处。人工智能与所有新技术一样,既可以造福人类,也可能遭到滥用。如何确保我们所收集的数据不会用于不当的监视,当我们弄明白这一点时,Scott McNealy于1999年所作的断言也许将不再是事实,他断言“你毫无隐私可言,想都别想”。