大数据与人工智能的伦理挑战(3)
周涛  |  2018-09-06  |  科学网  |  440次阅读

3. 时效性

    与人类相比,计算机有一种特别突出的能力,就是能够保真存储和分析很多年以前的数据,并通过算法对未来某些事件给出远远比人精确的预测。

    Mayer-Schönberger曾讨论过一个未来的可能情形,就是当智能机器预测到你将在某时某地犯罪,就可以在你还没有实施犯罪的时候逮捕你[3]。幸运的是,这个比Orwell笔下的世界[16]还可怕得情景,只是Mayer-Schönberger设想的一种极端情况,实际上并没有发生过。Dormehl讲了一个温和得多但已经现实发生的版本[17],就是美国政府根据姓名、出生地、宗教信仰、历史行为数据——例如所有旅行数据、人脸图片数据等等,会利用机器学习算法,对每一位航空旅客是恐怖分子的嫌疑度进行打分。一些无辜的人因为疑似恐怖分子或者近期有较高从事恐怖活动的可能性,而经常在机场被羁留检查,甚至多次错过飞机。通过数据和算法,机器可以预测一个人犯罪的概率,如果这个概率足够大,那么在他还没有实施犯罪行为时,就已经实质上受到了惩罚,尽管他可能是完全无辜的。从功利主义的角度讲,这些智能化的方法能够降低犯罪率,但是这里面一个核心的伦理问题就是“我们是否应该为尚未发生的一种可能性付出代价”。

    反恐的例子距离普通人的生活较远,下面我们来看一个现实生活中的例子——酒驾。对于机动车驾驶员来说,饮酒驾车是违法,醉酒驾驶可入刑。这条法律受到了数据有力的支撑:“当驾驶者血液中酒精含量达80mg/100mL时,发生交通事故的几率是血液中不含酒精时的2.5倍;达到100mg/100mL时,发生交通事故的几率是血液中不含酒精时的4.7倍;即使在少量饮酒的状态下,交通事故的危险度也可达到未饮酒状态的2倍左右。”事实上,这条法规的出台,有效降低了严重交通事故的发生率。尽管驾车不违法、喝酒也不违法,但法律赋予了对酒驾者惩处的合法性——因为他触犯了酒驾的法规,就已经是犯罪,而不是尚未犯罪。不过这条法律的基本精神是惩处可能的尚未发生的更严重的犯罪。这当然无可厚非,例如危害公共安全罪背后的法理出发点也是类似的。当数据的采集能力和算法的分析能力进一步增强之后,我们肯定能够发现更多可能危害公共安全的因素,并把它们写进法律中。几十年后,如果自动驾驶的车辆占有相当的比例,很可能主要的交通事故都是由人类操纵驾驶车辆引起的。那个时候的法律,可能就不是针对饮酒和吸毒后驾车了,但凡活人开车,都得抓了。因为人驾驶车辆本身,就是一种对公共安全的危害。那么,今天能接受酒驾入刑的人,明天能够接受手驾入刑吗?在使用数据和算法预测能力的时候,是否也需要有一个限度?

    计算机让人类更加望尘莫及的,是记录和回顾历史的能力。因为大量过往被数据记录下来,所以我们今天的错误可能会带来很长时间难以消除的影响。中学时间一次冲动的打架斗殴,大学期间因为攀比借了款又没有及时还款……这些记录可能会在十年后呈现给潜在的雇主和金融机构,影响一个人职场的发展,降低他申请车贷房贷的成功率,甚至让他的创业融资遭遇阴影。我们年少轻狂时在自己博客、微博、微信或者其他论坛、贴吧上留下的冲动言论,又或者我们脑残时光上传的裸露、暴力或者炫富的照片,都可能在未来成为我们感情和事业再上一个台阶时的潜水炸弹。我们在本文第6节还会详细讨论数据隐私方面的挑战,如果考虑到隐私泄漏的危险,那么你新交的女友或许花10元钱就能扒出你的恋爱史,以及那些你曾经许给不止一个人的山盟海誓。

    中国有句古话,叫做“浪子回头金不换”。父母亲友也许会选择原谅甚至忘记,但大数据和人工智能不会遗忘。Mayer-Schönberger就曾经强烈呼吁应该给我们的数据一个“被遗忘的权利”——除了出于科学研究、档案管理、公共安全或其他特殊的既非盈利也不面向一般公众的目的,个人和企业不应该存储、分析、使用和传播超出一定年限的数据[18]。一些科技企业已经开始了类似的尝试,例如著名的社交网站Snapchat起家的时候就是推出了“阅后即焚”的功能——你发给朋友的信息和图片,对方阅读后一段时间内自动消失。2017年,腾迅投资了Snapchat,实际上腾迅在微信的私信助手中也有“阅后即焚”的功能,还可以设定多长时间后删除消息。但是,你和你的好友虽然看不到了,Snapchat和腾迅原则上可以保存和利用这些信息。另外,社交媒体产生的数据,相比于一个人所有被记录下来的行为数据,毕竟只是很小的一部分,而绝大部分与我们紧密相关的数据都不是我们主动上传或发送的。越来越多的企业认识到了数据的价值,因此主动删除或者放弃某些数据的使用权,似乎并不是一家盈利性企业优先考虑的问题。尽管Mayer-Schönberger的呼吁已经过去了五年多,我们还没有看到在这个方面任何实质性的进展。

    我们每个人都应该尊重历史,都应该怀揣梦想,但更多的时候我们生活在当下。当一个人每做一件事情,都可能承受因过往历史的影响,都必须考虑对未来发展的影响,那这样的人生是不堪重负的。如果数据的使用时限不受控制,这种机制下最安全的选择只能是沿着数据和算法所青睐的某种智能时代的主流道路前进。人类与生俱有的自由狷狂和特立独行恐怕最终都不得不服从机器制定的优化后的规则。


 

参考文献:

[1] Y. LeCun, Y. Bengio, G. Hinton, Deep Learning, Nature 521 (2015) 436.

[2] D. Silver, et al., Mastering the game of Go with deep neural networks and tree search, Nature 529 (2016) 484

[3]  维克托·迈尔-舍恩伯格,肯尼思·库克耶(著),盛杨燕,周涛(译),《大数据时代:工作、生活与思维的大变革》,浙江人民出版社,2013年。

[4] 吴军,《智能时代:大数据与智能革命重新定义未来》,中信出版集团,2016年。

[5] 周涛,《为数据而生:大数据创新实践》,北京联合出版公司,2016年。

[6] 埃克里·托普(著),张南,等(译),《颠覆医疗:大数据时代的个人健康革命》,电子工业出版社,2014年。

[7] Y. Lu, et al., Traffic flow prediction with big data: A deep learning approach. IEEE Transactions on Intelligent Transportation Systems 16 (2015) 865.

[8] Y. Cao, et al., Orderliness predicts academic performance: Behavioral analysis on campus lifestyle, Journal of the Royal Society Interface 2018.

[9] Executive Office of the President (Obama), National Science and Technology Council Committee on Technology, Preparing for the future of artificial intelligence, 2016.

[10] European Economic and Social Committee, The ethics of Big Data: Balancing economic benefits and ethical questions of Big Data in the EU policy context, 2017.

[11] House of Lords in UK, AI in the UK: ready, willing and able, 2018.

[12] X. Yang, et al., Height conditions salary expectations: Evidence from large-scale data in China, Physica A 501 (2018) 86.

[13] A. Datta, et al., Discrimination in Online Advertising: A Multidisciplinary Inquiry, Proceedings of Machine Learning Research 81 (2018) 1.

[14] A. Caliskan, J. J. Bryson, A. Narayanan, Semantics derived automatically from language corpora contain human-like biases, Science 356 (2017) 183.

[15] L. Lu, et al., Recommender Systems, Physics Reports 519 (2012) 1.

[16] 乔治·奥威尔(著),傅惟慈 ,董乐山(译),《一九八四》,万卷出版公司,2010年。 

[17] 卢克·多梅尓(著),胡小锐 , 钟毅(译),《算法时代:新经济的新引擎》,中信出版集团,2016年。

[18] 维克托·迈尔-舍恩伯格(著),袁杰(译),《删除:大数据取舍之道》,浙江人民出版社,2013年。

 

 




文章原载于作者的科学网文章,所述内容属作者个人观点,不代表本平台立场。
本文经过系统重新排版,阅读原内容可点击 阅读原文