以下是受某期刊邀请写的比较长的评论文章,和原来TED China的演讲不同(演讲煽动性强,严谨性不足),供有兴趣的读者参考。
----
大数据与人工智能的伦理挑战
周涛 电子科技大学
摘要:一个以大数据为原材料,以人工智能为引擎的新科技时代的到来不可阻挡。大数据和人工智能在给人类社会带来巨大利益的同时,也带来了诸如个人隐私、数据独裁、新型智能生命等让人担忧的问题。本文将回顾大数据和人工智能伦理研究的背景、意义和现状,着重从中立性、时效性、导向性、边界问题、隐私问题和责权问题六个方面介绍大数据于人工智能发展带来的具体伦理挑战,最后简述当前有效的应对策略并讨论未来开放性的政策和技术问题。
关键词:大数据,人工智能,伦理,算法
1. 引言
随着互联网、移动互联网、物联网和各种遥感探测技术的发展,一个“一切都被记录,一切都被分析”的数据化时代已经到来——现在全球数据存储量已经达到了20ZB左右,也就是两千万PB。得益于可用于算法训练的海量数据的积累和以深度学习为代表的机器学习算法的发展[1],近几年来,人工智能在若干应用场景达到甚至超过了人类专家的水平——大家记忆犹新的就是2016年AlphaGo以4:1的比分战胜围棋世界冠军李世石[2]。越来越多的证据显示,一个以大数据为原材料,以人工智能为引擎的新科技时代正在到来[3][4]。
大数据和人工智能的技术发展与应用实践,已经为我们的生活带来了显著的贡献[4][5]。在医疗领域,大数据和人工智能被用于精准识别医疗影像中早期的病灶,定位致病基因并开展相应的靶向治疗,实时监测评估健康状况、提前预警重大健康风险等[6];在交通领域,海量数据和预测算法的结合能够帮助我们进行更高效的交通导航,尽可能减少拥堵时间[7];在教育领域,学生发展过程中学习和生活数据的分析,可以帮助了解学生行为和学业表现之间的关系,设计更高效的个性化教育方案,提前对不利于学业发展的异常行为进行干预[8];等等。
在带给我们可感知的贡献的同时,大数据与人工智能也带来了一系列让人忧虑的问题,譬如个人关键隐私信息的大面积泄漏问题,又如人工智能对若干劳动岗位的冲击,再如大数据和人工智能深度结合形成的新型数据独裁问题,等等。这些问题要求我们在伦理意义上仔细审视大数据和人工智能的发展。简而言之,伦理问题就是判断好与坏、对与错的问题,大数据与人工智能的伦理研究是站在人类整体利益的角度去审视判断大数据与人工智能哪些技术何种应用对人类是有利的、哪些是危险的、哪些是不应触碰的,其最终的目的是要找到路径、梳理规范,以保证大数据和人工智能的发展给人类带来的利益远大于伤害。
大数据与人工智能的伦理问题引起了全球学界、业界和政府广泛的关注。2016年,奥巴马政府发表了题为《为人工智能的未来做好准备》的报告[9],强烈建议要评估人工智能技术和产品带来的风险;2017年,欧洲经济和社会委员发表了题为《大数据伦理——在欧盟政策背景下,实现大数据的经济利益与道德伦理之间的综合平衡》的报告,对大数据的伦理问题进行了概括,特别强调了数据采集和使用带来的安全和隐私问题;2018年,英国议会发表了《英国人工智能的准备、计划和能力》的报告[11],呼吁政府为人工智能研发和应用设定伦理原则;美国电气与工程师协会、美国未来生命研究所等研究组织和微软、谷歌等科技公司也陆续发布了相关的研究报告。其他国际上相关的报告例子还很多,不一一举出。
中国也开始意识到这些伦理问题的重要性,例如我国2017年发布的《新一代人工智能发展规划》中指出制定人工智能发展的伦理规范是促进人工智能发展的重要保证措施,2017年12月8日,中共中央政治局就实施国家大数据战略进行第二次集体学习,习近平主席主持学习并发表了讲话,在提出实施国家大数据战略加快建设数字中国要求的同时,特别强调了数据安全、数据隐私、数据确权、数据版权、数据治理政策储备和治理规则等与数据伦理相关的问题。与欧美等国相比,我国学界、业界和政府在大数据与人工智能伦理问题上系统性的深入研究还较少,目前尚未形成具有国际影响力的伦理研究报告和政策实施方案,与习近平主席提出的“要加强国际数据治理政策储备和治理规则研究,提出中国方案”这一要求尚有较大差距。
因为大数据和人工智能的发展是高度融合的,所以本文不拟特别区分大数据的伦理问题和人工智能的伦理问题,而是结合讨论从数据采集、存储和应用,一直到数据挖掘、机器学习等典型人工智能技术发展所带来的一系列伦理问题。限于篇幅,文章将集中讨论中立性、时效性、导向性、边界问题、隐私问题和责权问题六个方面。本文尽量采用通俗的语言和生动的例子来说明这些问题,既可以作为政府相关管理人员以及学者和从业人员了解大数据与人工智能伦理问题的入门材料,也可以作为一般读者的科普读物。
参考文献:
[1] Y. LeCun, Y. Bengio, G. Hinton, Deep Learning, Nature 521 (2015) 436.
[2] D. Silver, et al., Mastering the game of Go with deep neural networks and tree search, Nature 529 (2016) 484
[3] 维克托·迈尔-舍恩伯格,肯尼思·库克耶(著),盛杨燕,周涛(译),《大数据时代:工作、生活与思维的大变革》,浙江人民出版社,2013年。
[4] 吴军,《智能时代:大数据与智能革命重新定义未来》,中信出版集团,2016年。
[5] 周涛,《为数据而生:大数据创新实践》,北京联合出版公司,2016年。
[6] 埃克里·托普(著),张南,等(译),《颠覆医疗:大数据时代的个人健康革命》,电子工业出版社,2014年。
[7] Y. Lu, et al., Traffic flow prediction with big data: A deep learning approach. IEEE Transactions on Intelligent Transportation Systems 16 (2015) 865.
[8] Y. Cao, et al., Orderliness predicts academic performance: Behavioral analysis on campus lifestyle, Journal of the Royal Society Interface 2018.
[9] Executive Office of the President (Obama), National Science and Technology Council Committee on Technology, Preparing for the future of artificial intelligence, 2016.
[10] European Economic and Social Committee, The ethics of Big Data: Balancing economic benefits and ethical questions of Big Data in the EU policy context, 2017.
[11] House of Lords in UK, AI in the UK: ready, willing and able, 2018.