人工智能也会学坏?“终结者“时代会来临吗?

快资讯
易创吧
相信许多人都看过《终结者》系列电影,当科技不断发展,人工智能越来越成熟,不少人都开始担心,但人工智能越来越像人类,是否“终结者”中的场景会在未来某一天到来。 人工智能技术之所以流行,主要因...

相信许多人都看过《终结者》系列电影,当科技不断发展,人工智能越来越成熟,不少人都开始担心,但人工智能越来越像人类,是否“终结者”中的场景会在未来某一天到来。

人工智能技术之所以流行,主要因为“深度学习”技术推进。利用深度学习之后,企业可以在网络中输入大量信息,迅速识别模式,而且耗费人工培训的时间减少,最终很可能无需培训。Facebook、谷歌、微软、亚马逊和IBM等巨头都已在产品上应用深度学习技术。举例来说,苹果的Siri和谷歌的语音助手Assistant应用深度学习技术后,可在用户说话之后识别并回应。亚马逊主要利用深度学习直观检查大量通过杂货店派送的产品。

不久的将来,各种规模的公司都会希望通过应用深度学习软件挖掘数据,寻找人眼很难发现的宝贝。人们希望出现人工智能系统扫描数千张X光图像,从而更迅速发现疾病;或自动筛选多份简历,为焦头烂额的人力资源员工节省时间。在科技主义者的设想中,公司可以用人工智能筛选过去多年的数据,更好地预测下一次大卖的机会。药业巨头可以削减研发畅销药的时间。而汽车保险公司也能扫描记录数万亿字节的事故报告,实现自动索赔等。

目前人工智能已经可以模仿并强化人类的决策,但也暴露了人工智能目前最严峻的问题——偏见。人工智能决策水平受到人类提供数据的限制,开发者虽然不断学习,用来培训深度学习系统的数据却并不中立。数据很容易体现出开发者的偏见,不管有意还是无意。有时数据还会受历史影响,形成的趋势和模式体现出持续数百年的歧视观点。

2016年3月微软推出Tay时,非常看好这款人工智能支持的“聊天机器人”。跟人们之前在电商网站上接触过的文字聊天程序一样,Tay也可以回答文字问题,从而在推特和其他社交媒体上与公众交流。

但Tay功能更强大,不仅能回答事实性问题,还可以进行更复杂的交流,即加入了情感因素。Tay能表现出幽默感,像朋友一样跟用户说笑。设计者特地让Tay模仿十几岁少女的俏皮口吻。如果推特的用户问Tay父母是谁,她可能回答说:“哦,是微软实验室的一群科学家。按你们的概念里他们就是我父母。”如果有人问Tay过得怎样,她还可能吐槽说:“天呐,今天可累死我了。”

最有趣的一点是,随着与越来越多人交谈,Tay问答时会越发熟练。宣传材料中提到:“你跟Tay聊得越多,她就越聪明,体验也会个人化。”简单点说,Tay具有人工智能最重要的特点,即随时间越来越聪明,越来越高效,提供的帮助也越来越大。但是,当Tay开始和人类聊天后,不到24小时,她就被“教坏”了,成为一个集反犹太人、性别歧视、种族歧视于一身的“不良少女”。上线不到24小时,微软就宣布下线产品并公开道歉。

微软研究和人工智能总监艾瑞克·霍维茨在接收采访时表示“系统上线时,我们并没有想到进入现实世界会怎样。”

普林斯顿大学信息技术政策中心的计算机科学家 Arvind Narayanan 在面对人工智能越发“智慧”表现出担忧:AI 如果在机器学习中将人类固有的偏见全盘复制过来,之后也会将其学到的偏见一五一十地反馈出去,这可能会加重文化中原有的刻板印象,这可能会进一步创造出一个延续偏见的反馈回路。

“当前应用的强大算法没有为所谓公平进行优化。”加州大学伯克利分校副教授迪尔德丽·穆里根表示,她主要研究技术伦理。“只存在为完成某项任务优化。”人工智能以前所未有的速度将数据转化为决策,但穆里根表示,科学家和伦理学家发现很多情况下“数据并不公平”。

深度学习较传统算法更加复杂,即便让经验最丰富的程序员理解人工智能系统做出某项决策的逻辑都十分困难。在Tay的例子里,人工智能产品不断发生变化,开发者已无法理解也无法预测为何出现某些行为。由于系统的开发者和用户都在拼命保密数据和算法,而且担心专利技术泄露导致竞争受损,外部监测机构也很难发现系统里存在什么问题。

Facebook曾在2016年发生一起人工智能奔溃事件,在2016年美国大选前期,Facebook的新闻推送中出现了假新闻。社交媒体巨头Facebook和数据科学家并没有编造故事。新闻信息流的开发机制并不会区分“真”和“假”,只会根据用户个人口味推动个性化内容。Facebook没公开算法具体信息,但承认计算时会参考其他近似口味用户阅读和分享的内容。结果是:由于适合流传的假新闻不断出现,好友们又喜欢看,数百万人的新闻信息流里都出现了假新闻。

Facebook的例子说明个人选择与人工智能发生恶性互动的情况,但研究者更担心深度学习阅读并误读整体数据。博士后提米特·葛布鲁曾在微软等公司研究算法伦理,她对深度学习影响保险市场的方式很担心,因为在保险市场上人工智能与数据结合后可能导致少数群体受到不公待遇。举个例子,想象有一组汽车事故索赔数据。数据显示市中心交通事故率比较高,由于人口密集车祸也多。市中心居住的少数群体人数比例也相对更高。

如果深度学习软件里嵌入了相关联系再筛选数据,可能“发现”少数族裔与车祸之间存在联系,还可能对少数族裔司机贴上某种标签。简单来说,保险人工智能可能出现种族偏见。如果系统通过回顾市中心附近车祸现场的照片和视频进一步“培训”,人工智能更有可能得出结论认为,在涉及多名司机的事故中,少数族裔司机过错可能更大。系统还可能建议向少数族裔司机收取更高保费,不管之前驾驶记录如何。

此外,葛布鲁指出,由于深度学习系统决策基于层层叠叠的数据,人工智能软件决策时工程师都不明白其中原因和机制。“这些都是我们之前没想过的,因为人类刚刚开始发现基础算法里存在的偏见。”

微软和IBM均表示,公司已采取针对性的措施来完善其图片识别技术。尽管这两家公司拒绝透露其举措的详情,但正在应对这一问题的其他公司则让我们窥见了如何利用科技来规避偏见。

当亚马逊在部署用于筛除腐烂水果的算法时,公司必须解决抽样偏见问题。人们会通过研究大量的图片数据库来培训视觉辨认算法,其目的通常是为了识别,例如,草莓“本应”具有的模样。然而,正如你所预料的那样,与完好浆果光鲜亮丽的照片相比,腐烂的浆果相对较为稀少。而且与人类不同的是,机器学习算法倾向于不计算或忽视它们,而人类的大脑则倾向于注意这些异常群体,并对其做出强烈反应。

亚马逊的人工智能总监拉尔夫·荷布里奇解释道,作为调整,这位在线零售巨头正在测试一项名为过采样的计算机科学技术。机器学习工程师可通过向未充分代表的数据分配更大的统计学“权重”,来主导算法的学习方式。在上述案例中便是腐烂水果的照片。结果显示,培训后的算法更为关注变质食物,而不是数据库中可能建议的食品关联性。

荷布里奇指出,过采样也可被应用于学习人类的算法。荷布里奇说:“年龄、性别、种族、国籍,这些都是人们特别需要测试采样偏见的领域,以便在今后将其融入算法。”为了确保用于识别照片人脸面部所使用的算法并不会歧视或忽视有色、老龄或超重人士,人们可以为此类个人的照片增加权重,以弥补数据组所存在的缺陷。

面对人工智能的偏见,科技公司们应提升人工智能黑盒系统所录入数据的透明度和公开度,有助于研究人员更快地发现偏见,并更加迅速地解决问题。当一个不透明的算法可以决定某个人是否能获得保险,或该人是否会蹲监狱时,我们必须严谨地去测试这些系统,而且需要确保一定的透明度,否者,《终结者》中的人机大战也许会在某一天到来。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论