(法国版) 法国 英国 中国

分类: 科技

人工智能:对其无知,才会恐惧

秦曾昌 / 北京航空航天大学自动化学院副教授、北航科学技术传播研究中心秘书长 / 2016-04-21

“我们这些学习人工智能的人赶上了一个好时候,”北京航空航天大学智能计算与机器学习实验室主任秦曾昌说。虽然仅仅15年前,他在英国布里斯托大学攻读“机器学习和数据挖掘”硕士和人工智能博士学位时,普通公众中还很少对人工智能有如此浓厚兴趣。

过去几十年来,人工智能研究取得显著进展,并走出实验室,呈现技术扩散趋势。某些计算机算法的完善程度已足以替代人类,更好地解决现实问题。相对已在军事、金融和医疗等专业领域得到深入应用的专家系统,真正让普通公众意识到人工智能重要性的,还是近来搜索引擎、社交网络的普及以及智能手机中的大量模式识别应用。

学术界和产业界普遍认为,人工智能的这次“复兴”有着与以往不同的历史意义。

“我们今天已离不开通讯和信息,各种聪明的算法能够对信息获取、存储、传送、交换和理解产生极大帮助和促进,所以人工智能应用前景非常光明,发展速度也会随着计算机技术的发展而不断加快。”秦曾昌对《上海交大巴黎高科评论》说。

随着Google、百度等科技巨头纷纷举起人工智能大旗,全社会开始从不同角度和层面对人工智能进行解读,甚至误读。那么,在专业学者眼中,人工智能技术究竟发展到了何种程度?我们对机器智能时代的到来到底应该欣喜还是恐惧?


Read this article in English

访谈:

AlphaGo是否称得上重大技术突破?

上海交大巴黎高科评论:日前,谷歌的AlphaGo与人类围棋能手大战,让人工智能受到了舆论的空前关注。是否可以介绍一下,人工智能大致可分为哪些研究分支?各自的技术应用现状和商业前景如何?

秦曾昌人工智能话题在今天的流行,很大程度上也是因为商业公司的推动,包括微软、谷歌等等,它们在自己的产品和服务中大量使用人工智能技术,在人们生活的很多方面发挥了实际作用,可以说,人工智能技术其实很早就走出了学院和实验室,本身虽然属于非常前沿的领域,但与日常生活并没有想象那么遥远。

虽然媒体和公众对人工智能的讨论很多,看法有悲观也有乐观,产业投资也是时冷时热,但人工智能的学术研究其实一直在稳步推进。尤其在发达国家,产业与学界在这方面一直保持着密切的关联和互动。和其他技术相比,隶属于计算机科学的人工智能,从研究到商业化的速度更快,可能去年才发表的论文,今年就变成硅谷名校的学生作业,甚至很快变成了产品,这和行业属性有关,所有人反应都很快。

从大的研究潮流来看,“传统”人工智能研究,大部分由计算机科学家主导,但发展到今天,人工智能出现很多外延,引入了心理学、神经学等研究方法,但背后的终极目的,是理解人的智能或制造智能机器,或者兼而有之。

人类想让像鸟一样飞上蓝天,于发明了飞机,飞机是运用鸟的飞行原理做出的能提供相同功能的机器,而不是一模一样的“鸟”。这也是计算机科学家的研究人工智能的方式。我们发明的计算机,绝大多数是为弥补人类脑力的不足,延伸人的计算能力和信息处理能力,并不要求机器工作方式与人类大脑工作机理完全一样。无论从工程角度还是数学角度,人工智能还是工具,是为了服务于人类。

当然,另外一些研究方式,主要是神经学,研究对象其实是人的意识和思维,是为了对其做出解释,这方面已有大量研究成果,最近我就看过一篇文章专门研究大脑如何定位,哪些细胞担负着类似GPS的地理定位功能,等等。这些成果逐渐和人工智能研究产生了交叉和对接。

具体到研究分支,最简单的办法是参考国际人工智能联合大会(International Joint Conference on Artificial Intelligence, 简称为IJCAI)的投稿内容,包括自然语言处理、图像识别、知识表示、多代理系统,甚至模糊逻辑、多值逻辑等,都算是人工智能的学术分支。

目前应用最为广泛的研究成果来自哪些分支? 

这个很难界定,只能说被人们更频繁提及的日常应用当中,计算机视觉、语音识别和自然语言处理方面的技术稍微多些,主要用在人机交互和搜索上。搜索先是利用和处理大量文本,后来延伸到图像、视频搜索。还有一些与日常生活直接相关的应用如语音、指纹掌纹、生物识别等,也是成果比较多、进展比较迅速的。

这些分支和现在广受关注的“机器学习”是什么关系?

“机器学习”本身是人工智能的一个分支,它强调算法的有效性,就是用数据来训练算法,让机器自动具备学习和泛化能力,但是渐渐地,机器学习成了人工智能中最成功的分支之一,里面的思想渗透到各个领域。包括自然语言处理和图像识别,其背后的很多算法都是机器学习算法。机器学习分支本身既关心应用,更关心研究的扩展和深入。

机器学习是不是也有很多不同的方式?

是的,最常见的叫“有监督学习”(Supervised Learning)。举个例子,给机器一个数据库,数据有各种特征,如“身高”、“体重”、“头发颜色”等等,但每条数据有“男”和“女”标签,让机器去从这些数据特征和标签的关联中找到固定模式,形成算法模型,然后针对新输入的身高、体重等数据来判断性别,这就是“有监督学习”。

相反,“无监督学习”没有标签,让机器根据数据自己统计出特征,比如即使没有“男”、“女”标签,机器也能根据数据规律性,把具有相似特征的归为同一类。换一组数据作为度量尺度(measure),机器还可能最终将数据按照儿童、青年、老人分成三大类(当然,机器自己并不知道这种区分的具体现实意义,而只是依据某组数据特征做出的分类)。这种不需要人类事先分类标记的算法学习,叫“无监督学习”(Unsupervised Learning)。

我们从AlphaGo身上看到的,其实是另一种非常重要的机器学习方式,叫增强学习(Reinforcement Learning)。简单来说,机器在采取一个动作时,并不会得到反馈,但经过一系列动作,沿着一条路径完成一个过程,最终得到了或正或负的反馈,和相对应的奖励或惩罚值。这就好像要设计一个走出迷宫的路径,第一步往左还是往右是随机选择,一系列随机选择过后,可能进入死胡同,也可能走出了迷宫。机器根据结果回溯过程,选择(学会)成功的模式(算法),就是增强学习。

所以数据规模对机器学习的效率很关键。那么未来是否有可能,机器学习(或者说人工智能)可以跨过数据,通过直接模拟人脑学习机制来实现?

我不确定你说的“直接模拟”具体如何模拟,所以无法给出答案。但就目前AlphaGo所代表的机器学习方式而言,它面对的是一个特别大的搜索空间,需要很多人的经验来把这个搜索空间变得更小、更有序。就像要在篮球场里寻找一个乒乓球,没有任何条件限制时,只能一寸一寸地排除,但如果你了解某些线索,比如篮球馆经常把乒乓球台摆在什么地方、人们打乒乓球时的移动范围、球掉在地上滚动的距离等,找到的可能性就会大一些。 数据可以帮你更快找到想要的东西和答案,没有数据或任何信息,你虽然知道乒乓球就在这个篮球馆里,却只能慢慢去找。问题是,这个时间成本太大,或者空间大到不允许你一寸一寸地去找。所以,必须有一些限制性条件,来减小搜索空间。

AlphaGo吸引到如此多眼球,但它是否称得上重大的技术突破?

在其专业领域绝对是很不错的技术突破,但个人不觉得它可以代表广义上人工智能技术突破,用人工智能下围棋,它绝对是目前的最高境界了,以前从未达到过这种程度,但它能被用在其他地方产生同样的效果吗?可能有些领域可以,但不能简单得出结论它代表着整个技术的突破。

我们常常用“计算能力”、“存储能力”等来衡量计算机技术的进展。那么,是否存在某些具体指标,可以帮助人们衡量人工智能技术的成熟度?

不能说有非常确定的技术指标,不同领域会有不同突破。到了一定时点,人工智能在各种能力上都将超越人类。方便直观理解,你可以说某个算法成熟的标志是其在特定功能上超过人类。比如说人类在做大量检索方面,图书馆这种技术在很早之前就落伍了,一个简单的数据库就可以代替,互联网出现之后,数据库也不够用了,要设计新的算法来帮助进行搜索,但在这方面,人类能力早已没有任何招架之力。再比如,银行有大量数据,依靠人工监测和发现信用卡盗刷的情况简直太难了,只能设计一种算法来跟踪数据的变化,找出一些很弱的模式,发现数据反常的情况。在这样的领域,机器的能力早已经远远超过了人类。在另外一些领域,比如图片识别、自动驾驶,机器的能力虽然还没有达到人类的水准,但在稳步发展中,也许会在很多方面不断超越人类。

 我们真正应该担忧的是什么?

人们常常用 “弱人工智能”、“强人工智能”和“超人工智能”对人工智能的发展阶段进行区分,这样的处理有专业依据吗?

这种界定大多是科普类作品的做法,目的是为了方便大众理解。但这并不是严格的科学研究分类,没有哪个学术会议会说我专门探讨强人工智能,或专门研究弱人工智能。

 所以我们可能正处于人工智能历史上一波新热潮,在你看来,这种热度会一直持续么?还是很快又会迎来下一个低潮期?

低潮是必然的,现在很热,但会慢慢冷下去,这是历史发展规律,没有一件事情会持续热下去,而是呈现一种波动式发展。但把视角拉得更长远来看,这个学科在过去很长一段时间都是在很稳定地增长,包括人才的培养、人们的关注程度、在社会里面发挥的效应。

对“奇点”理论——笼统来讲,即人工智能将在几十年内发生爆炸式发展,并最终越过技术临界点,全面超越人类智慧——你怎么看?

我不想对此做出评价。但在专业领域之内,要评价人工智能首先要是一个人工智能专家,如何断定一个人是否是专家,只需看他有没有发表过关于人工智能的论文,在这个领域是否有建树,工作是否被同行所认可。不是出了一本书、提出一个假说,吸引了大量眼球,你就是这个领域的科学家或专家了。你抛出一种观点,社会上自然会有人赞同有人不赞同,但这只是一种社会现象。

公众当中,对人工智能的恐慌情绪确实是存在的。

但恐慌在人工智能专业研究人士中并不普遍。恐慌来源于未知,或者说越无知越恐慌。比较极端的例子,人们都觉得艾滋病很恐怖,但医生并不担心和艾滋病患者有身体接触,因为他们了解这种疾病,知道后果最严重会到什么程度。因为不知道会发生什么,脑子里充满幻想,才会产生恐惧感。

人们担心机器具备自由意志,但没有任何研究证据表明这个事情很快就会实现。不要说机器的自我意识,人类的自我意识到现在还尚未真正研究明白。真正从事人工智能的人很清楚事情为什么是今天这个样子,是否存在不可控的成分,到了什么程度。真实的情况远不是人们想象的那样。

任何技术都有其两面性,人工智能技术真正需要担忧的地方是什么?

人类怎么使用它,这才是问题的核心,是真正应该担忧的。一个机器人,你可以输入一个命令,让它救人,也可以让它杀人。它会严格按照你的指令去做,不管目的和后果如何。这跟人类发明的所有武器包括原子弹没有区别,人工智能技术只不过是让武器自动化程度更高一些而已。所以,关键是谁来使用,怎么使用。

和原子弹核武器这种大型工程相比,人工智能技术人人都可以开发,所有公司都能使用。要对其使用进行管理似乎也不容易,围绕无人驾驶汽车的争论就可见一斑。

新兴事物和技术确实会对行业行为和社会立法带来挑战,但绝不应该对技术本身进行约束。就像当年人们担心有人利用网络爬虫盗取私人数据,但这到底是爬虫技术本身的问题,还是人的问题?你会判爬虫技术去做牢么?显然不是技术的问题,而是使用技术的人违法了。所以,对风险的规避,首先是对人的行为的限制,而不是对技术发展进行限制。随着技术的发展导致人类行为发生改变,自然会有新的立法和规则出来。

人工智能:实现能力与伪需求

你刚才提到,发达国家人工智能的科研与产业互动非常紧密,那么中国的情况如何?人才的分布和教育大致处于什么样的状态?

和国外的情况类似,国内做AI的人主要集中在两大领域,一个是比较好的高校和科研院所。但更重要的是科技企业,个人觉得微软当年在中国设立研究院,起了很大的推动作用,带回了很多国外人才,同时也培养了一批本土人才。随着中国互联网行业的发展,出现了百度、阿里巴巴和腾讯这样吞吐量很大的企业,很多年轻人进入这样的公司工作,直接或间接受到了人工智能技术的影响,接受了大量相关理念,这批人对社会产生了很大影响。

后者有点像硅谷模式。包括斯坦福、伯克利大学很多优秀的毕业生,直接被大公司接收,拿着非常高的薪水,所以就有更多的人愿意去学习这个技术。以前在伯克利上课,很多学生虽然本身不是人工智能专业,但也愿意学这方面的知识,不管是因为它新鲜、时尚,还是为了改变自己的工作方式,个人感觉,大学中对此感兴趣的人比以往多了很多。

在舆论和资本的推动下,出现了很多人工智能方面的创业公司,你觉得5-10年之内,这个市场对初创企业的机会大吗?还是主要会由谷歌、百度这样的大企业为主导?

别忘了,谷歌曾经也是个小公司。大企业拥有充足资源,做起事来更容易这是肯定的。但小公司也有空间,做好了就会变成大公司。大公司在与小公司竞争的过程中,有可能失败而消亡。这没法给出定论。

很多企业利用这次热潮努力传播人工智能概念,这在一定程度上促进了技术的研究和应用。但不管大小企业,在经营过程中都要注意两个问题,一是超越当前的技术实现能力去追求一些不切实际的产品设计;另一个是对市场需求出现误判,即伪需求,觉得消费者会需要某种产品,但其实人们并不需要。

短期来看,人工智能到底会给普通人的生活带来哪些深层次的改变?

就我能想象的而言,人工智能可能首先会替代人类从事一些简单的判断性工作,这方面还有比较大的空间。利用大量数据和跨平台的融合,优化决策。比如在医疗上,对癌症的病理进行图像诊断,一个医生一生看过的病例是有限的,尤其是年轻医生,那么当他/她没见过的病例出现时,该怎么判断,怎么治疗?这时就可以利用信息技术,把一个国家甚至世界范围内所有类似癌症病例集合起来做一个数据库,让机器对癌症病例进行自动识别,并于数据库中的历史病例进行特征匹配,从而辅助医生对癌症的性质和所处阶段等进行判断。



标签