人工智能已到瓶颈! AI未来发展方向_lynn0085的博客-程序员宝宝

技术标签: 爱智  资讯  

AI泰斗张钹:AI最重要的能力是知识,而不是数据

阿尔法狗打败围棋高手、索菲亚任你问答、无人车陆续量产,人工智能正日益为人类社会带来不可思议的改变。人工智能一方面在不断挑战人类的想象力,一方面又显得十分智障,人工智能呈现出两种不同的面貌。

日前,中国科学院院士、清华大学人工智能研究院院长张钹发表了题为《人工智能产业化面临的挑战》的演讲,用AI的经典案例,阐述了人工智能的“特点”与“雷区”。

医疗场景的例子而言,

AI可进行肿瘤检测,但医院目前无法大规模应用这项技术。首先由于深度学习具有不可解释性,即AI不能像医生一样对病因进行有效解释,其更倾向于做出直接的的判断;其次因为AI其鲁棒性不够强,稍许噪声都会对机器产生很大干扰,其差别甚至会大到使机器将“雪山”识别成“狗”。

因而,AI在医疗中需要解决三个问题,包括AI系统的可解释性和鲁棒性;个人数据的隐私和保护;规章与制度改革问题。尤其要解决解释性的问题,就需要AI学习医生的知识,用医生的知识去对病情进行解释,不然AI无法解释,也无法与医生进行交互。

因而,实际上说,对人工智能来说最重要的能力是知识,而不是数据。机器应用数据的能力强于人类、人类应用知识的能力强于机器,如果不能两者结合起来,人工智能就无法很好与产业进行结合。

而在更广的领域,人工智能要应用到具体场景,必须要满足下面的5个限制:
有丰富的数据或者丰富的知识、完全信息、确定性信息、静态与结构性环境、单任务与有限领域。AI要实现,这五个条件缺一不可。

AlphaGo:深度学习的大师,但桥牌不敌人类

如AlphaGo打败李世石,成为AI发展史上的一个里程碑,AlphaGo抛弃了传统下棋程序的编程方法,创造性的利用机器学习来获取下棋的经验与直觉。其不仅学习了以往围棋大师们已下过的所有棋局——约几千万棋局,还通过强化学习(自己与自己对弈),学习了上亿个新棋局。
这就意味着,AlphaGo下过的棋是任何一位围棋大师一生下过棋的几百上千倍。由于围棋棋局空间很大(约2x10170),在围棋几千年的历史中人类只是探索了其中的一部分,AlphaGo利用计算机的超强计算能力,不仅把人类已经探索过的空间加以优化,还探索了新的空间(即新的棋局)。正由于此,人类棋手在AlphaGo面前才显得十分被动。

但张钹院士认为,研究AlphaGo不过是为了研究人工智能解决这类问题的方法以及可能达到的水平,其为完全信息博弈,信息完全和确定,遵循着完全确定的游戏规则演化,拥有静态与结构性环境。而计算机打麻将就难以超越人类,因为牌类是不完全信息博弈,因而人工智能学习比棋类困难。

Watson:有限问答,对话系统推理能力差

但Watson的智能仅体现在初步的智能推理上,开放领域的人机对话难以实现,如面向开放领域人机对话的索菲亚机器人就体现了这一缺陷。
此前曾有一个中国记者给索菲亚提出了4个问题,其只答对了一个。询问「你几岁了」,索菲亚的回答是「你好,你看起来不错」;「你能回答多少问题呢」,其回答是「请继续,没听懂」;询问「你希望我问你什么问题呢」,索菲亚回答「你经常在北京做户外活动吗」……

如上,目前开放领域的问答只能进行少量的智能推理,Watson已经算其中的佼佼者。而索菲亚,只能做娱乐和研究,不能进行产业应用,不然“离骗子也不会太远”。

自动驾驶:不适应不确定性环境,犯错就是必然性错误

而对于目前较为乐观的自动驾驶领域,可以通过数据驱动的方法,学习不同场景下的图象分割,并判别是车辆还是行人、道路等,然后建立三维模型,在三维模型上规划行驶路径,应用硬件可以做到实时。
但目前自动驾驶依然不能解决所有问题,如果路况比较简单,行人、车辆很少,勉强可以使用,复杂的路况就难以实现。

其主要原因在于,行人或司机都会有意无意破坏交通规则,使得数据驱动方法失效,各种各样的行为是难以用数据训练就能学习的。如果行人违反规则,计算机不能正确反应,就会造成不可避免的危险。而驾驶员的经验和知识,此时就变得尤为重要。
从犯错误的概率来说,人类也优于人工智能:人类犯错误是偶然的;而机器一旦犯错误,就是系统性错误,必然错误。


AlphaGo、Watson、自动驾驶…… 这些人工智能领域的典型代表和场景,也都存在着局限。因而,目前人工智能只能在丰富的数据或者丰富的知识、完全信息、确定性信息、静态与结构性环境、单任务与有限领域下才能更好发挥能力。

但在不满足条件的情况下,人工智能产业化会很难走,这些就是创业的雷区。避开这些雷区,才能更少的造出“人工智障”。

人工智能已到瓶颈!院士“联名”反深度学习,并指出AI未来发展方向

机器学习的弊病

当下,最常被提起的名词就是机器学习、深度学习和神经网络,用数学上集合里的概念去理解这三者之间的联系,他们之间依次是包含的关系,即机器学习包含深度学习,深度学习包含神经网络。其中,四层以上的神经网络就可以称之为深度学习,而深度学习是一种典型的机器学习。

上世纪五十年代,神经网络这一算法结构出现,当时,它的正式名称应叫做感知机,但已经包含了输入层、隐含层和输出层这一经典的通用结构,并且随着隐含层层数的加深,对事情的描述就愈加精准。

但是,神经网络是一种以输入为导向的算法,所以优质的结果一定取决于接近“无穷”量级的数据。因而,在2000年互联网革命没有爆发之前,它一直都处在无人问津的阶段。
“老百姓概念里的‘大数据’和我们所认为的大数据是完全不一样的,就拿图像处理来说,数十亿的数据量看似量级很高,但对我们来说,它其实是‘小样本’。因为真正能够训练出好的模型的数据量,应当是趋于无穷的,所以即便是拥有了大量数据去训练模型,和理想的智能模型之间,也有着本质的差别。”从算法性质出发,加州大学伯克利分校电子工程与计算机系教授马毅也点出了当下这项火热技术的局限性。

新方向探索

数据处理方法、基本思想和技术思路

1. 数据处理层面,语义向量空间或进一步拓宽入口。

看见了技术的“天花板”,很多专家学者开始提出“小数据”的概念,然而清华大学人工智能学院院长张钹院士却不认为数据量的大小是当下的根本问题所在,他指出,传统的人工智能三要素将不能带来真正的智能。

“评价人工智能获得的成果,我们可以从这五件事来看:深蓝打败人类国际象棋冠军;IBM在电视知识竞赛中打败了美国的前两个冠军;2015年微软在ImageNet上做图象识别,误识率略低于人类;百度、讯飞也都宣布在单句的中文语音识别上识别准确度略低于人类和AlphaGo打败了李世石。前两件事归为一类,后三件事可归为另一类。

大家一致认为,这五件事得以发生的三要素是:大数据、算力的提升和非常好的人工智能算法。但我认为大家忽略了一项因素,就是这所有的成果必须建立
在一个合适的场景下。”

换言之,当下人工智能的发展避不开种种限制条件,因而智能的机器也只能够照章办事,没有任何灵活性,也达不到人们想要的智能,而这也就是当下AI的发展状态。

那解决办法是什么呢?通过循序渐进,张院士在演讲中给出了思路,并指明语义向量空间这一技术方向。

“首先,需要明确的是,现有的机器缺乏推理能力的原因在于它没有常识。”

张钹院士通过实验验证,常识的建立确实会极大程度的提升机器的性能。而为机器建立常识库也成为人工智能企业进一步提升系统性能的第一步。“美国在1984年就搞了这样一个常识库的工程,做到现在还没完全做出来。可见,要走向真正的人工智能,有理解的人工智能,是一条很漫长的路。”

但即使在建立常识库的基础上,做到有理解能力的人工智能依然不容易。想要提升智能的第二步,在张院士看来,就是将感性和知识的世界统一起来,而这将为人工智能的发展带来一次质的飞跃。

“深度学习之所以能够极大的促进人工智能的发展,技术上的关键在于人们能够将获取的标量数据转变为向量,从而用到机器上。但至今为止,将行为(特征向量)和数据(符号向量)结合起来使用始终是科研的难点,而这就限制了机器变得更‘智能’。”

不仅如此,从安全层面来看,纯数据驱动的系统也存在很大问题——鲁棒性很差,易受到很大的干扰。因而,在大量样本的训练下,系统仍会犯重大的错误。如商汤、旷视等头部企业也表示,即便训练出的系统模型准确率高达99%,但在实际应用中,系统仍然会犯很多“弱智”的错误。

“我们现在想出的解决办法是这样的,就是把这特征向量空间和符号向量投射到一个空间去,这个空间我们把它叫做语义向量空间。”

怎么做?张院士表示:

第一,要通过Embedding(嵌入)把符号变成向量,尽量保持语义不丢失;
第二就是Raising(提升),结合神经学科,把特征空间提升到语义空间。

“只有解决这些问题,我们才能够建立一个统一的理论。因为在过去,对感知和认知的处理方法是不同的,因而两者不在同一维度,无法统一处理。但如果我们能够将感知和认知投射到同一空间,我们就可以建立一个统一的理论框架,并在语义向量空间里解决理解问题。这是我们的目标,但是这项工作是非常艰巨。”

2. 基本思想的颠覆,模糊计算或是未来。

“无论是知识图谱,语义向量空间还是当下的其他深度学习训练,它们都是基于概率统计理论,而模糊逻辑不是,它是以模糊集理论为基础的。”非常大胆的,从思想层面,美国犹他州立大学计算机系终身教授承恒达给出了颠覆性的想法。

其实模糊逻辑并非全新的概念。1931年,Kurt G?del发表论文证明了形式数论(即算术逻辑)系统的“不完全性定理”,模糊逻辑诞生。而在1965年,美国加州大学的L.A.Zadeh博士发表的关于模糊集的论文,标志着人类首次用数学理论成功描述了不确定性。

“现在的计算机领域,不是0就是1,而我们描述的是0到1之间的很多不确定性成分,其实,这一过程描述的是导致结果的原因。以两瓶水为例,一瓶水上标记‘是纯净水的概率是0.91’,而另一瓶水上标记的是‘水的纯净程度是0.91’,你会选择哪一瓶呢?显然,你会选择后者。这里的思考判断过程就是模糊逻辑,因为后者对于程度的描述本质上就是模糊的。”

目前,类似于经典逻辑体系(微积分、线性代数、生物学等衍生学科),模糊逻辑也逐步形成了自己的逻辑体系。

然而再好的技术,都需要结合应用去展现它的优势。在这一方面,承教授也是格外重视,于是他选择了乳腺癌的早期诊断研究领域。“到目前为止,我们的设计样本已经被全世界二十多个国家,五十多个团队用来使用。”

在承教授看来,现有的技术存在着非常明显的不足,需要大家沉下心来去分析问题,从而探索到改进的方法。“现在大家都在模拟脑波中的电信号,但其实大脑里存在的不仅仅是电信号,还有化学反应。而很多人在做的医学图像处理,实际上只是做图像处理,却不是医学图像处理,它们之间是有着非常大的不同。”

3. 技术思路:大繁至简

当下,面对技术的毫无进展,AI公司的焦虑显而易见。不同于上面院士教授们给出的具体技术思路,马毅教授更像是科技界的“鲁迅”,他用PPT中一张张演讲稿中的优质论文做例,只为重新唤醒大家对于AI的思考。

“神经网络,导入的数据有一个很小的改动,分类就会有很大的变化,这不是什么新发现,2010年,大家就遇到这样的问题,但至今没有解决。”演讲一开始,马毅就拎出了“老生常谈”,毫不留情的将一盆冷水浇到了众多对AI盲目乐观的人身上。

对技术的不正确认知,马毅也在极力得纠正。
“在人脸识别领域,要让算法具有鲁棒性,比写个AlphaGo要困难千倍。”
“都说神经网络越大越好,这简直是胡说八道。”
嬉笑怒骂间,从事研究数年,马毅给出了自己的思考方向:“真正的优质算法一定是最简单的,比如迭代、递归,还有经典的ADMM,这些简单的算法就很好,也很有用。”

结束语
接下来,人工智能技术的发展并不会乐观,尤其是产业发展将进入一个平缓期,但是这并不意味着学术界和产业界将无事可做。
正如张钹院士指出的,“我们正在通往真正AI的路上,现在走得并不远,在出发点附近。但人工智能永远在路上,大家要有思想准备,而这也就是人工智能的魅力。”

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/lynn0085/article/details/87940278

智能推荐

数据结构与算法——25. 树的遍历_花_城的博客-程序员宝宝

文章目录树的遍历(Tree Traversals)python代码实现后序遍历:表达式求值中序遍历:生成全括号中缀表达式树的遍历(Tree Traversals)对一个数据集中的所有数据项进行访问的操作称为“遍历Traversal”。线性数据结构中,对其所有数据项的访问比较简单直接,按照顺序依次进行即可。树的非线性特点,使得遍历操作较为复杂。我们按照对节点访问次序的不同来区分3种遍历:前序遍历(preorder):先访问根节点,再递归地前序访问左子树、最后前序访问右子树;上图二叉树的前序遍历

HTML中DTD使用小结_zhangq0123的博客-程序员宝宝_html 中的dtd

DTD 是一套关于标记符的语法规则。它是XML1.0版规格得一部分,是html文件的验证机制,属于html文件组成的一部分。 DTD:三种文档类型:S(Strict)、T(Transitional)、F(Frameset)。 Strict:如果您需要干净的标记,免于表现层的混乱,请使用此类型。请与层叠样式表(CSS)配合使用 Transitional:DTD 可包含 W3C 所期望

matlab仿真光学拍,MATLAB光学干涉实验的仿真研究_周咕嘟的博客-程序员宝宝

摘要本文以光学干涉实验的理论为基础,采用MATLAB软件进行计算机仿真,详尽地模拟了两列单色平面波、两列单色平面波的合成、杨氏双缝干涉等光学实验并且针对仿真结果进行了具体的剖析。该论文有图11幅,参考文献14篇。50833毕业论文关键词:光学 杨氏干涉 迈克尔逊干涉Simulation Study of Optical Interference ExperimentAbstractIn the...

zookeeper 笔记 (二)_dervish0927的博客-程序员宝宝

一.    ZK Shell的使用1.    概述    Zookeeper提供类似shell环境,方便用户访问、操作数据,使用 bin目录下的 zkCli.sh命令,可以进入shell环境,同时可以查看到Zookeeper环境配置。2.    常用命令zkCli.sh [-server ip:port]./zkCli.sh -timeout 0 -r -server ip:port./zkCli...

简单了解一下ArcPy_puran1218的博客-程序员宝宝_arcpy

学GIS的同学应该对ArcGIS非常熟悉,但是对ArcPy就不一定了,像我就一直对ArcPy是迟迟不敢去触碰的。不过,我现在开始去挑战了,跟我一起来探索吧。_1671465600

kettle连接Oracle之SERVICE_NAME和SID_wuzhangweiss的博客-程序员宝宝_sid kettle

今天用kettle抽取远程数据库的过程中发现了一个问题,我根据对方给的ip、server_name、用户名、密码;由于之前用kettle连接远程库时都是如下图所示 但是当我输入ip和数据库名称等信息后发现连接不成功。 改为如下后可以连接 这是我用oracle客户端连接远程库时,发现连接远程库用的是SERVICE_NAME 而其它库用的是SID 所以导致用kettle连接时...

随便推点

设计模式--------装饰者模式_daguniang123的博客-程序员宝宝

介绍装饰者的四大问题现在的写法有什么问题吗?为什么要用装饰者模式?什么是装饰者模式?装饰者模式有什么好处?采用一个案例来说明问题现在要设计一个买奶茶系统,奶茶可分为绿茶,红茶,可以加入配料椰果,红豆等,设计这样一个系统。目前设计思路方式一寻找奶茶的共通之处,创建一个抽象茶类cost() :计算金额getDescription() : 获取奶茶名称description: 奶茶名称属性然后针对不同的搭配创建各自的奶茶类绿茶红茶椰果绿茶椰果红茶.

PTA习题8-10 输出学生成绩_忑忠忐的博客-程序员宝宝_输出学生成绩pta

习题8-10 输出学生成绩(20 分)本题要求编写程序,根据输入学生的成绩,统计并输出学生的平均成绩、最高成绩和最低成绩。建议使用动态内存分配来实现。输入格式:输入第一行首先给出一个正整数N,表示学生的个数。接下来一行给出N个学生的成绩,数字间以空格分隔。输出格式:按照以下格式输出:average = 平均成绩max = 最高成绩min = 最低成绩结果均保留两位小数。输入样例...

第一天计算机谁发明的,世界公认三大天才,尼古拉特斯拉是当之无愧的第一天才..._诗语情柔的博客-程序员宝宝

在历史的长河中,出现过许许多多惊才绝艳的人,他们都有着不同寻常的经历和成就。尼古拉特斯拉、达芬奇、爱因斯坦这个位是世界公认三大天才,他们都有着超越寻常人的成就。他们的智商根本就不是普通人能比得上的,下面为大家简单介绍一下他们的成就。一、尼古拉特斯拉尼古拉特斯拉作为一个高智商的科学家,他一生有过许许多多的发明。特别是他主持设计了现代交流电系统,为电力的发展做出了巨大的贡献,他在电磁场领域有着多项革命...

排座椅_NWPU-SOC的博客-程序员宝宝

题目: 排座椅上课的时候总有一些同学和前后左右的人交头接耳,这是令小学班主任十分头疼的一件事情。不过,班主任小雪发现了一些有趣的现象,当同学们的座次确定下来之后,只有有限的 DD 对同学上课时会交头接耳。同学们在教室中坐成了 M 行 N 列,坐在第 ii 行第 j列的同学的位置是(i,j),为了方便同学们进出,在教室中设置了K条横向的通道,LL 条纵向的通道。于是,聪明的小雪想到了一个办法,或许可以减少上课时学生交头接耳的问题:她打算重新摆放桌椅,改变同学们桌椅间通道的位置,因为如果一条通道隔开了两个会交

推荐文章

热门文章

相关标签