张钹院士专访:人工智能永远在路上(6)
扫一扫
分享文章到微信
扫一扫
关注99科技网微信公众号
他们做了一个图像,原来是熊猫的图像,机器的识别率很高,但是如果在熊猫的图像上加上一点点噪声,人类可以识别它是熊猫,可机器却会99.9%的认为它是长臂猿。
机器跟人类的视觉是完全不同的,在一定条件下,它的识别率甚至能超过人类,但它跟人类视觉的性能差得太远了。 拿上面的例子来说,只有将图片上的熊猫改变成语言概念上的其他物种人类才会识别出错,但对于机器来说,即使给图片上加上一点点噪声,语义上没有任何改变,机器仍然会将图片识别成完全不同的东西。
这就说明机器的根本不能理解图像的语义的,而只是处理实际上的形式。不仅仅图像是这样,语音、文本也是这样,尤其是文本,只要加上一点点变化,文章的意思就完全不同。
之所以会有这样的现象,就是因为纯粹数据驱动的方法会必然带来这样的问题。与人类从大的轮廓来识别图像不同,人工神经网络、深度学习只能提取局部的纹理色彩特征,所以只要改变局部的特征,就会出现识别错误。如果用技术的术语来讲的话,数据驱动最大的问题就在于单纯的数据驱动只是在低层次的特征空间层面来识别物体,而不是在高层的语义空间中进行识别。
因此,我们提出了“第三代人工智能”的概念,就是把数据驱动和知识驱动结合起来。
数据驱动为什么会有那么多的缺点?是因为在人工智能领域,只用了数据驱动的三个要素:数据、算力和算法。同样的,知识驱动也有不少的缺点,我们也只用了其中另外的三个要素:
知识、算法和算力 。
为了克服这两个算法存在的缺点,应该将四个要素结合起来,而且四个要素之间,我认为应该遵循以下的顺序:第一应该是知识,我认为知识才是人类智慧的源泉;第二是数据,因为机器处理数据能力远比人类强,利用这个要素,机器就有可能做出超越人类(能力)的事情;第三是算法;第四是算力。我们现在也是沿着这个方向去发展第三代人工智能。
99科技网:http://www.99it.com.cn