核心技术驱动下的巨大进步

人工智能有自身的技术底蕴。有三项基本技术被称为人工智能“火箭”的三个要素,正是因为近年来它们的飞速发展推动了人工智能的快速进步。它们是:以深度学习为代表的机器学习技术,大数据技术,基于云计算的计算集群。

云知声AI技术专家刘升平认为,现在的人工智能大多还只是一种弱的智能,只能处理一些特定场景和任务,但还不是一种通用智能,还无法对任何场景做出正确分析和反应。“Alpha Go”或“Master”也能下围棋,而不会下象棋或搬砖,所以人工智能尚处在一个“专有智能”阶段。

近年来,人工智能的基础技术,尤其在感知和认知这两个方面取得重大进展。所以它的火,绝不是虚火,而是建立在实实在在的技术进步基础上的。

感知智能方面,在语音识别领域,深度学习的引入使语音识别的准确率大幅提高。自2010年微软首次把深度学习技术应用于语音识别中去后,语音识别的准确率由70%提升至目前的96%。语音识别目前已经成为工业领域最成熟的感知智能技术。

图像处理领域的技术进步与之类似。自2012年深度学习引入到图像处理领域后,识别正确率由70%多提高到97%。这个纪录在2016年由位于上海的公安部第三研究所创造,它已经超过了人类的识别能力。现在的技术已发展到给系统提供一张图像,它还可以自动生成一段图像的描述:如某个(些)具有什么特征的事物在另一个(些)具有什么特征的事物的哪个位置(如前后左右上中下)。理论上来说,如果这种技术被引到医学影像处理方面,则可以生成一个医学上的阅片报告。

人工智能的语言翻译上也取得了进展。谷歌的翻译识别系统已经可以接近人类的水平了。自然语言没有语音或图像识别那样简单,它综合反映着人类智能的水平。但是相对而言,这种技术还不成熟,体现在:(1)语言理解方面,只能支持对垂直领域的内容,而做不到对开放领域的任意交流;(2)在语言生成方面,可以写诗作对,甚至写高考作文、新闻报告,但是写出来的东西是机械死板的,且仅针特特定的垂直领域,创造性方面远不能与人类相比。

在知识学习上,知识图谱技术得到了应用。它的思想与大数据相类似,可以称为“大知识”。即把知识放在网络层面,互相联接起来,可以对机器提问,而它可以给出准确答案。目前这项技术也被引入到医疗领域,像中医科学院开展了中医药领域本体研究,取得了很好的进展。可以预见,一旦这种技术把全世界的知识联结起来,将会产生怎么的威力!

判断决策方面,从1997年的“深蓝”到2011年的IBM WATSON,以至最新的“Alpha Go”,这三个人工智能项目虽然都有战胜人类的经历,但是它们的技术展很快。运算能力完全是不同量级的,“深蓝”只有1台大型机服务器,IBM WATSON则有90台服务器,而“Alpha Go”有多达近1920个CPU和280个GPU的集群。围棋一直被认为是人工智能领域中最难解决的问题,因为直觉力在其中占有很大比重,导致计算机难以模拟。但是新技术则做到了只要给计算机足够的数据,它可以模拟人的直觉。“Alpha Go”和“Master”已胜战绩证明它已达到何种程度!

不可忽视的局限与短板

虽然人工智能取得很大进展,但是尚存一些问题,如果得不到解决,会影响它进一步的应用。这种制约由计算机的鲁棒性决定。鲁棒性是指控制系统在一定(如结构、大小)的参数摄动下,维持其它某些性能的特性。

1、识别错误

如一张表现小男孩拿着牙刷的图片,人工智能却识别成一个人拿着棒球棒的信息。人工智能的判断依赖所输入的数据和信息,而缺少像人那样的生活经验,是产生这种错误的原因。

2、犯错而不被知道

机器犯错是可怕的,但人不知道它何时犯错是最可怕。所以人工智能的“可信任”是最近研究的主题之一,要让人工智能给出方案的可靠性,而不是自作聪明。

3、不具可解释性

它给出答案却不能解释,这让人难以适从。因为目前大部分的机器学习模型不具有可解释性或者只是大数据意义下的相关性,特别是深度学习,更是一个黑箱模型。,这一点非常重要,尤其对医疗行业来说,这样才能令人信服。

4、对事先不知道的情况反应错误

2016年特斯拉汽车在美国发生的一个事故很能说明这个问题。当前面的一辆白色的超级长的大货车拐弯时,一大片白色导使得令特斯拉雷达致盲,让它做出了错误的判断和决策,最终酿成撞车事故。特斯拉国内也发生了撞上清洁车辆的事故,可能是因为厂商事先没有把中国的各种车辆和路况作为训练语料,它不能无法正确应对。

因此,如果人工智能在可靠性和鲁棒性方面没有完全解决好的话,那么它的应用场景将会受限。

呼之欲出的与医疗深度融合

目前,人工智能已经开始在很多领域攻城略地,医疗领域也自然成为它的进军对象。目前的主要应用有:

(1)语音电子病历,它是语音识别技术的一个实用性发展,可以医生的口述内容迅速转换成文字;

(2)临床大数据分析,应用大数据挖掘与分析技术,挖掘积累的临床数据的价值。

(3)影像辅助诊断,这种基于计算机图像技术,让机器可以阅片;

(4)患者健康助理,这是基于医疗知识的一个应用,为患者提供导诊,预诊,健康咨询和健康教育等内容;

(5)临床辅助诊断,根据患者的情况,给出诊疗建议。

从技术与产品成熟度维度来看,语音病例、临床大数据分析、患者健康助理的应用比较成熟,而影像辅助诊断还需要一个更加成熟的过程,它们的市场接受度都很高。而临床辅助系统,无论是从技术的成熟度,还是从市场接受度上看,都有待于提高。