En

如何避免又一个AI寒冬?

2020-02-18

尽管过去几年中,人工智能取得了长足的进步,但相信很多人都还记得20世纪90年代,由于开发者过分夸大承诺以及最终用户不切合实际的期望所导致的AI寒冬。现在有行业内部人士(例如Facebook的AI负责人Jerome Pesenti)预测,AI很快又会陷入困境,这次的原因是缺乏语义理解。

如何避免又一个AI寒冬?

Pesenti说:“深度学习和当前的AI技术有很多局限性。我们离实现人类智能还非常非常远,并且有一些批评实际上是有道理的:AI可能会传递人类的偏见,不容易解释,不具备常识,更多的是模式匹配,而不具有鲁棒性的语义理解。

还有一些计算机科学家认为,人工智能正面临“可再现性的危机”,因为很多复杂的机器学习算法都是“黑匣子”,无法轻易复制。McGill计算机科学教授Joelle Pineau指出,复制和解释AI模型的工作原理可以提供AI透明性,有助于未来的技术创新和研究工作,当算法取代人工决策来决定谁被判入狱、谁被批准抵押,这一点就变得至关重要。

下面就让我们看一下如何避免另一个“AI寒冬”的出现。

从符号主义AI开始

无法解释和重现AI模型是我们需要克服的一大障碍,我们需要让AI既可信赖又实用。要解决这个问题,我们可以退后一步,考虑利用符号主义AI,然后采取两个措施,将符号主义AI(经典知识表示、基于规则的系统、推理、图形搜索)与机器学习结合起来。

符号主义AI通过使用本体和分类法为数据添加了含义或者语义。基于规则的系统是符号主义AI的一项主要技术。这些系统非常依赖于这些本体和分类法,因为这些方法有助于制定正确的、有意义的if/then规则。使用规则和基于规则的系统,好处在于提供了一致且可重复的结果,有助于获得可解释的结果。

消除数据孤岛

为了让AI满足当前的期望,我们还需要消除跨IT系统查询的孤岛,发布更精细的聚合查询,自动执行模式和数据验证措施,以获取准确的分析结果。

为机器学习模型聚合各种不同的训练数据集,要求能够跨数据库进行查询,或者迅速为此整合各种不同的来源。语义图数据库通过基于标准的方法支持统计AI的这一先决条件,在这个方法中,图形的每个节点和边缘都具有唯一的、机器可读的全局标识符。

因此,企业组织可以将不同的数据库连接在一起,以便在这些数据库之间进行查询,同时合并各种常见用例的来源,例如预测个人的下一个健康问题或者及时的供应链管理。

这种联合查询可以确保数据始终保持相关性,并且对任何新兴技术都具有前瞻性。在这个需要AI和分析进行实时决策的时代,企业组织根本没有时间在孤岛数据库之间重建架构和术语。

自动验证数据

模式概念与数据验证本质上是相关,这对于信任查询结果从而进行分析来说是至关重要的。语义知识图通过自然发展的数据模型、自描述模式和按需模式选项(例如JSON、JSON-LD和SHACL)实现所有模式的标准化。

SHACL之类的框架对于验证数据来说是至关重要,这是通过确保数据形状一致来自动验证的。现实情况是,如果没有明确的机制,就几乎不可能在不编写过程代码的情况下针对数据质量这一基本方面来验证数据,这个过程可能是非常费时(取决于任务规模)。

人工智能时代,自动化已经迫在眉睫。手动生成用于数据验证措施的脚本是非常浪费时间的,而这个过程就像认知计算本身一样是可以自动化和可以重复的。

词汇标准化有助于聚合查询

操作型AI要求的查询精细度是极高;但是,知识图形中的词汇表和分类法标准化支持顺序查询聚合,这些聚合很难在其他设置中复制。一旦企业组织对不同概念的词汇及其含义实施了标准化,那么不仅可以创建各种分类法,还可以通过链接进行查询。

例如在医疗领域,你可以查询所有患有某种疾病的患者,该疾病的特定治疗方法,在接下来的三个月内要进行移植,以及为患者开具的特殊药物。通过查询不同分类法将各种查询聚合为单个查询以获得特定结果,这一能力一定程度上有助于这种复杂的、临时的查询操作。

在不久的将来,跨数据库的查询、自动验证数据、汇总查询会变得越来越常见。人工智能将成为企业必不可少的一大要素,那些采用语义知识图谱方法的企业一定会脱颖而出。