人工智能技术的突破:通过8年级科学考试

导读 这个名为Aristo的系统表明,在过去的几个月里,研究人员在开发可以理解语言和模仿人类逻辑和决策的人工智能方面取得了重大进展。四年前,超

这个名为Aristo的系统表明,在过去的几个月里,研究人员在开发可以理解语言和模仿人类逻辑和决策的人工智能方面取得了重大进展。

四年前,超过700名计算机科学家参加竞赛,以建立可以通过八年级科学考试的人工智能。该线上有80,000美元的奖金。

他们都不及格了。即使是最复杂的系统也无法在测试中做到超过60%。AI无法与学生进入高中时所期望的语言和逻辑技能相匹配。

但是星期三,西雅图着名实验室艾伦人工智能研究所推出了一个新系统,该系统通过了测试,并且有空余。它正确回答了超过90%的八年级科学考试问题,超过80%的12年级考试。

这个名为Aristo的系统表明,在过去的几个月里,研究人员在开发可以理解语言和模仿人类逻辑和决策的人工智能方面取得了重大进展。

世界顶级研究实验室正在迅速提高机器理解和响应自然语言的能力。机器在分析文档,查找信息,回答问题甚至生成自己的语言方面变得越来越好。

Aristo专为多项选择测试而打造。它为纽约的学生编写了标准考试,尽管艾伦研究所删除了所有包含图片和图表的问题。回答这样的问题需要额外的技能,将语言理解和逻辑与所谓的计算机视觉相结合。

一些测试问题,比如八年级考试中的测试问题,只需要信息检索:

一组协同工作以执行特定功能的组织称为:

(1)器官

(2)有机体

(3)一个系统

(4)一个细胞

艾伦研究所的研究人员开始研究Aristo--他们想在2013年建立一个“数字亚里士多德”,就在西雅图亿万富翁和微软联合创始人保罗·艾伦创立实验室之后。他们认为标准化科学测试是典型人工智能基准的一个更有意义的替代方案,它依赖于国际象棋和步步高等游戏或仅为机器创建的任务。

科学测试不是仅仅通过学习规则就能掌握的东西。它需要使用逻辑建立连接。例如,森林火灾的增加可能会导致松鼠死亡或减少茁壮成长和繁殖所需的食物供应。

对于那些认为机器距离完全掌握自然语言还有很长一段路程的科学家来说,Aristo所取得进步的热情依然缓和 - 甚至更重要的是复制真正的智慧。

“我们无法将这项技术与真正的人类学生及其推理能力进行比较,”微软研究员刘晶晶表示,他一直致力于研究艾伦研究所的许多相同技术。

但是,Aristo的进步可以扩展到一系列产品和服务,从互联网搜索引擎到医院的记录保存系统。

“这会产生重大的商业后果,”负责艾伦研究所的前华盛顿大学教授奥伦·埃齐奥尼说。“我可以说 - 完全有信心 - 你会看到新一代的产品,一些来自创业公司,一些来自大公司。”

新的研究可能会导致系统能够进行体面的对话。但它也可能会鼓励虚假信息的传播。

“我们正处于这个阶段的早期阶段,”负责监督旧金山另一个有影响力的实验室Fast.ai的杰里米·霍华德说。“我们离潜力很远,我不知道它会在哪里结束。”

2016年,当一个伦敦实验室建立了一个可以在古代Go游戏中击败世界上最好玩家的系统时,它被广泛称为人工智能的转折点。

然而,Etzioni的兴奋情绪低沉。他说,人工智能并不像看起来那么先进,他指出早期艾伦研究所的竞争使人工智能系统难以进行八级科学测试。

艾伦研究所对早期工作的改进比许多专家(包括Etzioni)预期的要快得多。

它的工作主要由神经网络,复杂的数学系统驱动,可以通过分析大量数据来学习任务。例如,通过精确定位数千张狗照片中的模式,神经网络可以学会识别狗。

最近几个月,世界领先的人工智能实验室建立了精心设计的神经网络,通过分析人类撰写的文章和书籍,可以学习语言的变幻莫测。

在谷歌,研究人员建立了一个名为Bert的系统,该系统梳理了成千上万的维基百科文章和一个庞大的浪漫小说,科幻小说和其他自我出版书籍的数字图书馆。

通过分析所有文本,伯特学会了如何猜测句子中缺失的单词。通过学习这一技能,伯特吸收了大量有关语言构建基本方式的信息。研究人员可以将这些知识应用于其他任务。

艾伦研究所在Bert技术之上建立了他们的Aristo系统。他们为伯特提供了广泛的问答。随着时间的推移,它学会了自己回答类似的问题。

不久前,实验室的研究人员一次定义了他们的测试系统的一行软件代码行为。有时他们仍然会做那种艰苦的编码。但是现在系统可以自己从数字数据中学习,它可以以更快的速度提高。

像伯特这样被称为“语言模型”的系统现在推动了广泛的研究项目,包括用于识别虚假新闻的会话系统和工具。随着更多数据和更多计算能力,研究人员相信该技术将继续改进。

但Etzioni强调,这些系统的未来很难预测,而且语言只是其中的一部分。

刘和她的微软研究人员一直试图建立一个能够通过研究生入学考试的系统,这是进入研究生院所需的考试。