导读 想吃一口新鲜烤球场的弗兰克? 两个叫雅科和巴克斯特的机器人可以服务一个。 波士顿大学的工程师们已经开始使用机器学习来教机器人执行复杂的任务,这一框架可以应用于许多任务,比
想吃一口新鲜烤球场的弗兰克? 两个叫雅科和巴克斯特的机器人可以服务一个。 波士顿大学的工程师们已经开始使用机器学习来教机器人执行复杂的任务,这一框架可以应用于许多任务,比如识别X线照片上的癌斑或更好地理解播放音乐的口头命令。 但首先,作为概念的证明-他们已经学会了如何准备完美的热狗。
研究人员仍然不完全理解机器学习算法-好吧,学习。 这种盲点使得这种技术很难应用于复杂的高风险任务,如自主驾驶,安全是一个关注的问题。 在科学机器人杂志上发表的一个进步中,BU工程学院教授卡琳·贝尔塔和他的实验室的研究人员教了两个机器人一起做饭、组装和服务热狗。 他们的方法结合了机器学习和正式方法的技术,这是计算机科学的一个领域,通常用于保证安全,最显著的是用于航空电子或网络安全软件。 这些不同的技术很难在数学上结合起来,也很难组合成机器人能够理解的语言。
贝塔是机械、系统、电气和计算工程的教授,他的团队雇用了一个称为强化学习的机器学习分支。 当一台计算机正确完成一项任务时,它会得到一个指导其学习过程的奖励。 虽然任务的步骤是在“先验知识”算法中概述的,但如何准确地执行这些步骤并不是。 当机器人更擅长执行一个步骤时,它的奖励就会增加,创造一种反馈机制,推动机器人学习最好的方法,例如,把热狗放在面包上。
将先验知识与强化学习和形式方法相结合是这种技术新颖的原因。 通过将这三种技术结合起来,该团队可以减少机器人必须经历的可能性,以学习如何烹饪、组装和安全地服务热狗。 贝塔认为这项工作是对他们的总体框架的概念证明,他希望它能够应用于其他复杂的任务,如自主驾驶。