美陆军研发出实时对话交互人工智能技术
陆军战斗能力发展司令部(DEVCOM)、陆军研究实验室和南加州大学创新科技研究所研究出了一种实时对话交互人工智能技术,可使自主系统灵活地解读和响应士兵的意图。
这种技术目前是“联合理解和对话(JUDI)系统”(一种能实现士兵和自主系统双向交谈互动的原型系统)对话处理的主要组成部分。陆军研究员杰维特斯说:“我们采用统计分类法,结合先进的自然语言理解和对话管理技术,实现了与人工智能的对话。统计语言分类器能使自主系统识别沟通目标来了解士兵的意图,并采取行动来实现其意图。”
举例来说,如果一个机器人收到了“旋转45度并发送图片”的指令,那么它就会解读这个指示,并执行任务。为实现这个目标,研究人员给分类器进行了训练,使其能在执行协作搜救任务期间,了解生成的人机对话标签数据集。分类器要学会将语音指令与自己的响应和动作对应起来,这样就可将此知识运用到新指令上,并正确地做出响应。研究人员开发了各种算法,以便将分类器加入到对话管理系统中(这个对话管理系统包括在信息不完整时如何寻求帮助的方法)。
在对陆军的影响方面,研究人员指出,这项技术可以应用到战车和自主系统上,使它们的人机组队具备实时对话的能力。杰维特斯说:“通过在这些复杂的自主系统中创建一个自然语音接口,研究人员就能实现机器的免提操作,从而提升士兵的态势感知,让他们掌握决策先机。”
杰维特斯认为,这项研究非常有意义,也非常独特,能实现士兵和自主系统的双向对话。“这样的对话方式,基本不需要对士兵进行培训,因为说话本就是人类的自然天性,不需要特意改变他们的说话行为。这项技术的一个关键优点是,它很擅长处理嘈杂的语音,包括停顿、不流利等人类正常对话中经常会出现的问题。
他还提到,由于分类器是提前进行训练的,所以系统在进行实时操作时不存在对话处理延迟。这能增强人机对话的流畅度和灵活度,提升人机组队的效能。与需要海量、密集数据集来对系统进行训练的商业深度学习方法相比,这种方法所需的训练示例要少几个数量级。它还有一个优势是能减少在新环境中所需的部署时间,还能进行冷起动。另一个区别是,商业对话系统一般进行的是非军事领域的训练,而这种技术关注的是未来战术环境中在执行搜救任务时的人机互动。最后,分类法能让系统的表现更透明,更具可解释性,这样就能分析系统做出特定反应的原因。
这项研究接下来将有三个努力方向:给分类器增加语言表示法,提高系统性能;对这种方法进行扩展,使它能通过实时对话学习新的训练示例;除语音外,还要给系统加入新的互动方式,例如眼神和手势,使它们在物理环境中进行更好的交互。