美军预计到2028年自主军事机器人将与战士协同作战

到2028年自主军事机器人将与战士协同作战

带有导弹的自主军事无人机 pholamai / iStock

近年来,美国军队已经规划和发展多域作战(MDO) 。美陆军预计这将在2028年之前准备好,作为其理论演变的第一步。多域作战描述了美军作为联合部队的一部分,未来将如何在军事上竞争、渗透、瓦解和利用对手。

社会人类的行为非常不稳定,有时甚至是非理性的。在设计自主军事机器人战士时,必须质疑将给人类带来的风险因素。  

自主军事机器人

到2028年自主军事机器人将与战士协同作战

用于军事领域的极限地形,纳米行走机器人技术。资料来源:Devrimb / iStock

多域作战是美国陆军未来的作战理念,要求具有自主学习的的机器人与作战人员协同作战。新陆军的研究减少了当前训练强化学习策略的不可预测性,因此它们更实际地适用于物理系统,尤其是地面机器人。

美国陆军作战能力发展司令部(现称为DEVCOM,陆军研究实验室)的陆军研究员Alec Koppel博士说,这些学习内容将使自主机器人能够推理并适应不断变化的战场条件。

根据S. Koppel的说法,潜在的适应和重新计划机制由基于强化学习策略组成。有效地获取这些策略对于使“多域作战”概念成为现实至关重要。

Koppel说,强化学习中的策略梯度方法是连续空间可伸缩算法的基础,但是现有技术无法纳入更广泛的决策目标,例如风险敏感性,安全约束,探索和与先验分歧。

当动态与目标之间的关系复杂时,设计自主行为可以通过强化学习解决。强化学习最近已经引起人们的关注,用于解决以前难以解决的任务,例如围棋,象棋等战略游戏,以及Atari和Starcraft II等电子游戏。

不过普遍训练需要天文数字的样本复杂性。这种样本的复杂性使得许多常见的训练机制不适用于多域作战上下文要求的下一代战车(NGCV)数据匮乏的设置。

Alec Koppel博士及其研究团队为通用公司开发了新策略搜索方案,并确定了样本复杂度。他们观察到,由此产生的策略搜索方案减少了奖励积累的波动性,对未知领域进行了有效的探索,并建立了一种结合先前经验机制。

Koppel说:“这项研究为加强学习中的经典策略梯度定理做出了贡献。” “它为通用公司提出了新的策略搜索方案,其样本复杂性也已建立。这些创新通过使强化学习目标超出标准的累积回报率,例如风险敏感性,安全约束,探索和改进,对美国陆军产生了影响。” 他说,值得注意的是,在地面机器人的情况下,获取数据的成本很高。 获取更多前沿科技信息访问:https://byteclicks.com

“减少奖励积累的波动性,确保人们以有效的方式探索未知领域,或者吸收先前的经验,都可以通过减轻一个人为减少学习所需的随机抽样数量而打破现有的强化学习中现行的抽样效率障碍。实现策略优化,” Koppel博士说。

Alec Koppel博士致力于使他的发现适用于战场上士兵的创新技术。装备有强化学习功能的自主机器人将能够协助战士在未来战场上进行探索,侦察和风险评估。

这项研究的下一步是将通用工具在强化学习中实现更广泛的决策目标纳入多主体设置,并研究强化学习主体之间的交互设置如何在团队之间产生协同和对抗性推理

Alec Koppel博士认为,这项研究产生的技术将能够在团队场景不确定的情况下进行推理。这项研究是与普林斯顿大学,阿尔伯塔大学和Google Deepmind合作进行的;这是在NeurIPS 2020(这是一个重要的会议)上的重要演讲,该会议促进了生物学,技术,数学和理论方面的神经信息处理系统研究交流。

杀手机器人的风险 

到2028年自主军事机器人将与战士协同作战

自主伪装的军事机器人,美国陆军的未来。资料来源:Devrimb / iStock

能够开发出能够自动杀人机器人的技术会引起很多问题。 

机器学习和军事技术领域的专家说,从技术上讲,现在可以制造做出决策的机器人。这些自主机器人将有能力确定目标并杀死目标对象,而无需人工控制。 

面部识别和决策算法等其他技术正变得越来越强大。当所有技术整合在一起时,实现此类杀手机器人的创建将变得更加容易。

开发构建可以杀人的自主决策机器人的技术引起了许多问题。这些完全自主的武器将带来新的技术和道德难题,不容忽视。

面部识别和物体识别是可能成为致命自动武器(LAWS)的必不可少技术。

到2028年,随着军事实验将成为战场的一部分,并有可能制造杀人武器。也许我们是时候质疑它们的进一步发展了。

我们是否应该思考,未来战争是否会变得更多高科技的注入,而少了人类的参与?将来,自主杀手机器人是否会与人类反目成仇?这将给人类带来什么样的后果?

上一篇:

下一篇:


标签