好望角:让你的每次点击都有价值:byteclicks.com | 搜索引擎正在被AI污染信息源,中文优质信息越来越少了 |

中国团队在无人机高速避障方面取得重要进展

近日,上海交大集成电路学院(信息与电子工程学院)媒体信息网络研究所林巍峣教授团队与合作者,在无人机自主导航领域取得重要突破。团队提出并实现了一种基于可微分物理的端到端视觉控制策略,首次将可微分仿真训练的策略成功部署至真实无人机系统中,实现了单机最高20m/s的避障以及多机集群的复杂任务。相关研究成果以“Learning vision-based agile flight via differentiable physics”(通过可微分物理学习基于视觉的敏捷飞行)为题发表于Nature Machine Intelligence。

研究背景

近年来,空中机器人被广泛应用于搜索救援、电力巡检和物资投递等复杂动态环境中,对飞行器的敏捷性和自主性提出了更高要求。传统方法通常采用基于地图的导航策略,将感知、规划与控制模块分离处理,虽取得一定成果,但其级联结构易导致误差累积和系统延迟,难以满足高速动态场景及多机协作的需求。而基于学习的方法,如强化学习和模仿学习,在单机飞行中表现出色,但在多机系统中面临训练成本高、专家策略设计困难等问题,限制了其在群体智能中的应用。因此,如何高效训练具备鲁棒性与扩展性的视觉驱动多机协同策略,仍是亟待解决的关键问题。

创新成果

针对这一问题,团队提出了一种端到端的方法,通过可微分仿真将深度学习与基于第一性原理的物理建模相结合使用简化的质点物理模型,通过在机器人仿真中反向传播损失梯度,直接优化神经网络控制策略。实验证明,在训练端,结合物理模型和数据驱动的训练方法只需现有强化学习框架的10%的样本即可实现相同的表现。在部署端,该方法在多智能体和单智能体任务中均表现出色。在多智能体场景中,系统展现出自组织行为,能够在无需通信或集中规划的情况下实现自主协同。在单智能体任务中,系统在未知复杂环境中的导航成功率高达90%,其鲁棒性显著优于现有最先进的解决方案。上述系统无需状态估计模块即可运行,并能够适应动态障碍物。在真实森林环境中,其导航速度最高可达20米/秒,是此前基于模仿学习方案的两倍。值得注意的是,所有这些功能都部署在一个价格仅为150元低成本计算机上,其成本不到现有配备GPU系统的5%。

640.gif中国团队在无人机高速避障方面取得重要进展

在单机场景中,将网络模型部署在无人机上后在不同的真实环境中进行测试,包括树林、城市公园,以及含有静态和动态障碍的室内场景。该网络模型在未知复杂环境中的导航成功率高达90%,相比现有最优方法展现出更强的鲁棒性。

在真实树林环境中,无人机飞行速度高达20米/秒,是基于模仿学习的现有方案速度的两倍。所有测试环境均实现zero-shot零样本迁移。该系统无需GPS或者VIO提供定位信息即可运行,并能适应动态障碍物。

640 (1).gif
640 (2).gif

多机协同场景中,将网络模型部署到6架无人机上执行同向穿越复杂障碍和互换位置任务。该策略在同向穿越门洞、动态障碍物和复杂静态障碍物的场景中展示了极高的鲁棒性。在多机穿越门洞互换位置的实验中,展现出了无需通信或集中规划的自组织行为。

640 (3).gif
640 (5).gif

上一篇:

下一篇:


标签