好望角:让你的每次点击都有价值:byteclicks.com | 搜索引擎正在被AI污染信息源,中文优质信息越来越少了 |

ImageBind:Meta突破AI界限,新工具可以让机器像人类一样感知

5月9日,Meta发布了ImageBind,一个跨六种模态(图像、文本、深度、热度图、音频和IMU数据)的整体化人工智能模型。

Meta ImageBind 多模态模型开源,这是一个像人类一样结合不同感官的新AI模型。它可以理解图像、视频、音频、深度、热量和空间运动。我们离AGI又进一步。 当人类看到一辆行驶中的火车,不仅会使用视觉,还会听到声音,感知距离,感知速度。 ImageBind 也是类似,它将六种数据,文本,音频,视觉,运动,温度,深度,嵌入到一个向量空间,让模型像千脑智能那样,调动不同的感知区域进行「交谈」并做出全面的解释和判断。

这一技术让机器在整合多种感官信息方面更接近人类。

demo:https://imagebind.metademolab.com/demo

模型下载:https://dl.fbaipublicfiles.com/imagebind/imagebind_huge.pth

论文:https://arxiv.org/abs/2305.05665

上一篇:

下一篇:


标签