FathomNet:新型开源图像数据库助力AI海洋探索
MBARI 和其他研究机构之间的一项新的合作努力正在利用人工智能和机器学习的力量来加速海洋探索。
为了管理气候变化和其他威胁的影响,研究人员迫切需要更多地了解海洋的居民、生态系统和过程。随着科学家和工程师开发先进的机器人技术,可以可视化海洋生物和环境以监测海洋健康的变化,他们面临一个基本问题:图像、视频和其他视觉数据的收集大大超出了研究人员的分析能力。
大海需要大数据。研究人员正在收集大量视觉数据来观察海洋中的生命。如果没有自动化,我们怎么可能处理所有这些信息?机器学习提供了一条前进的道路,但是这些方法依赖于大量数据集进行训练。FathomNet 的建立就是为了填补这一空白。
FathomNet是一个开源图像数据库。使用人工智能和机器学习将缓解分析水下图像的瓶颈,并加速围绕海洋健康的重要研究。 FATHOMNET 将帮助释放人工智能的力量,加速海洋图像的处理。
项目联合创始人 Katija、Katy Crooff Bell(海洋探索联盟)和 Ben Woodward(CVision AI )以及扩展 FathomNet 团队的成员,在最近发表在《科学报告》上的研究出版物中详细介绍了这个新图像数据库的开发。
机器学习的最新进展能够对视觉数据进行快速、复杂的分析,但由于缺乏可用于训练机器识别和分类水下物体的标准现有图像集,人工智能在海洋研究中的使用受到限制和生活。FathomNet 通过聚合来自多个来源的图像来创建一个公开可用的、专业策划的水下图像训练数据库来满足这一需求。
35年来,MBARI记录了近2.8万小时的深海视频,采集了超过100万张深海图像。MBARI 视频实验室的研究技术人员对这些视觉数据进行了详细注释。MBARI 的视频档案包括大约 820 万条注释,记录了对动物、栖息地和物体的观察。这个丰富的数据集是该研究所的研究人员和世界各地的合作者的宝贵资源。
FathomNet 包含 MBARI 数据集的子集,以及来自国家地理和 NOAA 的资产。
自 2010 年以来,美国国家地理学会的勘探技术实验室一直在部署其自主底栖着陆器平台深海相机系统的版本,从所有海洋盆地和各种海洋栖息地的位置收集超过 1,000 小时的视频数据. 这些视频随后被收录到 CVision AI 的基于云的协作分析平台中,并由夏威夷大学和 OceansTurn 的主题专家进行注释。
美国国家海洋和大气管理局(NOAA) Ocean Exploration于 2010 年开始使用 NOAA 船舶Okeanos Explorer上的双遥控车辆系统收集视频数据。超过 271 TB 的数据已存档并可从 NOAA国家环境信息中心(NCEI) 公开访问。NOAA Ocean Exploration 最初通过志愿者参与的科学家众包注释,并于 2015 年开始支持专家分类学家更彻底地注释收集的视频。
MBARI 启动了一项试点计划,使用 FathomNet 训练的机器学习模型来注释遥控水下航行器 (ROV) 捕获的视频。使用 AI 算法可减少 81% 的人力,并将标记率提高 10 倍。
使用 FathomNet 数据训练的机器学习模型也有可能彻底改变海洋探索和监测。例如,为机器人车辆配备摄像头和改进的机器学习算法,最终可以实现对海洋动物和其他水下物体的自动搜索和跟踪。
截至 2022 年 9 月,FathomNet 包含 84,454 张图像,代表来自 2,243 个概念的 81 个单独集合中的 175,875 个本地化,并且正在进行其他贡献。FathomNet 旨在为超过 200,000 种不同姿势和成像条件的动物获得 1,000 次独立观测,最终总观测超过 2 亿次。为了使 FathomNet 达到其预期目标,需要大量的社区参与——包括广泛的群体和个人的高质量贡献——以及对数据库的广泛利用。 获 取 更多前沿科技 研究 进展访问:https://byteclicks.com
关于MBARI
MBARI(蒙特利湾水族馆研究所)是一家私人非营利性海洋学研究中心,由 David Packard 于 1987 年创立。MBARI 的使命是推进海洋科学技术以了解不断变化的海洋。在mbari.org了解更多信息。