用于AI训练的最大宇宙模拟套件现已免费下载
CAMELS 项目(带有机器学习模拟的宇宙学和天体物理学)结合了 4,000 多个宇宙学模拟、数百万个星系和 350 TB 的数据来破译宇宙的秘密。
总计 4,233 个宇宙模拟、数百万个星系和 350 TB 数据,CAMELS 项目的新版本是宇宙学家的宝库。CAMELS 代表 Cosmology and Astrophysics with Machine Learning Simulations,旨在利用这些模拟训练人工智能模型来破译宇宙的属性。CAMELS 团队使用来自IllustrisTNG和Simba项目的代码生成了模拟。
西蒙斯基金会 CMB(宇宙微波背景)分析和模拟小组的研究科学家、项目联合负责人弗朗西斯科·维拉埃斯库萨-纳瓦罗(Francisco Villaescusa-Navarro)表示,科学家们已经在使用这些可免费下载的数据来推动新的研究。
CAMELS 的公开数据发布,包含数千个模拟宇宙,涵盖了广泛的合理物理学,将为星系形成和宇宙学社区提供一个独特的机会,探索新机器学习算法解决各种问题的潜力。
研究人员设计了这些模拟来为机器学习模型提供数据,然后机器学习模型将能够从对真实可观测宇宙的观察中提取信息。CAMELS 拥有 4,233 个宇宙模拟,是有史以来最大的一套详细宇宙学模拟,旨在训练机器学习算法。
这些数据将促成新的发现,并通过机器学习将宇宙学与天体物理学联系起来,CAMELS 数据集已经在为研究项目提供动力,大量论文利用了这些数据。
西班牙瓦伦西亚大学的 Pablo Villanueva-Domingo 领导了一篇这样的论文。他和他的同事利用 CAMELS 模拟训练了一个人工智能模型,以测量我们银河系的质量及其周围的暗物质光晕,以及附近的仙女座星系及其光晕。这些测量——有史以来第一次使用人工智能完成——使我们银河系的重量达到太阳质量的 1 万亿到 2.6 万亿倍。这些估计与其他方法的估计大致一致,证明了人工智能方法的准确性。
与此同时,Villaescusa-Navarro 领导了一项使用 CAMELS 数据来估计控制宇宙基本属性的两个参数的值:宇宙的哪一部分是物质,以及质量在整个宇宙中分布的均匀程度。首先,研究团队使用 CAMELS 生成了暗物质、气体分布和恒星不同属性等地图。然后,使用这些地图,他们训练了一种称为神经网络的机器学习工具来预测这两个参数的值。
研究结果显示了利用 CAMELS 根据对宇宙的新观测结果在未来精确估计此类参数的前景。获取更多前沿科技 研究进展 访问:https://byteclicks.com