2024年人工智能指数报告
斯坦福大学人工智能研究所发布的《2024年人工智能指数报告》描绘了过去10年机器学习系统的飞速发展。报告显示,AI系统在阅读理解、图像分类和竞赛级数学等任务上的表现,已接近甚至超过人类。这种快速发展意味着,许多用于评估它们的通用基准和测试很快就会过时。因此,推出评估AI的新方法越来越有必要,如评估其在抽象和推理等复杂任务上的表现。
这份长达500多页的报告还指出,美国对与AI相关的监管正在升级。然而,由于缺乏对负责任地使用AI的标准化评估,因此很难根据系统构成的风险对它们进行比较。新报告还专门介绍了AI的科学应用,包括谷歌DeepMind的GNoME项目和GraphCast工具。
当前的AI热潮建立在神经网络和机器学习算法之上,这可以追溯到2010年代早期。在此期间,关于AI的期刊出版物大约增加了两倍,而GitHub上的AI编码项目数量也大幅增加。AI的大部分前沿工作都在工业领域内进行,而学术研究人员则转向分析企业推出的模型,深入研究它们的弱点。
随着AI性能的飙升,成本也在飙升。例如,OpenAI公司2023年3月发布的GPT-4的培训成本为7800万美元,而谷歌的聊天机器人Gemini Ultra于2023年12月推出,耗资1.91亿美元。这引发了人们对其能源使用和冷却运行这些系统的数据中心所需水量的担忧。
报告还指出,在美国,监管急剧升级。2016年,美国只有一项法规提到了AI,去年则增加到25项。政策制定者提出的AI相关法案数量也大幅增加,监管行动越来越侧重于促进负责任的AI使用。尽管出现了可以对AI工具的真实性、偏见等指标进行评分的基准,但并不是每个人都在使用相同的模型,这使得交叉比较变得困难。
这份报告揭示了AI技术的飞速发展,以及与之相关的监管挑战和道德问题。随着AI技术的不断进步,我们需要不断更新和改进评估AI的方法,以确保其负责任地使用,并最大程度地发挥其潜力。