好望角:让你的每次点击都有价值:byteclicks.com | 搜索引擎正在被AI污染信息源,中文优质信息越来越少了 |

研究项目:机器学习可预测高影响力技术

麻省理工学院(MIT)的研究人员构建了一个人工智能框架,可以通过学习已出版的科学文献识别并提取未来的高影响力技术,并对研究人员发出信号进行“早期预警”。

DELPHI是“通过学习以预测高影响技术并进行动态预警”(Learning to Predict High Impact)的缩写,在对其能力进行的回顾性测试中,它能够识别出专家列出的关键开创性生物技术所涉及的所有论文,有时甚至可以在论文发表一年内就能进行早期识别。

James W. Weis是麻省理工学院媒体实验室的研究附属机构,该机构和媒体艺术与科学教授、媒体实验室分子机器研究小组负责人Joseph Jacobson共同合作,利用DELPHI找出了50篇近期发表的科学论文,他们的预测到2023年截止,这些论文及技术将产生重大影响力。论文涉及的主题包括用于癌症治疗的DNA纳米机器人、高能密度锂氧电池和利用深度神经网络进行的化学合成法等。

研究人员认为,DELPHI是一种工具,可以帮助人类更好地利用科学研究的资金,识别技术中的“璞玉”,这些技术如果没有慧眼识别则可能会因此埋没衰退。该技术为政府、慈善机构和风险投资公司提供一种有效筛选方式,同时也助力了科学的发展。

“从本质上讲,我们的算法通过学习科学史上的模式,然后对新的出版物进行模式匹配,以找到具有高影响力的早期特征,”Weis说。“通过追踪一些想法的早期传播路径,我们可以预测这些想法是会成为流行风潮还是以一种有意义的方式传播到更广泛的学术界,两者之间哪一种传播可能性更大。”

该论文已发表在《自然生物技术》杂志上。

研究项目:机器学习可预测高影响力技术

寻找“璞玉”

Weis和Jacobson开发的机器学习算法利用了自20世纪80年代以来科学出版物的指数级增长所带来的大量数据。但是,DELPHI并没有使用一维的度量,比如引用数,来判断出版物的影响因子,而是在期刊文章元数据的完整时间序列网络上进行训练,以展示它们在整个科学生态系统中传播的高维模式。

其结果是一个知识图,这个知识图包含了代表论文、作者、机构和其他类型数据的节点之间的连接。这些节点之间复杂连接的强度和类型决定了它们在框架中使用的属性。Weis解释说:“这些节点和边定义了一个基于时间的图表,DELPHI使用它来学习预测未来高影响的模式。”

这些网络特征均被用来预测科学影响,论文在发表5年后在时间尺度节点中心性排名前5%的论文被认为是DELPHI旨在识别的“高度影响”目标集。图表中排名前5%的论文占总影响的35%。作者表示,DELPHI还可以使用时间尺度节点中心性的前1、10和15%的截点。

DELPHI指出,具有高度影响力的论文几乎可以像病毒一样在其学科内和较小的科学社区之外传播。两篇论文可以有相同的引用数,但具有高度影响力的论文可以拥有更广泛和更深的受众。而低影响力的论文,换而言之,就是“并没有被越来越多的人重视或者充分利用”Weis如是说。

他补充道,该框架可能有助于“激励团队成员一起工作,即便是在他们彼此不认识的情况下,但也许通过向他们提供资助,让他们一起研究重要的多学科问题。”

与引文数量相比,DELPHI识别出了超过两倍的高影响力论文,包括60%的“鲜为人知的宝玉”,即那些被引文阈值所忽略的论文。

雅各布森说:“推进基础研究就是要在目标上多次实现破门,然后能够快速地把最好的想法加倍。”“这项研究是为了看看我们是否能以更大规模的方式进行这一过程,将科学界作为一个整体,作为学术图表中的一部分,同时在确定高影响力的研究方向这一方面更具有包容性。”

研究人员惊讶地发现,在某些情况下,对于一篇具有高度影响力的论文,DELPHI很早就能发出“警告信号”。Weis说:“在发表的一年内,我们已经发现了许多鲜为人知的好论文,它们所研究的技术将在以后产生重大影响。”

然而,他也警告说,DELPHI并不会准确地预测未来。“我们正在使用机器学习来提取和量化隐藏在现有数据的维度和动态中的信号。”

公平、有效并高效地利用资金

研究人员说,他们希望DELPHI能提供一种不那么偏颇的方法来评估一篇论文的影响力,正如过去的研究所显示的那样,有其他的衡量标准可以被操控,如引文和期刊影响因子数,

Weis说:“我们希望能够利用这一点找到最有价值的研究的研究人员,不管他们隶属于什么机构,也不管他们的联系程度如何。”

然而,他也补充说,与所有机器学习框架一样,设计师和用户应该警惕偏见。“我们需要不断意识到我们的数据和模型中存在的潜在偏见。我们希望DELPHI以一种不带偏见的方式帮助找到最好的研究——所以我们需要注意,我们的模型不能仅仅基于次优指标,如h指数、作者引用数或机构隶属关系来预测未来的影响。”

DELPHI可以成为一个强大的工具,让科学基金资助活动变得更高效和有效,也许还可以用来创建与科学投资相关的新类别的金融产品。

实验基金会的执行董事David Lang指出:“新兴起的元科学类别科学基金正是为了满足科学投资组合方法的需求。”Weis和Jacobson对这种认知做出了重大贡献,更重要的是,在DELPHI中实现了这种认知。”

在为生物技术初创企业启动风险投资基金和经历实验室孵化设施之后,Weis又进行了很多了很多的思考。

他说:“我越来越意识到,包括我自己在内的投资者,一直在用同样的方法、同样的预想寻找新公司。”“我开始窥见了大量的人才和令人惊叹的技术与财富,但这些也是常常被忽视的东西。我认为一定有一种方法可以在这个领域有所成就,机器学习可以帮助我们发现并更有效地实现所有这些未被挖掘的技术潜力。”

上一篇:

下一篇:


标签