罗彻斯特理工学院开发一款数学公式识别工具可轻松创建、编辑、检索复杂数学公式

近日,罗彻斯特理工学院(Rochester Institute of Technology,RIT)的研究人员开发了一款数学公式识别工具,名为Mathdesk。这是一个在线搜索界面,任何人都可以通过它轻松创建、编辑、检索复杂的数学公式。该平台对数学公式的检索方式不同于单纯的字符性质的检索,它引入了机器学习等技术,从而可以更直接地识别出公式。

研究人员认为,人们对公式等“数学性关键词”的网络检索需求正在不断增长,但对许多人来说,如果对LaTeX等工具缺乏熟悉,想要准确地在电脑上键入复杂的数学公式是很困难的。
MathDesk正是为了解决这一问题而被创造的。该工具支持用户以多种方式输入公式,如手写、图片识别、LaTeX的数学公式标记语言等。这将极大地方便人们在阅读论文的时候随手查阅公式(截图识别),或在电脑端快捷键入公式(手写输入)。此外,该工具同样支持对公式进行关键词检索,比如键入Euler就能找出所有带欧拉关键词的公式及函数。

罗彻斯特理工学院开发一款数学公式辨识工具可轻松创建、编辑、检索复杂数学公式

MathDesk能够将键入的公式自动转换成标准的LaTeX的数学公式标记语言,方便进一步检索。用户可以从11个搜索引擎中进行选择,包括标准搜索引擎(例如Google)和以数学为中心的引擎(如Wolfram Alpha、Math Stack Exchange)。RIT学院副教授Anurag Agarwal表示:“有了这样的工具,专业与非专业人士都将能更轻松地输入特殊数学符号和复杂公式,并在搜索引擎中快速有效地检索相关词条。此外,它还可以帮助不同学科的人们进行协作,使他们的发现得以共享。”

该界面在提高效率方面颇具深度,用户可以随时保存需要的公式以备使用,不必反复输入。公式的检索结果以简洁的卡片形式显示,卡片还可展开其相关概念的名称和简要说明。

在识别用户输入的公式时,该工具借助了机器学习技术,这是它能够识别公式图像和手绘符号的必要条件。MathDesk隶属于MathSeer这个大型项目,后者得到了NSF和斯隆基金会近100万美元的资助。项目负责人介绍说:“ MathSeer的目标是开发新技术来为公众提供数学检索的工具平台。这涉及到了开辟新的搜索界面、用于图像识别的AI算法以及优化公式检索引擎等方面。”

为了提升MathDeck的使用效果,开发团队必须更好地理解用户的搜索行为:用户是如何表达其查询需求的?用户倾向于查询何种资料类型?此外,研发人员还指出,数学表达及符号通常具有多种含义并处在较强的上下文联系中。

首席开发人员Gavin Nishizawa介绍说:“从用户的角度来看,输入数学公式是一个很大的挑战,因为数学对象通常是在‘二维层面’进行表达,而键盘上仅能产生一个字符序列。为了使MathDesk能够应对这种复杂性,我们利用我们在数学上的专长使系统’意识到了’对象在数学意义上的细微差别,使其得以准确地表示和释出公式中各个对象间的数学联系,从而提高检索的有效性。”

在检索过程中,MathDeck可以对公式的结构进行识别,并将其结构表示传递到神经网络中生成嵌入向量,然后在各公式卡片中进一步比较,最终获得检索结果。这一检索方式跳出了以字符性质的检索,引入了图形识别等人工智能,用更高级的算法优化了公式的检索过程。虽然实现的功能很基础,但是其意义是更为深远的。

RIT文档和模式识别实验室主任Zanibbi表示,开发团队还计划进一步扩展MathDeck,他们正在开发在大型PDF资料集检索公式的技术,并进一步改善现有的公式识别及检索功能。

研究人员表示:“数学周及无数复杂领域,若能使数学更方便地被使用,则也是为解决数学及科学中的许多问题尽了一份力。” [知社学术圈]

访问: https://mathdeck.cs.rit.edu

上一篇:

下一篇:


标签