能高效分析细胞分裂4D图像数据的超强运算工具

香港城市大学(香港城大)科学家共同领导的联合研究团队,开发出一种可以重建和以三维(3D)图像呈现细胞形状随着时间而变化的新型运算工具,令分析过程从需要人工操作数百小时,加快至只需用计算机数小时便可完成。此运算工具颠覆了生物学家分析图像数据的方式,有助推进细胞和发育生物学、如癌细胞生长的进一步研究。

该跨学科研究由香港城大电机工程学系(EE)电脑工程学讲座教授兼黄俊康教授(数据工程)严洪教授,联同香港浸会大学以及北京大学的生物学家共同领导。研究成果已于科学期刊《自然通讯》(Nature Communications上发表,题为〈Establishment of a morphological atlas of the Caenorhabditis elegans embryo using deep-learning-based 4D segmentation〉

能高效分析细胞分裂4D图像数据的超强运算工具
香港城大电机工程学系计算机工程学讲座教授严洪教授(左),及其课题组的博士生曹剑锋(右)。(香港城大)

团队开发出来的运算工具名为"CShaper",严教授形容说︰"它是一个强大的运算工具,能于单细胞层面上有系统地分割细胞图像和分析,对有关细胞分裂和细胞与基因功能的研究而言,非常有用。"

能高效分析细胞分裂4D图像数据的超强运算工具
秀丽隐杆线虫胚胎细胞分裂的形态变化图像。

分析大量细胞分裂数据的瓶颈

生物学家一直努力研究动物怎样经由无数次的细胞分裂,从单一细胞、即受精卵,演化成各个器官和整个身体。他们尤其渴望揭示基因的功能,例如哪些特定的基因于细胞分裂过程中形成各种不同器官,或是甚么导致异常的细胞分裂而产生肿瘤。

采用基因敲除技术(gene knockout technique)是其中一个找出答案的方法。研究人员会首先在全部基因齐全的情况下取得细胞图像和谱系树(lineage tree),然后从DNA序列中"敲除"(剔除)一个基因,再比较两组谱系树以分析细胞的变化,并推断出基因功能;然后重复做法,逐一"敲除"其他基因,再逐一比较。

合作参与这个研究的生物学家团队选用了秀丽隐杆线虫(Caenorhabditis elegans, C. elegans)的胚胎作为研究对象,并得出数以兆计字节(terabytes)的海量数据,供严教授的团队进行运算分析。秀丽隐杆线虫是一种蠕虫,具有许多与人类相同的重要生物学特性,因而为研究人类肿瘤的生长过程提供参考价值。

严教授说:"秀丽隐杆线虫约有20,000个基因,这意味着若每次只敲除一个基因的话,将需要进行近20,000次实验,产生大量的数据,所以必需运用自动化图像分析系统,也因此驱使我们开发出一个更高效的相关系统。"

自动分割细胞图像的突破

研究人员一般利用激光束扫描,而取得细胞图像。不过,现有的图像分析系统只能撷取到细胞核图像,但是细胞膜的图像质量差劣,难以重建细胞形状;而且,现时缺乏可靠的算法,能够把记录细胞分裂过程的时序(time-lapsed)3D图像(即4D图像)分割。所谓图像分割(image segmentation)是指将视觉讯号划分为多个部分以简化图像分析,是计算机视觉技术的一个关键过程,但研究人员往往动辄需要花上数以百计的小时,以手动方式标记众多细胞图像。

CShaper的突破之处,在于它能撷取细胞膜形状、构建出细胞3D形状,更重要的是,它能够自动分割细胞图像。严教授课题组的博士生、论文第一作者之一的曹剑锋说:"生物学家透过使用CShaper,可以在数小时内解读这些图像。CShaper可以表征出细胞的形状和表面结构,并提供细胞在不同时间点的3D图像。"

这个突破可以归功于由团队开发、基于深度学习的模型DMapNet,在CShaper系统里所发挥的关键作用。严教授解释说:"通过学习'捕获'图像像素之间的多重离散距离(multiple discrete distances),DMapNet在撷取细胞膜轮廓时会一并考虑形状,而非仅仅考虑图像光暗强度特征。因此,CShaper辨认细胞的准确度高达95.95%,远胜于其他方法。"

能高效分析细胞分裂4D图像数据的超强运算工具
图为CShaper系统的运算流程。于深度学习模型DMapNet的协助之下,研究团队构建出胚胎的发育过程,并按时序以3D的形态呈现(见右方蓝绿色框),并识别出细胞身份。

团队运用CShaper,构建出秀丽隐杆线虫的胚胎由4到350细胞期的3D细胞形态时序图谱,内容涵盖细胞形状、体积、表面积、细胞迁移、细胞核位置以及细胞之间的接触,并识别出细胞身份。

推进肿瘤生长的研究

曹剑锋说:"据我们所知,CShaper是首个能在单细胞层面上,有系统地对秀丽隐杆线虫的胚胎进行图像分割和分析的运算系统。"严教授补充说:"透过与生物学家的紧密合作,很高兴我们开发出一种可以自动分析大量细胞图像数据的计算机工具。我们相信,这套运算系统可以促进细胞生物学和细胞发育学的进一步研究,特别是了解癌细胞的起源和生长。"

团队也以植物的组织细胞测试CShaper,得出令人鼓舞的结果,他们相信此运算工具可以应用于其他生物学研究。

严教授与来自北京大学的汤超教授、以及来自香港浸会大学的赵中应教授是论文的共同通讯作者。论文的共同第一作者分别是香港城大EE学系的博士生曹剑锋、来自北京大学的关国业,与香港浸会大学的何颖诗

这项研究获得美国国家卫生研究院、香港研究资助局、中国科技部与国家自然科学基金会的资助。获取更多前沿科技信息访问:https://byteclicks.com

上一篇:

下一篇:


标签