好望角:让你的每次点击都有价值:byteclicks.com | 搜索引擎正在被AI污染信息源,中文优质信息越来越少了 |

美国家癌症研究所基因组数据共享中心提供前所未有的癌症数据资源

美国国家癌症研究所的基因组数据共享中心(GDC)于2016年由时任副总统约瑟夫-拜登发起,芝加哥大学承办,已成为癌症基因组学领域规模最大、应用最广泛的资源之一,拥有超过65个项目的3.3PB数据和超过8.4万个匿名患者病例,每月为超过5万名独立用户提供服务。

在2月22日发表在《自然通讯》和《自然遗传学》上的新论文中,位于芝加哥的研究团队分享了关于GDC的新细节,GDC由美国国家癌症研究所(NCI)资助,通过与弗雷德里克国家癌症研究实验室(目前由Leidos生物医学研究公司运营)签订分包合同。其中一篇论文描述了GDC的设计和运作。另一篇介绍了GDC用于协调提交给GDC的数据和生成GDC研究界使用的数据集的程序。

GDC的目标是为癌症研究界提供一个统一处理的基因组和相关临床数据数据库,使数据共享和协作分析成为可能,以支持精准医学。

2015年6月,利用私有云开始为后来成为GDC的数据生产。仅仅一年后,GDC就分析了超过5万个原始测序数据输入。GDC包括基因组、转录组、表观基因组、蛋白质组、临床和成像数据。Nature论文中描述的处理流程已经产生了超过1660TB的数据,涉及二十多种类型的原发性癌症。这些数据被存储在GDC数据门户中,可供查看和下载。获取更多前沿科技信息访问:https://byteclicks.com

除了数据门户,GDC还提供了额外的用户资源,包括GDC数据分析、可视化和探索(DAVE)工具,用于按基因组变异或特定改变对数据进行交互式探索;GDC数据提交门户,用于提交数据;GDC数据传输工具(DTT),用于下载大型基因组数据集;GDC数据协调系统,允许用户通过协调处理程序运行提交给GDC的数据。

这些数据具有至关重要的作用,随着数据的积累,新的信号将更容易确定为理解癌症生物学的重要目标。此外,数据共享基础设施可以为研究提供信息,为个人之间的遗传变异以及它如何影响癌症患者的结果提供新的见解。

要了解有关GDC推出的信息,请访问uchicagomedicine.org

美国家癌症研究所基因组数据共享中心提供前所未有的癌症数据资源

上一篇:

下一篇:


标签