UniProt知识库:集成蛋白质数据中心
随着完全测序的基因组数量不断增加,公共序列数据库中的蛋白质序列数量继续呈指数级增长。此外,与这些序列相关的可用信息量也在增加。这些信息分布在各种生物数据集合中,因此需要有一种方法将所有这些相关但分散的信息连接起来,以便用户可以无缝地访问这些信息。数据整合在将分散在不同资源中的大量不同信息整合起来,并向科学界全面展示这些数据方面发挥着越来越重要的作用。
UniProt知识库(UniProtKB)旨在通过提供蛋白质序列和功能信息的统一视图,作为蛋白质知识的中心枢纽。UniProtKB由UniProt联盟制作,该联盟由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和蛋白质信息资源(PIR)组成。UniProt联盟的主要任务是通过维护一个稳定的、全面的、完全分类的、丰富的和准确的注释的蛋白质序列知识库,支持生物研究,并提供广泛的交叉引用和查询界面,供科学界免费使用。获取更多前沿科技信息访问:https://byteclicks.com
UniProtKB由UniProtKB/Swiss-Prot和UniProtKB/TrEMBL两部分组成。UniProtKB/Swiss-Prot是人工策划的,即每个条目中的信息都由人工注释和审查,而UniProtKB/TrEMBL中的记录则是自动生成的,并通过自动注释和分类进行丰富。截至2011年1月11日发布的2011_01版,UniProtKB中的条目超过1350万条,其中UniProtKB/Swiss-Prot中有524 420条,UniProtKB/TrEMBL中有13 069 501条。UniProtKB每4周更新和发布一次,可在线检索或下载www.uniprot.org。