北京基因组研究所(国家生物信息中心)原始数据管理体系(GSA Family)研发取得新进展

  814日,圣亚游戏电子优惠:中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)在国际学术期刊GenomicsProteomics & Bioinformatics在线发表题为“The Genome Sequence Archive Family: Toward Explosive Data Growth and Diverse Data Types”的文章,GSA数据库体系接受全世界科研工作者的数据提交,汇交和管理各种类型的数据,并对所有公开可用数据提供免费开放访问,支撑生命科学研究。  

  组学原始数据归档库(GSA)是生命组学原始测序数据管理的公益性数据库,旨在推动全球生命组学数据的共享与应用。近年来,随着组学数据的爆炸性增长和数据类型的多样化,以及人类遗传资源数据管理的特殊需求,CNCB-NGDCGSA数据库进行了更新和扩展,形成了GSA数据库体系,包括GSAGSA-HumanOMIX 

  GSA数据库与2017发布的版本相比,在数据模型、系统功能和数据提交方式等方面进行了更新和功能提升;GSA-Human是存储人类遗传资源数据的数据库,可实现人类遗传资源数据的受控访问,保障人类遗传资源数据的安全性;OMIX数据库存储非原始测序数据,如环境组、表型组、代谢组等,它作为上述两种数据资源库的重要补充,有效地解决了用户提交除原始测序数据外的其它类型数据的需求。 

  截至2021814日,GSAGSA-Human已收集的数据量达到9.5 PBOMIX上线不久数据量已达到1.6 TBGSA数据库体系已为全球111个国家/地区的用户提供数据服务,平均每天的数据下载量达到4 TB,已成为ElsevierWiley Taylor & Francis Cell Springer Nature出版集团指定的核酸数据归档库,获得领域内所有国内外主流期刊的认可。 

  北京基因组所(国家生物信息中心)国家基因组科学数据中心的陈婷婷、陈旭、张思思、朱军伟工程师为该文共同第一作者,王彦青高级工程师、章张研究员、赵文明正高级工程师为该文共同通讯作者。 

  本研究得到了国家重点研发计划、中科院战略先导专项、中国科学院信息化专项等项目的支持,GSA归档数据使用的计算机硬件设施得到国家财政部修缮购置专项的长期支持。

   GSA Family数据模型

  论文链接

附件下载:
香格里拉娱乐会所 金莎国际娱乐官网 彩788女优EB易博 澳门威尼斯人认可娱乐场 沙龙娱乐城备用网址
水舞间娱乐游戏代理 外围彩票网站下载官方 网上现金牛牛游戏 博狗战略合作伙伴 三升体育官网娱乐
菲律宾申博太阳城开户登入 菲律宾申博亚洲美女荷官 ag视讯有没有人赚钱 海天游戏骰宝玩法 通博游戏代理洗码合作
鸿利游戏优惠办理 澳门申博赌场荷官 万博游戏现金网