科学数据存储库

2021-06-03 23:47:16

科学数据要求伴随我们的数据描述符的数据集发布,但我们不是自己主机数据。相反,我们要求作者将数据集提交到适当的公共数据存储库。应在可能的情况下提交给纪律的社区认可的存储库。如果不存在合适的学科特定资源,则应将数据提交给通用存储库。

本页列出的主要数据沉积的存储库满足我们对所有研究人员使用适当类型数据的数据访问,保存,资源稳定性和适用性的要求。此列表旨在作为合适存储库的指南,为那些不确定存入数据的人。但是,请注意,此页面上的一些存储库可能会收取托管数据的费用。

作者必须将其数据存入数据存储库,作为稿件提交过程的一部分;案例不会被发送稿件以供审核。如果在稿件提交之前未存入数据存储库,则作者可以在提交过程中将其数据上传到图分类或DateDad数字存储库。如果主机存储库不支持机密对等审查,则也可以暂时存放到这些资源中的数据。

我们提供了推荐的存储库列表的存档,可在CC授权下使用。也可以通过科学数据的空影集收集来查看和过滤由Fairsharing索引的推荐存储库和标准。

必须沉积核酸序列数据,以储存是国际核苷酸序列协作(INSDC)的一部分。序列信息应在混合指南之后存放,其中相关元数据是INSDC兼容。

简单的遗传多态性或结构变化应提交给DBSNP或DBVAR(请注意,这些存储库不能接受源自人类受试者的敏感数据); NCBI迹线归档可用于毛细管电泳数据,而SRA仅接受NGS数据。

这些存储库接受小分子的结构数据(COD);肽和蛋白质(全部);更大的装配(EMDB)。

在手稿提交之前,应将小分子晶体数据上载到Dryad或Finshare,并应包括.cif文件,具有概率椭圆形的结构图,以及每个结构的结构因素。必须使用IUCR' S CheckCIF例程检查结构因素和结构输出,并且必须在提交中包含输出的副本,以及报告任何警报的理由。

这些数据存储库都接受人类派生数据(Neuroomorpho.org和G节点也接受来自其他生物的数据)。请注意,必须识别提交给OpenFMRI的人类主题数据。

功能基因组学是一个广泛的实验类别,科学数据'在这一学科的建议同样地桥的桥梁不同的研究学科。在可能的情况下,应遵循相关的社区要求。

请参阅MicraBray数据的Miame标准。分子互动数据应根据MIMIX建议使用国际分子交换联盟(IMEX)的成员存放。

对于在人类主题中链接基因分型和表型信息的数据,我们强烈建议提交给DBGAP,EGA或JGA,这具有用于处理敏感数据的机制。

我们要求作者将蛋白质组学数据提交给Proteomexchange财团成员(下面列出的),按照MIAPE建议。

这些资源提供特定于特定生物或疾病病原体的信息。它们可以接受其他类型的数据中的表型信息,序列,基因组注释和基因表达模式。将数据纳入这些资源对于在这些特定社区内促进重用来说是非常有价值的;但是,在适用的情况下,我们要求将数据记录提交到社区存储库,并适合适用于数据类型的一个(例如转录组分析;请参阅上文)。

本节中的一些存储库适用于需要受限制数据访问的数据集,这些数据集可能需要保存临床数据集中的研究参与者匿名。我们建议直接联系存储库,以确定具有最适合您学习特定要求的数据访问控制的人。

科学数据鼓励作者将数据存档到上述数据类型特定的存储库之一,尽可能。如果数据类型特定存储库不可用,则以下通用存储库可能是合适的。通用存储库也可能适用于存档相关的分析或实验控制数据,这些分析或实验控制数据,用于补充学科特定的存储库中的主要数据。

下面列出的通用存储库能够接受所有研究人员的数据,无论位置还是资金来源。如果您的机构拥有自己的通用数据存储库,则只要存储库能够在Mint DataCite Dois,并且允许在打开的使用条款下共享数据(例如CC0豁免)即可托管您的数据。请注意,如果您所选择的存储库无法支持机密对象审核,则会要求您将数据集的副本暂时存放到我们的集成通用存储库之一,以促进您的文章的审核。完成对等审查后,将删除临时副本。要使用未在稿件提交系统中出现的存储库,请选择' DataCite Doi'作为提交过程中的存储库名称。

是✔ - 符合100 GB的免费存储,必须通过我们的提交系统上传到图分类。下载说明。

*策划资源可能不接受数据直接提交数据。直接联系数据库以获取更多信息。