JavaScript is required

论文录用后还要交原始数据?一文看懂学术期刊的数据共享声明 (Data Availability Statement) 怎么写

14
2026-04-23 14:49:14

在过去,发论文只需要提交排版精美的 PDF 文本即可。但近两年来,越来越多的科研人员在通过了极其严苛的同行评审,满心欢喜地准备接收 Acceptance Letter 时,却被期刊主编卡在了最后一步:

“Please provide a Data Availability Statement (DAS) and share your raw data.”(请提供数据可用性声明,并分享您的原始数据。)

很多作者对此感到恐慌:“原始数据是我花了两年时间做实验/跑代码才得出来的核心机密,交出去会不会被别人剽窃?如果数据里有一点小瑕疵,会不会被撤稿?”

别慌!要求提供数据共享声明(DAS),是当前全球学术出版界不可逆转的“开放科学(Open Science)”趋势。它并不是为了刁难你,而是为了验证研究的可重复性。只要掌握了正确的话术与合规渠道,你完全可以做到“既满足期刊要求,又保护自己的核心权益”。

一、 认知突围:什么是 Data Availability Statement (DAS)?

数据可用性声明 (DAS) 是现代学术论文末尾(通常在致谢 Acknowledgements 之后)的一个强制性极短段落。它的核心功能只有一个:向读者极其明确地交代,支撑这篇论文结论的原始数据(Raw Data)、代码或材料,到底存放在哪里,以及通过什么途径可以获取。

为什么现在各大顶级出版商(如 Nature, PLOS, Elsevier)都在强制推行 DAS?

  1. 防范学术造假: 拒绝提供原始数据,是“论文工厂”和数据捏造者的典型特征。强制要求 DAS,是为了提高造假成本。

  2. 基金委的强制合规: 许多由政府或国家基金会资助的项目,在合同里明确规定“研究产生的数据必须向公众开放”。

二、 拒绝野路子:数据到底该存放在哪里?

很多新手在被要求提供数据时,会直接把几十兆的 Excel 表格传到百度网盘或个人的 Google Drive 上,然后把链接写进论文里。这在顶级期刊眼里是极其不专业的违规操作!

个人云盘的链接极其不稳定,随时可能失效(死链)。学术界认可的正规数据存放路径只有两种:

  1. 期刊自带的补充材料系统 (Supplementary Materials): 适用于体积较小(几 MB)的表格、图片或短代码。

  2. 权威的公共第三方数据存储库 (Public Repositories): 适用于海量数据集。例如全球公认的免费综合性数据库 ZenodoFigshareDryad。当你把数据上传到这些正规平台后,平台会给你的数据单独颁发一个 DOI 码。你只需要在论文里写上这个 DOI 码,就算完美履约。

三、 直接复制:5 大场景的官方英文 DAS 写作模板

并不是所有数据都能毫无保留地公开。根据你研究的性质,学术界将数据共享划分为以下 5 种合法场景。请找到属于你的那一种,并直接套用对应的模板。

场景 1:完全公开的黄金标准 (存放在第三方数据库)

如果你的数据不涉及隐私,且体积庞大,极其建议上传至 Zenodo 等平台并获取 DOI。这是主编最喜欢看到的完美声明。

英文模板: The datasets generated and analyzed during the current study are available in the [填写数据库名称,如 Zenodo] repository, [填写数据的永久链接或 DOI 码,如 https://doi.org/10.5281/zenodo.1234567].

场景 2:数据已包含在论文中 (附在补充材料里)

如果你的数据量很小,已经全部放进文章结尾的 Appendix 或上传到系统的 Supplementary Information 里了。

英文模板: All data generated or analyzed during this study are included in this published article and its supplementary information files.

场景 3:极其敏感的医学/隐私数据 (法律禁止公开)

如果你研究的是患者的临床数据、基因序列,或者涉及国家安全保密协议的敏感数据,你完全有合法的理由拒绝公开全文,但必须写明获取的严格限制条件。

英文模板: The datasets generated during and/or analyzed during the current study are not publicly available due to [填写原因,例如:strict patient privacy regulations / ethical restrictions], but are available from the corresponding author on reasonable request and with permission of [填写相关伦理委员会名称].

场景 4:数据受限于第三方版权 (你无权公开)

如果你购买的是商业公司的数据库(如彭博社的金融数据,或某互联网公司的后台日志),你只有使用权,没有公开分发权。

英文模板: The data that support the findings of this study are available from [填写第三方机构名称]. Restrictions apply to the availability of these data, which were used under license for this study. Data are available from the authors upon reasonable request and with the permission of [填写第三方机构名称].

场景 5:合理请求后提供 (越来越被限制的“灰色地带”)

在过去,很多人喜欢写“想要数据请发邮件联系通讯作者”。但近两年,这种声明正在被许多顶级期刊严格禁止,因为它往往是一种推托之词(作者大概率不会回复邮件)。除非万不得已,尽量少用。

英文模板: The datasets used and/or analyzed during the current study are available from the corresponding author on reasonable request.

(注:如果你的文章是纯理论推导或文献综述,没有产生任何新数据,只需声明:"Data sharing is not applicable to this article as no new data were created or analyzed in this study.")

结语

在万物互联的开放科学时代,“数据私有化”的陈旧观念正在被打破。坦然面对 Data Availability Statement 的要求,不仅是对自己研究成果极度自信的表现,更是扩大你在该领域学术影响力的绝佳契机(别人下载使用你的数据集,必然会引用你的论文)。选对合规的存储平台,套用严谨的声明模板。

在过去,发论文只需要提交排版精美的 PDF 文本即可。但近两年来,越来越多的科研人员在通过了极其严苛的同行评审,满心欢喜地准备接收 Acceptance Letter 时,却被期刊主编卡在了最后一步:

“Please provide a Data Availability Statement (DAS) and share your raw data.”(请提供数据可用性声明,并分享您的原始数据。)

很多作者对此感到恐慌:“原始数据是我花了两年时间做实验/跑代码才得出来的核心机密,交出去会不会被别人剽窃?如果数据里有一点小瑕疵,会不会被撤稿?”

别慌!要求提供数据共享声明(DAS),是当前全球学术出版界不可逆转的“开放科学(Open Science)”趋势。它并不是为了刁难你,而是为了验证研究的可重复性。只要掌握了正确的话术与合规渠道,你完全可以做到“既满足期刊要求,又保护自己的核心权益”。

一、 认知突围:什么是 Data Availability Statement (DAS)?

数据可用性声明 (DAS) 是现代学术论文末尾(通常在致谢 Acknowledgements 之后)的一个强制性极短段落。它的核心功能只有一个:向读者极其明确地交代,支撑这篇论文结论的原始数据(Raw Data)、代码或材料,到底存放在哪里,以及通过什么途径可以获取。

为什么现在各大顶级出版商(如 Nature, PLOS, Elsevier)都在强制推行 DAS?

  1. 防范学术造假: 拒绝提供原始数据,是“论文工厂”和数据捏造者的典型特征。强制要求 DAS,是为了提高造假成本。

  2. 基金委的强制合规: 许多由政府或国家基金会资助的项目,在合同里明确规定“研究产生的数据必须向公众开放”。

二、 拒绝野路子:数据到底该存放在哪里?

很多新手在被要求提供数据时,会直接把几十兆的 Excel 表格传到百度网盘或个人的 Google Drive 上,然后把链接写进论文里。这在顶级期刊眼里是极其不专业的违规操作!

个人云盘的链接极其不稳定,随时可能失效(死链)。学术界认可的正规数据存放路径只有两种:

  1. 期刊自带的补充材料系统 (Supplementary Materials): 适用于体积较小(几 MB)的表格、图片或短代码。

  2. 权威的公共第三方数据存储库 (Public Repositories): 适用于海量数据集。例如全球公认的免费综合性数据库 ZenodoFigshareDryad。当你把数据上传到这些正规平台后,平台会给你的数据单独颁发一个 DOI 码。你只需要在论文里写上这个 DOI 码,就算完美履约。

三、 直接复制:5 大场景的官方英文 DAS 写作模板

并不是所有数据都能毫无保留地公开。根据你研究的性质,学术界将数据共享划分为以下 5 种合法场景。请找到属于你的那一种,并直接套用对应的模板。

场景 1:完全公开的黄金标准 (存放在第三方数据库)

如果你的数据不涉及隐私,且体积庞大,极其建议上传至 Zenodo 等平台并获取 DOI。这是主编最喜欢看到的完美声明。

英文模板: The datasets generated and analyzed during the current study are available in the [填写数据库名称,如 Zenodo] repository, [填写数据的永久链接或 DOI 码,如 https://doi.org/10.5281/zenodo.1234567].

场景 2:数据已包含在论文中 (附在补充材料里)

如果你的数据量很小,已经全部放进文章结尾的 Appendix 或上传到系统的 Supplementary Information 里了。

英文模板: All data generated or analyzed during this study are included in this published article and its supplementary information files.

场景 3:极其敏感的医学/隐私数据 (法律禁止公开)

如果你研究的是患者的临床数据、基因序列,或者涉及国家安全保密协议的敏感数据,你完全有合法的理由拒绝公开全文,但必须写明获取的严格限制条件。

英文模板: The datasets generated during and/or analyzed during the current study are not publicly available due to [填写原因,例如:strict patient privacy regulations / ethical restrictions], but are available from the corresponding author on reasonable request and with permission of [填写相关伦理委员会名称].

场景 4:数据受限于第三方版权 (你无权公开)

如果你购买的是商业公司的数据库(如彭博社的金融数据,或某互联网公司的后台日志),你只有使用权,没有公开分发权。

英文模板: The data that support the findings of this study are available from [填写第三方机构名称]. Restrictions apply to the availability of these data, which were used under license for this study. Data are available from the authors upon reasonable request and with the permission of [填写第三方机构名称].

场景 5:合理请求后提供 (越来越被限制的“灰色地带”)

在过去,很多人喜欢写“想要数据请发邮件联系通讯作者”。但近两年,这种声明正在被许多顶级期刊严格禁止,因为它往往是一种推托之词(作者大概率不会回复邮件)。除非万不得已,尽量少用。

英文模板: The datasets used and/or analyzed during the current study are available from the corresponding author on reasonable request.

(注:如果你的文章是纯理论推导或文献综述,没有产生任何新数据,只需声明:"Data sharing is not applicable to this article as no new data were created or analyzed in this study.")

结语

在万物互联的开放科学时代,“数据私有化”的陈旧观念正在被打破。坦然面对 Data Availability Statement 的要求,不仅是对自己研究成果极度自信的表现,更是扩大你在该领域学术影响力的绝佳契机(别人下载使用你的数据集,必然会引用你的论文)。选对合规的存储平台,套用严谨的声明模板。