Nature | Vol 654 | 18 June 2026
如何阅读科研论文 (HOW TO READ A RESEARCH PAPER)
系统地分析论文使你能够批判作者的论点并验证数据。使用清晰的策略能让你从文献中获得最大收益。
作者:Jacques Cornwell
阅读原始研究论文有时就像试图破译古代文献,至少在我的职业生涯中是这样。基于在生物医学和医学方面的基础,我现在是儿科的实习医生,正在英国剑桥大学攻读病理学博士学位。这项工作涉及利用系统生物学来研究某些儿童癌症中治疗抗性的机制。在朝着成为一名医师科学家的目标迈进时,我不断阅读大量复杂而深奥的文献。
尽管没有通用的框架来剖析深奥的原始论文,但拥有一致的方法至关重要。无论我是为了自己的工作阅读文章,还是为期刊进行正式的同行评审,我现在都应用相同的基础技巧。在指导医学生时,我解释说,无论你处于出版过程的哪一方,你都不能像读小说一样从头到尾简单地阅读一篇论文。如果你想解构作者的论点、验证他们的数据并得出自己的结论,你需要一种更系统的方法。
为了帮助弥合被动阅读文献和主动分析文献之间的差距,我开发了一个七步框架,分为三个阶段。我通常会用纸和笔把想法记录在实验室笔记本上,但在文献管理软件的相关部分中包含这些信息同样有效。
第一阶段:鸟瞰全景
在陷入P值和复杂检测的细节之前,你需要了解论文的全貌。这个阶段是关于收集背景信息的。
第一步:获得广泛的概述。 抵制直接深入研究密集方法论的冲动。相反,浏览摘要并查看图表,以高层次地了解研究是如何进行的。例如,这是一项纵向队列研究、CRISPR敲除筛选还是计算模型?尽早对工具和范围有广泛的了解,将在你阅读论文其余部分时锚定你的理解。
第二步:确定核心研究问题。 每项出色的研究都围绕一个单一、可定义的问题展开。尽管标题和摘要提供了线索,但真正的研究问题通常在引言的结尾处找到。找出正在测试的具体假设并记下它。当你通读研究的其余部分时,回头看看这个假设,看看作者是否保持在正轨上。
第三步:描绘现有的知识空白。 研究并非在真空中发生;它建立在以前的工作基础之上。一个有批判性的读者应该理解为什么在这个特定的时刻要进行这项研究。阅读引言,看看作者如何构建该领域的现状。在继续阅读之前,我试图在脑海中理清一些问题:关于这个主题已经知道了什么?这篇论文试图填补哪一块拼图?为什么填补这个空白很重要?
第二阶段:质询
这个时候我要卷起袖子钻研细节了。既然你明白了作者试图实现什么,你就必须评估他们做得如何。
第四步:评估方法论。 这通常是批判性评估中最具挑战性但也最关键的一步。你必须将第二步中的核心研究问题与论文的方法论进行比较,并确定实验设计的合理性。
- 作者是否使用了正确的工具来完成这项工作?例如,与使用原代患者来源的细胞或完整模型生物相比,使用高度适应的永生化细胞系来研究特定的代谢途径可能会产生截然不同的结果。
- 样本量是否足够大以提供充足的统计功效?在方法部分检查是否有功效分析,此计算使用预期的效应量和显著性水平(通常为 $\alpha=0.05$)来确定避免第二类错误(假阴性)所需的最小样本量;如果一项研究的统计功效不足,作者可能会因为数据不够而得出治疗或干预无效的结论,或者他们可能会报告一个实际上只是统计学上偶然的显著效应。
- 他们是否使用了适当的阳性和阴性对照?例如,如果要确定一种化合物是否能杀死癌细胞,阳性对照(如已知的、剧毒的化疗)能证明他们的检测方法正确地测量了细胞死亡。阴性对照(如仅用溶解药物的溶剂处理细胞)可确保并非溶剂本身导致了细胞死亡。
- 原始数据集(如测序读数或患者元数据)是否可以在 NCBI 的基因表达综合库 (GEO) 或欧洲核苷酸档案馆等存储库中公开访问?提供原始数据使独立研究人员能够通过重新分析来验证发现,这是科学方法的基石,可以防范意外错误或数据操纵。如果数据是“可应要求提供”,这通常意味着同行验证存在障碍。
- 作者是否提供了用于生成其模型的计算流程或脚本?例如,涉及复杂生物信息学的研究理想情况下应链接到一个包含所使用的确切 R 或 Python 脚本的 GitHub 存储库或 Docker 容器。这允许其他研究人员复制精确的数字工作流程,以查看他们是否能获得相同的结果。
第五步:得出你自己的结论。 一个常见的错误是在查看数据之前先阅读作者的讨论部分。讨论是作者解释其数据的部分,并且由于他们已经就结果写了一篇论文,你可以相当确信他们已经得出了自己的假设。相反,应跳过讨论,直接查看结果部分和图表。查看图表,阅读表格并检查误差线;问自己:“这些数据说明了什么?”仅根据提供的数字和视觉数据得出你自己的结论。记下该结论,以便将其与作者的结论进行比较。
第三阶段:判决
在最后阶段,你将让自己的分析与作者的叙述正面交锋,看看他们的结论是否成立。
第六步:将作者的结论与你自己的结论进行核对。 现在,阅读作者的讨论和结论。将他们对数据的解释与你之前形成的独立结论进行比较。他们的主张与原始数据一致吗?他们是否夸大了他们的发现?即使数据仅显示微弱的相关性,研究人员在结论中使用强烈、确定性的语言也是很常见的。你的目标是将基于事实和数据驱动的结果与作者的叙述分开。
第七步:考虑替代解释或混杂因素。 没有哪项研究是完美的。在最终确定你的评估之前,扮演一下“魔鬼代言人”。即使数据合理且方法恰当,是否可能有其他因素在推动结果?寻找混杂变量:是否存在可能使结果出现偏差的隐藏因素(例如临床研究中的社会经济地位,或实验室科学中的设备校准错误)?
检查局限性:作者是否承认他们自己研究的弱点?一篇值得信赖的论文会对其自身的局限性高度透明。如果替代解释未得到解决,它将削弱论文的有效性。
作者是否获得了生产检测试剂或药物的公司的大量资助?他们是否拥有诊断算法的专利?虽然这不会自动使科学失效,但这是审视他们在结论中使用的任何强烈、确定性语言的一个关键视角。
批判性地分析一篇研究论文是一项需要练习的技能。这是一个密集的过程,我每篇论文大约需要一两个小时,并且我积极鼓励我的学生在首次应用此方法时花费三到四个小时。考虑到新文献的海量数量,你可能会担心如何管理这部分时间投入,但这种深入探究的方法旨在针对影响你特定研究问题的高影响力论文,而不是针对更广泛的背景阅读。
尽管使用人工智能来总结文献正变得越来越普遍,但我避免在这一深入挖掘的过程中使用它。我确实使用 AI 来帮助概览文献,但我希望保留自己批判性剖析论文的能力——保持我自己的科学直觉。这一练习的目的是建立你自己的分析思维能力。
最终,通过将这个过程分解为这三个阶段,你可以系统地处理任何论文。这七个步骤的过程可以帮助确保你不仅仅是在被动地吸收信息,而是积极地参与到科学中,以确定其真正的价值和有效性。