中国癌症研究遭遇“最大规模”质疑木木
36%,17万,这是让中国科研界无法回避的数字。2026年1月30日,《英国医学杂志》发表了一项震撼学术界的研究。研究显示在1999年至2024年间发表的中国癌症研究论文中,超过17万篇被人工智能标记为疑似论文工厂产物,比例高达36%。
这意味着每3篇中国癌症研究论文中,就有超过1篇被AI识别为可能存在诚信问题。
当然 ,这项 研究并非针对中国,而是展示了一个系统性问题的冰山一角。在这项研究扫描的全球 超过 260万篇癌症论文中,26.1万篇(9.87% )被标记为疑似论文工厂产物, 其中 中国占了17.7万篇,占全球疑似论文的68%。
1月30日,医学领域顶级期刊《英国医学杂志》(The BMJ)发表了一项令人震惊的研究:在1999年至2024年间发表的癌症研究论文中,每10篇就有1篇疑似论文工厂产物;其中中国的情况尤为严重,每3篇就有1篇疑似问题论文。
这项研究的主导者,正是几周前刚刚在Nature杂志上宣布 “ 论文减产50% ” 以践行 “ 慢科学 ” 理念的澳大利亚昆士兰科技大学教授Adrian Barnett。如果说之前他用数据证明 “ 90%的研究是垃圾 ” ,那么这次,他用机器学习找到了最底层的 “ 垃圾 ” ,即由论文工厂批量生产的工业化产品。他的团队开发的BERT机器学习模型,通过分析论文标题和摘要的文本特征,在已知真假的论文中达到了91%的准确率。
更令人不安的是,这个问题不仅存在于低质量期刊。研究显示,那些高影响因子期刊(排名前10%的期刊)的标记率从1999年的接近零,一路攀升到2022年的超过10%。这意味着论文工厂的 “假货” 已经渗透到学术金字塔的顶端,即便是最受尊敬的学术期刊也未能幸免。
这不是针对中国的 “ 抹黑 ” ,而是基于260万篇论文的科学分析。但我们必须直面一个现实:这个数字会被国际学术界长期记住。它不仅影响中国科研的国际声誉,更可能误导全球癌症研究的方向。同时,它也对那些恪守学术诚信的中国研究者造成了不公平的 “ 污名化 ” 。
问题究竟有多严重?论文工厂是如何运作的?AI又是如何识破这些造假的?中国科研该如何应对这场危机?
模板化生产留下 “ 文字指纹 ” :AI如何识破论文工厂
论文工厂(paper mills)通常是指 “ 学术合同作弊组织 ” ,它们为客户批量制造虚假论文。根据BMJ论文引用的数据,过去20年间,超过40万篇疑似论文工厂产物被发表,论文工厂的年收入达到数千万美元。2022年,Wiley出版社在收购Hindawi后,一次性撤回了近1.1万篇疑似论文工厂产物,并关闭了19本期刊,让这个问题获得了前所未有的关注。
这些论文工厂依赖预制句子的模板,只需替换特定领域的术语,以流水线方式大规模制造论文。根据俄罗斯学者Abalkina的调查,论文工厂的收费直接与期刊的影响因子挂钩,影响因子越高,售价越高。
正是因为论文工厂使用模板化生产,这给AI检测提供了可能。Barnett团队的核心假设是:论文工厂使用的文本模板会延伸到标题和摘要,这些模板特征虽然对人类可能不明显,但AI能够识别。他们选择了BERT机器学习模型来分析文本,让AI读了几千篇真假论文后,学会识别 “ 造假腔调 ” 。
研究团队从Retraction Watch数据库筛选出2,202篇标记为 “ Paper Mill ” 的癌症研究论文用于模型训练,并从学术诚信专家数据集获得3,094篇用于外部验证。作为对照组,他们从北欧国家和高影响因子期刊中选择论文,特别纳入了部分中国的高质量论文,以避免模型仅仅学习语言特征而非造假特征。
模型表现令人信服:在验证集上准确率达到0.91-0.93,敏感性为0.87,特异性高达0.96-0.99。更重要的是,在交叉验证中,模型成功标记了72%已知包含错误核苷酸序列和细胞系的问题论文,尽管模型在训练时并未获得这些信息。这说明模型确实学会了识别论文工厂的文本特征本身。
有了这个强大的AI工具,研究团队开始了一项前所未有的大规模扫描:检查1999年至2024年间发表的260万篇癌症研究论文。
全球9.87%,中国36%:癌症研究中的论文工厂有多猖獗?
这是迄今为止针对论文工厂最大规模的检测研究。研究团队从PubMed数据库的3800万篇生物医学论文中,经过严格筛选,最终得到2,647,471篇癌症原创研究论文,跨越11,632本期刊,时间跨度26年。每一篇论文的标题和摘要都被输入到训练好的BERT模型中进行分析。
核心数字令人震惊:在2,647,471篇癌症原创论文中,261,245篇被标记为疑似论文工厂产物,占比9.87%。这意味着每发表10篇癌症论文,就有约1篇可能来自论文工厂,是之前估计的3倍以上。
每年被标记为疑似论文工厂产物的癌症研究论文数量 |图源:The BMJ
从时间趋势看,问题呈指数级恶化。1999-2009年标记率约1%,到2022年已超过15%(171,656篇癌症论文中有26,457篇被标记)。论文指出,标记论文数量遵循指数趋势,R²=0.92,这意味着这是一个系统性的、加速的危机。值得注意的是,2022年后标记率略有下降,论文分析可能与出版商反击、论文工厂转向AI生成新模板等因素有关。
当研究团队按第一作者所属国家统计时,中国的数字尤其突出。在中国机构发表的497,672篇癌症论文中,177,907篇被标记,标记率 高达 36%。让我们用数字来理解这意味着什么:这是全球平均水平(9.87%)的3.6倍,是美国(2%)的18倍; 中国癌症论文总量占全球18.8%, 17.7万篇被标记论文,占全球被标记论文的68%。
值得注意的是,这个问题并不限于中国。伊朗的标记率达到20%,沙特阿拉伯为16%,埃及为15%,巴基斯坦和马来西亚都达到13%。尽管这些国家的标记率也不低,但中国因为科研体量巨大,在绝对数量上最为惊人。与之形成鲜明对比的是,美国的标记率为2%,日本、德国、英国的标记率约为3 % -4%。
从癌症类型看,论文工厂显示出明显的 “ 偏好 ” 。胃癌论文的标记率最高,达到22%;肝癌为20%;骨癌为21%。论文指出,胃癌和肝癌研究中标记论文比例较高,可能部分是因为这些癌症在中国的高患病率。更值得注意的是,某些错误识别的细胞系,如BGC-823和BEL-7402,几乎只出现在来自中国机构的出版物中。这意味着论文工厂针对性地瞄准这些 “ 需求旺盛 ” 的领域。
从研究领域看,基础研究是重灾区。癌症生物学和基础研究、治疗开发、诊断和预后等领域的标记率超过10%,而临床流行病学、支持性护理等领域的标记率低于2%。这符合论文工厂的 “ 经济理性 ” :基础研究相对容易伪造,临床研究 则 需要真实患者数据。
在出版商分布方面,Verduci Editore的标记率高达67%,主要来自 European Review for Medical and Pharmacological Sciences 期刊。更令人担忧的是,即便是Springer Nature、Elsevier和John Wiley and Sons这些主流大型出版商,标记率也约10%,标记论文数量分别达到4万、近4万和2.8万篇。
从期刊影响因子看,排名前10%的期刊标记率从1999年的接近零增长到2022年的超过10%。这说明论文工厂问题不仅限于 “ 掠夺性期刊(纯粹以商业盈利为目的而发行的低品质期刊) ” ,连 顶刊们 也未能幸免。
影响因子排名前10%期刊中被标记为疑似论文工厂产物的癌症论文比例(按发表年份)|图源:The BMJ
研究人员指出: “ 影响因子的同步增长和标记论文的蔓延表明,这两种现象可能都源于 ‘ 发表或消亡 ’ 文化的压力。 ” 论文工厂按影响因子定价,瞄准高端市场,而研究者追求高影响因子的压力为其提供了市场。这也印证了Adrian Barnett“影响因子与论文质量并没有直接关系”的观点。
整体而言,这些数字勾勒出一幅令人不安的图景:全球9.87%的癌症论文被标记,中国高达36%;问题 论文标记率 从1999年的1% 飙升 到2022年的15%以上,呈现指数级恶化;从掠夺性期刊到顶级期刊,从基础研究到临床应用,论文工厂的触角无处不在。这不是冰冷的数字,而是一场正在发生的学术诚信危机的真实写照。
“ 标记 ” 不等于 “ 造假 ” :统计工具不是终审法官
当我们看到36%这个惊人数字时,很容易得出简单的结论:中国有36%的癌症研究论文是假的。但科学研究需要严谨,BMJ这篇论文展现了 可贵 的学术诚实,它用大量篇幅讨论了研究的局限性。
首先,研究确实证实了三个关键事实:论文工厂使用文本模板(模型在不同验证集上准确率达0.91-0.93);癌症研究的污染比想象严重(10%的标记率是之前估计的3倍以上);高影响因子期刊不能保证质量(顶级期刊标记率从0增长到10%以上)。
其次,研究团队指出研究本身存在局限性。最关键的是: “ 标记 ” 不等于 “ 造假 ” 。 根据模型的灵敏度(0.87)和特异度(0.96-0.99),论文作者计算了一个假设场景:如果癌症研究中真实的论文工厂论文比例是10%,那么也就意味着在被标记的论文中,约70%确实是论文工厂产物(阳性预测值),而约30%是误判。但真实的论文工厂比例究竟是多少,目前仍然未知。
研究强调,即使存在误判,被标记的大量论文仍然值得警惕和深入调查。以中国的17.7万篇被标记论文为例,如果假阳性率 为 30%,可能有5.3万篇是被误判的真实研究。但即便如此,仍有12.4万篇可能是真实的论文工厂产物。
论文特别强调,分类器是概率模型,不是不端行为的确定仲裁者。所有标记论文代表基于文本特征的统计预测,应解释为需要人类判断和进一步验证的信号,而不是确认的欺诈案例。
关于可能的地理偏见,论文承认训练数据中中国论文过多可能引入偏见,但紧接着提供了反证:模型误分类分析显示假阳性很少,而中国论文在假阴性中过度代表(占90%),这恰恰说明不存在系统性过度标记。此外,论文特别指出:论文工厂的原产国可能与作者的国家不同,比如一家俄罗斯论文工厂向至少39个国家销售出版物,也就是说,即使第一作者单位在中国,不等于造假者就 来自 中国。
根源在 “ 发表或消亡 ” 文化
BMJ论文给出了明确的诊断:高影响因子期刊中标记论文百分比的上升表明,论文工厂论文不仅是低影响期刊的问题。影响因子的同步增长和标记论文的蔓延表明,这两种现象可能都源于publish-or-perish(发表或消亡)文化。
论文指出癌症研究受影响更严重 , 原因包括 “ 高发表压力、专业化领域中简单易伪造的数据和技术,以及有限的同行评审能力 ” ,其中 “ 高发表压力 ” 排在首位。论文工厂按期刊影响因子定价,这创造了一个恶性循环:研究者需要高影响因子论文来满足晋升要求,论文工厂瞄准高影响因子期刊以卖 出 更高价格,结果导致高影响因子期刊的标记率从接近零上升到10%以上。
虽然论文没有直接分析中国的科研评价体系,但提供了几个客观事实:中国是被标记论文最多的国家,某些出版商被中国政府标记为 “ 与学术严谨性冲突 ” ,BGC-823和BEL-7402等细胞系几乎只出现在中国机构出版物中。这些暗示中国的发表压力可能特别严重,为论文工厂提供了最大市场。


