图片来源:unsplash

撰文 | clefable

审校 | 王怡博

学习随机数生成器

最近追学术圈热点的同学,想必对耿同学的一些名言不会陌生,比如“如此小概率事件,在论文中大概率发生”“不要拿造假不当技术”,又比如“如果不会使用随机数生成器,那不是学术界的耻辱,而是学术造假界的耻辱”。

从今年4月17日开始,耿同学在个人视频账号上发布多条视频,以诙谐生动的讲述方式,列举多项证据,举报同济大学生命科学与技术学院院长王平、中山大学肿瘤防治中心副主任康某某(杰青)以及生命科学学院副院长邝某某(杰青)、南开大学生科院院长陈某(杰青、长江学者),以及上海大学转化医学院院长苏某(长江学者),在发布于《自然》正刊及子刊的高影响因子论文中,存在图片挪用、原始数据造假等学术不端情况

在科研圈,图片挪用或者“图片误用”是早已为人熟知的造假问题,这主要得益于荷兰职业学术侦探兼微生物学家Elisabeth Bik的贡献。而对原始数据造假的披露能引起如此大的影响,此次可能尚属首次。

根据近期国内多家媒体的报道,耿同学表示,在今年之前,他并没有意识到,还能从论文补充的原始数据下手。一方面是没想到会在这些原始数据中造假,另一方面则认为该问题具有一定的隐蔽性。这些补充数据一般不在论文正文中,而是在论文所在的网页,会有单独下载的链接,可以下载这些补充数据,比如一些表格、图片等。他还提到,一般一区和二区的论文(一个领域的顶刊或者优秀期刊)需要提供原始数据,一部分三区四区期刊不强制提供,不过这也和期刊的数据政策有关。

耿同学举报视频的截图 图片来源于”耿同学讲故事”

这些因素也造就了他视频中颇具戏剧性的一幕幕:这些论文的原始实验数据存在大量不实数据,而它们的出现充分体现了“造假者的不用心”——而这些却出现在了无数科研人梦寐以求、足以决定科研生涯的顶刊论文中。

在视频中,耿同学提到,他们最初只觉得论文提供的原始数据“很怪异”,不是实验能获得的数据——具体而言,就是不够随机。就比如20只小鼠的重量,小数点后的最后一位应该符合随机分布的规律,这是一种自然现象。而顺着这种“怪异”仔细筛查,再结合一些软件的帮助,他们就发现其中有大量“低端”造假,比如数据大批量重复,一组数据和另一组数据是等差数列(部分修改了其中一两处),或者小数点后最后一位频繁出现5,还或者一组数据几乎全部到小数点后两位,其他组的数据则是到小数点后3位。

在每期举报视频中,耿同学表示都已走完了3个举报流程,从经费管理部门(国家自然基金委)、主要作者所在的高校及学院,一直到期刊编辑部。5月6日,同济大学率先发布通报,调查确认王平作为通讯作者,对实验数据和论文质量失察失管,免去院长职务等等,论文第一作者金佳丽因学术不端行为,解除聘用关系。

耿同学举报视频的截图 图片来源于”耿同学讲故事”

南开、中山和上海大学也均表示,对违背科研诚信行为坚持“零容忍”,坚决抵制学术不端行为,将根据调查情况严肃认真处理。5月17日,耿同学再次发声,表示“杰青造假的素材我手里还有,而且不止一个,同济大学、华东师范大学、湖南大学和中山大学等4所高校,5个杰青,(名下)Nature的正刊、子刊都涉及严重的学术造假。请各位杰青自查。”

而耿同学的打假之所以集中在生物医学领域的论文,还因为他博士曾就读于北京航空航天大学的生物专业,对这些实验十分清楚。不过在博士5年级时,他选择了退学,开始全职做科普博主。

对于同领域的人来说,这些优秀期刊的论文值得借鉴和学习,这时就需要对照实验方法逐一重复,而这也让这些原始数据有了被人看到的机会。而令人唏嘘的是,在耿同学举报的一篇论文中,文章似乎从“图1.c”就开始造假,论文中后续所有的实验都是以该数据为基础,而这也让整篇论文完全丧失了可靠性。而这些由大量资金支持的“研究工作”,或许将涉嫌大量的人力和资源浪费。

只能发现非常愚蠢的科学家

值得深思的是,在国内媒体的报道中,耿同学还提到:如果科研人员都学会了使用随机数生成器,那么这类原始数据造假的问题将很难察觉。而2019年,Elisabeth Bik在一次采访中也曾表示:“实际上,我只能发现那些非常愚蠢的科学家。大多数科学家都非常聪明。”这也意味着,有欺诈行为的论文数量可能远高于我们所看到的,或者就如耿同学所说,是“冰山一角”。

巧合的是,就在国内这轮学术造假风波期的4月19号,撤稿观察(Retraction Watch)——专门追踪有问题的、不可靠论文的网站,对Bik进行了一次采访,回顾了她在10年前发表的、那篇震惊世界的预印本论文。

Elisabeth Bik 图片来源于维基百科

相较于耿同学基于网友举报的线索,和更多网友合作检查数据的问题,Bik更像是“独行侠”。10年前,Bik先是逐一查看超过两万篇论文的图片,然后将整理的详细报告发送给两位微生物学期刊编辑Arturo Casadevall和Ferric Fang进一步审查。他们三人最终将均认为有图片问题的论文进行收录,发现了782篇论文存在图像重复和篡改的情况,占比大概是4%。

这项研究在发表时,曾被拒稿至少四次,最终Bik不得不在预印本平台bioArxiv发表。两个月后,论文才得以在mBio上发表。据Bik的说法,最开始没有人相信论文中的数据,因为他们不相信Bik会花大概一两年时间,扫描两万份文件。

实际上,这正是Bik能成为首个崭露头角的学术侦探的天赋所在。她表示,自己并不会完整地阅读文件,只会浏览图片,而浏览一篇文章的图片,大概会花一分钟。如果论文的图表更复杂,则会稍微多花一些时间。刚开始,她只是快速翻阅图片,但如果发现有疑似重复的图片,就会进行下载,并用Mac自带的图片软件进行检查。她通常会进行颜色或亮度调整,以便更好地发现篡改痕迹

Bik主要会关注采用蛋白质印迹法(western blot,检测特定蛋白质的一种常用技术)的论文。这并不是指蛋白质印迹法有缺陷,而是相比于其他实验数据,通过该方法的伪造似乎更易被察觉。Bik提到,在这类实验中,每个条带都有其独特的特征,就像一张张面孔。而识别一张面孔只需要不到一秒钟的时间。

Bik发现的一些论文图片存在明显的重复使用情况 图片来源:维基百科

有趣的是,根据后来STAT news对Bik的采访,她可能并不擅长识别面孔。韦尔斯利学院的一位心理学研究员曾对Bik进行了很多测试,发现她很擅长模式识别和三维空间定位,可以用肉眼检测一张图片或者图片一角,是否被复制、旋转或拉伸过。不仅是拥有这项独特的天赋,Bik也足够疯狂,她曾连续数年,每个晚上和周末的时间,都用来研究数万份论文的图片文件

在bioArxiv上发表论文时,Bik发现这些存在问题的论文,均未被撤稿——耿同学近期提到的论文也有相同情况。为了解决论文的问题,Bik向论文的期刊编辑提交了700多份报告,并致函约10家机构,指出存在“论文集群”的问题——即同一机构的3至6篇论文存在重复。

这次,在撤稿观察的采访中,Bik也透露在这782篇论文中,177篇已被撤稿,42篇被发布了关注声明,256 篇已被更正。也就是说,在经过10年后,大概60%的论文得到处理

攻击和声援

Bik的学术打假生涯开始于2013年,她从一期播客中初次听到“剽窃”这一词汇,然后通过检索发现有人抄袭了她的一篇文章。随后是2014年,她在一篇博士论文中发现了重复的印迹图,并开始专注于科学论文中的图像检查。从2019年开始,她专职从事学术不端的检索和揭露工作,也会给一些科研机构担任顾问,负责分析数据和识别科研不端行为。

图片来源:Unsplash

她会在个人账号中公开有问题的论文图片,和粉丝交流。而对于存在问题的论文,她会提交给发表论文的期刊编辑部,或者在PubPeer网站上公开。PubPeer是一个2012年建立的论文平台,主要是为了促进科研人员对一篇论文的“品质”(或者可信度)进行交流。如今,它已经成了国际科研诚信生态中一个不可或缺的一环。PubPeer最核心的特征之一是,会通过匿名机制,保护对一些论文中的数据或图表提出质疑的“吹哨人”。比如,广为人知的日本小保方晴子造假事件,就是在PubPeer首先被揭露的。

截至目前,Bik发现的、有问题的论文已超过8000篇,如果根据4%的概率粗略估计,她大概已筛选了20万篇论文。其中大部分是图片问题,一些存在抄袭或其他问题,例如动物伦理问题或缺乏伦理审批。而让Bik受到全球关注的是2020年3月,她发表一篇文章,批评了法国科学家Didier Raoult关于使用羟氯喹治疗新冠肺炎的临床研究。

在文章中,Bik指出论文存在利益冲突,并对试验的规模、伦理、方案,以及异常迅速的同行评审都提出了质疑。而随后,Bik更是发现Raoult及其所在机构发表的多达62篇论文,存在图片重复和伦理问题。(值得一提的是,多项严谨且规范的研究证据表明,羟氯喹对新冠肺炎的发病率、住院率或死亡率几乎没有影响。)

Didier Raoult 图片来源:维基百科

而这也招来了Raoult及其支持者对Bik持续不断的攻击,他们会在网络和采访中,称她为“疯子”和“失败的研究员”,并公布了她的联系方式。不仅如此,Bik和一位协助运营PubPeer的人员,还遭到了Raoult和其同机构另一名研究人员的起诉骚扰和敲诈勒索。受到攻击的还有法国一名博士后研究员Lonni Besançon,他也因对Raoult的质疑而遭受攻击。不过,他很快撰写一封公开信联合科学家声援Bik,共收集了超过2000多名科学家和30个学术团体的签名。

2024年12月,Raoult关于羟氯喹试验的文章因“未遵守爱思唯尔(Elsevier)的出版伦理政策,未妥善开展涉及人类受试者的研究,以及三位作者对文章方法和结论提出的质疑”而被撤稿。 Bik表示,这篇文章根本就不应该发表,或者至少应该在发表后立即撤稿。

一篇极其重要的阿尔茨海默病论文是假的

通过十多年的努力,Bik将学术打假从个体举报,发展为一种职业化的“学术侦探”模式。而越来越多的科学家甚至非科研领域的人员,因对科学诚信的坚持、学术打假带来的成就感(发现自己有识别数据或图片造假的天赋),或者是受到Bik、PubPeer网站匿名吹哨人的影响,而加入到这项工作之中。

根据2024年Undark网站的一篇报道,西雅图的一位财务顾问Patrick(化名)正是通过类似的方式,在2021年加入论文图片问题的侦查之中。他最开始分析的是一篇关于阿尔茨海默病的论文,后续便一直审查该方向的论文。有一次,他查看了一些图片上呈现出的色带(具有不同颜色,代表着样本中存在的蛋白质),发现这些图片看起来就像人为修改过。其他的学术侦探也发现同一作者的其他论文,有类似的问题。而这其中就包括2006年发表于《自然》的那篇被引用了近2500次、具有里程碑意义的阿尔茨海默病论文

在那篇论文中,研究人员在经过基因工程改造,而患上类似阿尔茨海默病的小鼠体内,发现了蛋白质Aβ*56的存在,并且发现随着认知能力下降,该蛋白质的水平会增加。他们还报告了注射Aβ*56,会导致大鼠记忆缺陷。因此他们认为,这种名为Aβ*56的淀粉样蛋白(Aβ)可能导致阿尔茨海默病。

长期以来,这项研究是“淀粉样蛋白级联假说”的支持性论文之一,而这一假说几乎主导了阿尔茨海默病的研究,并促使数十亿美元的资金投入到抗淀粉样蛋白疗法的研究中,但几乎所有的实验性药物都以失败告终。而Aβ*56似乎提供了一个更具体、更有前景的治疗靶点,这一发现受到了广泛欢迎,相关研究的经费也随之大幅增加

Matthew Schrag 图片来源:范德比尔特大学官网

对该论文产生质疑的,还有范德比尔特大学的神经科学家兼医生Matthew Schrag。根据《科学》网站2022年7月发表的一篇长篇报道,在Schrag提供包括该论文在内的多篇论文,存在学术不端的证据后,应《科学》杂志邀请,一位顶尖的独立图像分析师和几位阿尔茨海默病研究领域的专家审阅了Schrag发现的结果。最后,他们赞同施拉格的结论,认为这篇论文中有70多张图像存在问题。Bik表示,作者“似乎是将不同实验的照片碎片拼接在一起,从而构建出这些图像”。她推测“所获得的实验结果可能并非预期结果,可能已被篡改,以更好地符合某种假设。”

而据《科学》新闻2024年7月的消息,除论文的第一作者Sylvain Lesné外,其他作者均已同意撤回论文。论文的通讯作者Karen Ashe也在PubPeer上发文承认,使用了2张篡改后的图像,但坚持认为这不会改变实验结论。而据《科学》的调查,有证据显示,包括这篇论文在内,Ashe与Lesné合著的多篇论文,似乎都存在操纵数据的情况

关于“淀粉样蛋白级联假说”仍存在很多争议,而基于其指导开发的药物是否会有良好的效果,只能说一句:一切尚无定论。然而,当一项研究的影响,足以牵动更多的研究人员和大量资金投入时,我们或许不得不在前期充分验证结果的可重复性。

可重复性

在Bik等人2016年的论文发表之后,细胞生物学家David Vaux曾表示,他们的论文提供了强有力的证据,支持这一观点:科学论文缺乏可重复性的主要原因是故意伪造数据。而这也反向指出了验证数据的主要方法:重复实验。

在近期的两期视频中,耿同学分享自己在吉林大学读研期间的观察,他提到有两个大课题组导师会在实验室内部去运行重复实验的机制,让另一个同学独立去重复一个同学的实验发现。并不需要完全重复,只要重复几个关键的实验节点即可。学院或者学校可以用重复实验来监管大课题组,这种做法或许非常有效且实用。

图片来源:Unsplash

如果这个经验可以广泛地推广、应用,或许在下游将不再需要像Bik这样的学术侦探作为顾问,为一些学校或机构审查被举报的造假论文。但这可能全然只是一种理想,相比之下,我们往往见到的是道德与利益、职业发展的博弈,而这也造就了近年来科研圈涌现的诸多风波和争议。比如,斯坦福大学日报(The Stanford Daily)率先“发难”,该校前校长马克·泰西耶·拉维涅(Marc Tessier Lavigne)因图片问题,多篇顶刊论文被撤稿。而诺奖得主‌格雷格·塞门扎(Gregg L. Semenza)更是因合著论文的图片问题等,在PubPeer上被频繁质疑,不断引发大众关注——不过诺奖委员会表示,其获奖工作未受影响。诸多案例不胜枚举。

Bik在一次采访中曾表示,这些违规行为也可能是粗心大意或失误造成的。她也很清楚自己的工作可能会影响论文的所有作者,甚至是一个实验室。但她表示,我不能视而不见,一旦我发现,就必须说出来。我希望科学是诚实和清晰的。如果论文中包含不实信息,其他研究人员就会基于这些虚假信息,浪费数月甚至数年的时间,只为验证无法重复验证的结果。“如果你不在乎这一点,那你不是一个合格的科学家。”

而在她的背后还有更多“学术侦探”,他们寻求的不仅是微小的修正,而是在为更宏大的真理而战。科学侦探、新西兰退休的心理学家David Bimler,在给Undark的一条信息中讲道:我们都是理想主义者,我们都希望科学的理想能够回归到过去的样子,是这个愿望把我们团结到了一起。

参考链接:
https://retractionwatch.com/2026/04/19/elisabeth-bik-scientific-sleuth-image-duplication-mbio-biorxiv-preprint/
https://retractionwatch.com/2016/04/19/one-in-25-papers-contains-inappropriately-duplicated-images-screen-finds/
https://www.statnews.com/2024/02/28/elisabeth-bik-scientific-integrity-research-misconduct/
https://www.nrc.nl/nieuws/2019/10/04/een-arendsoog-voor-wetenschapsfraude-a3975678
https://mp.weixin.qq.com/s/AqRo1-7M4XzrtwBjrIzR2A
https://www .chemistryworld.com/news/legal-threats-online-trolls-and-low-pay-the-world-of-scientific-sleuth-elisabeth-bik/4019487.article
https://scienceintegritydigest.com/about/
https://www.timeshighereducation.com/news/science-detective-mission-stamp-out-shoddy-research
https://www.science.org/content/article/researchers-plan-retract-land mark-alzheimers-paper-containing-doctored-images
https://www.theguardian.com/science/2021/may/22/world-expert-in-scientific-misconduct-faces-legal-action-for-challenging-integrity-of-hydroxychloroquine-study?utm_source=chatgpt.com

作者 环球科学

《环球科学》杂志