原文作者:David Adam
麻醉医师John Carlisle现已在数百篇文章中发现了可疑数据,一本顶尖医学期刊因而改变了宣布流程。
假如John Carlisle不需求一大早起来喂猫,那些数据造假的科学家也就不会寝食难安。他每天早上四点半起床,把小猫“巫师”放出去活动。然后,由于难以再次入眠,他会翻开电脑,将已宣布的临床实验论文中的数据一个一个输入。90分钟后,当他妻子的闹钟响起时,他现已把数百人的年纪、体重和身高信息填进了电子表格。根据这些数据,他知道其间一些人底子不存在。
麻醉医师John Carlisle上任于英国托基市的一家医院,作业之余,他热衷于发现医学临床实验中的数据疏忽。
来历: Emli Bendixen for Nature
素日里,Carlisle是一名麻醉师,在海边小镇托基为英国国家医疗服务体系(NHS)作业。空闲之余,他执着于寻觅临床研讨文献中的问题数据。曩昔十年里,他“查看”过各类关于健康问题的临床研讨,从特定饮食办法的益处到林林总总的医治攻略。明察秋毫的他,现已让数百篇文章因学术不端或实验过失被撤回或修订。Carlisle还帮忙让一些造假“惯犯”丢了饭碗——全球撤稿率最高的6名科学家中,有3名是根据Carlisle的数据剖析而被扳倒的。
澳大利亚墨尔本阿尔弗雷德医院麻醉和围手术期医学主任Paul Myles与Carlisle一同查看核算数据可疑的研讨论文。他说:“Carlisle的办法已被证明十分有用,他用这种办法成功揪出了数起严峻的学术造假事情。”
可是,并非一切人都对Carlisle的“打假”副业大加欣赏。批判者以为,他的办法会让一些没有显着缺点的论文无辜遭到不合理的置疑。
但Carlisle信任自己这么做是在维护患者,这也是他把业余时刻都用来揣摩他人论文的原因。他说:“我这么做是出于好奇心的唆使,而不是由于热衷于揭穿不妥行为。我不想变成一名揭穿学术不端的狂人。”
与坚持核实学术论文真实性的其他人相同,Carlisle用实际行动奉告咱们,期刊和研讨组织作为科学的守门人,在鉴别过错方面做得还不行。有时候,Carlisle所注重的这类医学临床实验或许事关存亡。
不乖的麻醉学家
托基看起来和其他的英国传统小镇没什么两样。环形路上随处可见美丽的花卉,蜡笔色的乡下小屋有目共睹。Carlisle在这里生活了18年,一直在镇上的归纳医院作业。在空荡荡的手术室里,一位患者承受缝合后刚被推走,Carlisle叙述了自己揭穿医学研讨数据造假的作业是怎么开端的。
十多年前,Carlisle等麻醉学家开端注重日本研讨人员藤井善隆(Yoshitaka Fujii)宣布的研讨成果。藤井善隆彼时任职于东京东邦大学,在一系列随机对照实验中,他宣称现已研讨了各种药物对防备患者术后厌恶吐逆的影响。但是,他的实验数据过于完美,简直好到不真实。作为存疑的研讨者之一,Carlisle决议核对这些数据。他运用核算查验找出数据中不太或许呈现的形式。2012年,他用自己的办法证明,在大都状况下,呈现文中形式的或许性“微乎其微”[1]。他的剖析直接促进期刊修改要求藤井善隆现在和之前任职的大学参加查询。2012年,藤井善隆被东邦大学开除,他宣布的183篇论文悉数被撤,创下了空前记载。四年后,Carlisle与人协作宣布了对另一位日本麻醉学家斋藤(Yuhji Saitoh)的剖析成果,证明他的数据也十分可疑[2]。斋藤与藤井善隆合著有多篇论文,现在已有53篇论文被撤稿。
其他研讨人员很快在自己的剖析中引用了Carlisle的作业,并在Carlisle的办法进步行了改善。2016年,新西兰和英国的研讨人员对日本南部一家医院的骨学研讨员佐藤美洋(Yoshihiro Sato)的论文提出了质疑[3],致使27篇论文被撤回。而佐藤美洋参加协作的文章已有66篇被撤回。
在藤井善隆和斋藤之前,麻醉学界就曾因造假丑闻而备受冲击,其间包含德国麻醉师Joachim Boldt的90多篇论文被撤稿。但Carlisle不信任只要自己的范畴才存在问题。所以,他选了8本干流期刊,运用业余时刻把上面的数千项随机实验都查了个遍。
2017年,Carlisle在英国的《麻醉学》(Anaesthesia)上宣布剖析文章,指出16年中宣布的5000多项临床实验中,有90项存在可疑数据[4]。现在,这些论文中至少有10篇已被撤回,6篇已被更正,其间包含《新英格兰医学期刊》(NEJM)上一篇关于地中海饮食有益健康的高影响力文章。只不过,在这篇文章中,作者没有成心造假,而是在随机挑选受试者时犯了一个过错。在作者删除了过错的数据后,这篇论文以类似的定论得以从头宣布[5]。
Carlisle的打假作业仍然在持续。本年,他对意大利中部拉奎拉大学外科医师Mario Schietroma的数十项麻醉研讨提出了正告,称这些研讨不能作为临床实践的牢靠根据[6]。Myles与Carlisle一起撰写了这篇陈说。上一年,他们在Schietroma的五篇论文中发现对照组和患者组的原始数据存在可疑的类似之处。
麻醉师在手术中运用的氧气罐。
来历: Mark Thomas/Alamy
对Schietroma的研讨定论提出质疑,对全球范围内的医院都造成了不小的影响。国际卫生组织(WHO)在2016年发布的一项主张中征引了Schietroma的研讨成果,引荐麻醉师在手术期间和术后定时进步患者的给氧水平,以削减感染。Myles以为这条临床主张存在争议:麻醉师很清楚,某些手术中,过多的氧气会添加并发症的危险,而这些主张也会让一些赤贫国家的医院把更多预算花在贵重的瓶装氧气上。
Myles质疑的五篇论文很快被撤回,WHO将其主张从“激烈主张”改为“有条件主张”,这意味着临床医师有更多自在为患者拟定个性化挑选。Schietroma辩称,他文中的核算通过了一名独立核算学家和同行评定的评价,他成心挑选了类似的患者集体,所以数据十分挨近家常便饭。他还标明,与实验有关的原始数据和文件在2009年拉奎拉地震期间丢掉了。Schietroma地点大学的讲话人称,有关质询已交由相关组织查询处理,但没有明说组织名称以及查询是否在进行中。
辨认失常数据
Carlisle运用的办法就其实质来说并不新颖。他说自己的办法很简单,由于现实生活数据遵从天然的形式,而这种形式是人工数据很难仿制的。这种现象最早发现于19世纪80年代,并在1938年由美国电气工程师和物理学家富兰克 本福德推行开来,被许多核算查验人员运用。长期以来,政治科学家一直在运用一种类似的办法剖析查询数据,这种办法名为Stouffer法,以社会学家Samuel Stouffer命名,他在上世纪50年代推行了这种办法。
比方说,在随机临床实验(RCT)中,Carlisle会查看描绘志愿者基本特征的基线数据,一般包含对照组和干涉组。这些数据包含身高、体重和相关的生理特征,一般在论文的第一个表格中列出。
在真实的随机临床实验中,志愿者被随机分配到对照组或(一个或多个)干涉组。因而,每个特征的均值和标准差应该大致相同,但不会过分类似,不然就显得过于完美。
Carlisle会先为每一对构建一个P值,假如志愿者确实是随机分配,这个P值就代表了所陈说基线数据的或许性。然后,他会整合一切P值,评价数据全体上的随机散布状况。假如兼并后的P值看起来过高,阐明数据过于平衡而值得置疑;过低则标明患者的随机分配有误。
这种办法并非满有把握。核算查看要求表中的变量是彼此独立的,而实际状况常常做不到(例如,身高和体重是彼此相关的)。在实践中,这会导致一些文章被委屈,这也是部分核算学家批判Carlisle的原因。
但Carlisle说,他的办法很合适用来作开始挑选,在此基础上找出需求进一步核实的研讨,并要求论文作者供给患者个别的相关数据。
Myles标明:“这种办法能够用来在可疑数据中竖一面红旗、一面黄旗或5面、10面红旗,借此阐明数据可疑的严峻性。”
无心vs成心
Carlisle说自己很留意,尽量不把原因归咎于他发现的或许问题。2017年,《麻醉学》宣布了Carlisle对5000个临床实验展开的大型剖析——Carlisle是该期刊修改。与此同时,澳大利亚悉尼大学的麻醉学家John Loadsman和Tim McCulloch同期宣布了一篇社论,在文中提出了更为急进的观念[7]。
该文章运用了“不诚实的作者”和“学术恶行”等词,还说其他已宣布临床研讨的作者也会迎来对他们的“魂灵拷问”。社论还激烈主张全球一切期刊把业已宣布的随机对照实验悉数过一遍Carlisle的办法。
这篇文章引起了美国的《麻醉学》(Anesthesiology)期刊修改部的激烈回应,该期刊总共宣布了12篇被Carlisle列为有问题的论文。期刊主编、北卡罗莱纳州杜克大学的麻醉学家Evan Kharasch说,Carlisle的剖析文章存在道德问题,以这种办法对已宣布文章的作者点名批判,无疑是一种损伤[8]。他的这篇反击文章与波士顿的麻省归纳医院的麻醉学家、麻醉学核算参谋Timothy Houle一起完成。他们强调了这种办法会导致假阳性的问题,并在给英国《麻醉学》的回应中写道,能检测数据假造和篡改的有用办法(类似于剽窃查看软件)当然遭到欢迎,但Carlisle的办法还没到那个程度[9]。
本年5月,美国的《麻醉学》对Carlisle提出质疑的一篇论文做出了更正,指出文章两个表格中的P值存在“系统性过错”,并标明作者丢掉了原始数据,无法从头核算。但Kharasch仍然坚持自己在社论中的观念。Carlisle以为Loadsman和McCulloch的社论“合乎情理”,但批判他的作业并不能抹去这些作业的价值。他说:“我信任这些尽力是值得的,尽管有的人不这么想。”
数据审阅人
除了Carlisle的办法之外,近年来还出现了一些其他的查看办法。
Michèle Nuijten在荷兰蒂尔堡大学研讨剖析办法,她开发了一种名为“核算拼写查看”的程序,能够扫描期刊文章,查看所描绘的核算数据是否内涵共同。这种办法被称为“statcheck”,能够用来验证成果一栏中的数据是否与核算的P值共同。早在几十年前,它就被用来符号期刊文章中过错,首要用来发现一些数值的输入过错。
荷兰格罗宁根大学的心理学研讨生Nick Brown以及美国东北大学从事科学办法研讨的James Heathers,将一个叫做GRIM的程序用来复核核算学核算,这也是判定可疑数据的另一种办法。
寻觅论文可疑数据的James Heathers (左) 和Nick Brown。
来历:James Heathers/Nick Brown
但是,这两种办法都不适用于描绘随机对照实验的论文,也便是Carlisle纠错的研讨类型。Statcheck只合适严厉契合美国心理学协会格局要求的数据;而GRIM只适用于整数数据,比方心理学问卷要求从1到5进行评分的一类离散数字。
斯坦福大学的John Ioannidis标明,人们对这类查看的爱好越来越高。专门研讨科学办法的他发起巧用核算学来进步科学的可重复性。他说:“这些都是很有用的东西,十分有构思。”但他也提示称,不能对问题的原因妄下定论。学术造假和输入过错完全是两件事。”
Brown、Nuijten和Carlisle都以为他们的办法只能用来发现需求进一步查询的问题。Nuijten说,我真的不想把statcheck和造假联络在一同。Ioannidis则说,这类东西的真实价值在于,它们能在论文宣布前筛查出问题数据,从源头防备虚伪或过错的数据进入文献库。
Carlisle说,越来越多的杂志修改联络他,希望能用他的办法完成上述方针。现在,大部分这方面的数据查看都是一些暂时起意的非正式作业,并且只要在修改觉得可疑的状况下才会展开。
不过,至少有两家期刊已将数据查看作为一切论文宣布前的正式流程。除了Carlisle担任修改的《麻醉学》以外,《新英格兰医学杂志》的修改也将该办法作为官样文章。该期刊的一位讲话人说:“咱们这么做是想防备一些稀有的、但会发作巨大影响的负面事情。为此,咱们值得投入额定的时刻和费用。”
Statcheck的开发者Michèle Nuijten,statcheck能够用来查验文献中的数据是否共同。
来历: Michèle B. Nuijten
Carlisle标明,像《新英格兰》这种等级的期刊引进数据查看令他深受牵动,由于这项作业繁琐耗时,并非广受欢迎。但他以为,鉴于全球每年会宣布200万篇文章,即便只查看其间一小部分,都需求将这种办法自动化,而他也信任这是能够做到的。Nuijten说这正是statcheck的用法,它常被一些心理学杂志用来筛查已提交的论文。例如,文本发掘技能能够评价几千篇论文中的P值,发现“P值控制”(专指调整数据以发作明显P值的行为)。
该范畴的几位研讨人员标明,赞助者、期刊和许多科学界人士对这类查看的注重程度还不行高。正如Nuijten所说:“这不是一项很有报答的作业。企图在他人的作业中找茬是不会让你遭到敬爱的。”
别的,即便发现研讨涉嫌造假,也纷歧定能解决问题。2012年,韩国的研讨人员向《麻醉与镇痛》(Anesthesia & Analgesia)提交了一篇实验陈说,研讨怎么从面部肌肉张力判别将呼吸管刺进嗓子的最佳时刻。Carlisle承受了非官方约请,查看了文章中的数据,发现患者数据和总计数据之间存在不符,这篇文章因而被拒稿。
有意思的是,这篇论文随后投到了Carlisle的杂志,尽管文中的患者数据略有更改,但Carlisle仍是一眼认出了它。所以,文章再一次被拒。两本期刊的修改都联络了作者及其地点组织,表达了他们的忧虑。令Carlisle吃惊的是,几个月后,这篇文章一动未动地宣布在了《欧洲麻醉学杂志》(European Journal of Anaesthesiology)上。在Carlisle将这篇文章的疑点奉告期刊修改后,该文章于2017年被撤回,原因是“数据不标准,包含对成果的过错陈说”[10]。
在目击了众大都据造假和输入过错后,Carlisle关于为何有些研讨人员会挑选假造数据提出了自己的理论。他说:“这些人信任,是偶尔发作的状况让他们得到的现在的数据,而这些数据与他们眼中的国际运作办法是有收支的。为此,他们把成果改成了他们以为应该是的姿态。”
从Carlisle的身上咱们看到,只要毅力坚决的数据审阅人才干识破这些骗术。
参考文献:
1.Carlisle, J. B.Anaesthesia67, 521–537 (2012).
2.Carlisle, J. B. & Loadsman, J. A.Anaesthesia72, 17–27 (2017).
3.Bolland, M. J., Avenell, A., Gamble, G. D. & Grey, A.Neurology87, 2391–2402 (2016).
4. Carlisle, J. B.Anaesthesia72, 944–952 (2017).
5.Estruch, R.et al. N. Engl. J. Med.378, e34 (2018).
6.Myles, P. S., Carlisle, J. B. & Scarr, B.Anaesthesia74, 573–584 (2019).
7.Loadsman, J. A. & McCulloch, T. J.Anaesthesia72, 931–935 (2017).
8.Kharasch, E. D. & Houle, T. T.Anesthesiology127, 733–737 (2017).
9.Kharasch, E. D. & Houle, T. T.Anaesthesia73, 125–126 (2018).
10.Eur. J.Anaesthesiol.34, 249 (2017).
原文以How a data detective exposed suspicious medical trials为标题
宣布在2019年7月23日《天然》新闻特写上