体育 2024-05-05 10:32

伊丽莎白·比克,57岁,从事侦探的工作。她花几个小时阅读和重读文件,钻研文件,做笔记,提出问题和解决案件。但她的案件与谋杀、诈骗、抢劫、不忠或家机密无关,而是与科学有关。她的职业是微生物学家,自2019年以来一直担任科学诚信顾问,并在数千篇科学文章中揭露了学术错误。她的分析重点是研究论文附带的图像,这些图像可能被作者修改或复制,要么是错误的,要么是出于欺诈目的。Bik通过视频电话接受了EL PAÍS的采访,他认为科学论文的发表已经成为一个不可阻挡的加速车轮,必须放慢速度,以防止谎言和操纵的增加。

的问题。是什么让你对科学文献中的欺诈感兴趣?

的答案。有一天,我读到关于抄袭的文章,我从我写的一篇文章中摘录了一句话,并在谷歌学术搜索中把它加了引号。结果不仅是我自己的论文,还有另外两个命中:一个在另一篇文章中,另一个在一本书的章节中。作者是意大利人,他们从我这里抄了两段,也从其他作者那里抄了几段,然后这里抄一段,那里抄一段,写了一篇新文章。这让我很生气,所以我开始寻找更多的抄袭的例子。它就像一个毛球,你找到一个东西,你开始拉,你会发现更多。

问:那些经过处理的图像呢?

a .一次偶然的机会,我在一篇博士论文中发现了抄袭的文字,还有复制的图片。有三张照片,它们都是一样的,但有一张是镜像的,这是一个镜像,但可以识别。我想,我以前见过这个。然后我从寻找抄袭的文章转向寻找复制的图片,因为这样更快。抄袭需要时间,你必须把每句话都放到谷歌学术搜索中,而且速度很慢。

问:你分析过多少篇文章?

答:我搜索了2万篇论文,发现其中约800篇存在重复。到目前为止,其中约有一半已被更正或撤回。我在2015年,也就是九年前报告了它们,尽管我没有一次全部报告。五年后,大约30%的文章被更正或撤回,现在大约是50%。其中许多文章仍在更正或撤回。

问:你认为这次修正的次数是多还是少?

答:现在大约是一半,但事实上,在此之前,这些文章中的大多数都没有被篡改,这是一个非常令人惊讶和令人不安的低(修正)数字。我对期刊没有回应感到沮丧。这些数字还在上升,因为我在Twitter上提醒他们:“嘿,我在2015年发表的这篇论文,你们什么都没做。”

问:你认为这其中的原因是什么?

答:原因可能有很多。有时,编辑,尤其是来自较小期刊的编辑,可能从来不必处理不当行为的怀疑或更正。他们不知道该怎么做。他们可能会联系作者,但也许那个人去了另一所大学,或者他们的名字很普通,他们不确定这个人是不是10年前写这篇论文的人。或者作者可能会回复说,“哦,是的,对不起,这里有一些新的图片。”然后编辑想:“好吧,结案了。”但他们并没有真正解决这个问题。比如,他们觉得这个案子已经了结了,但他们不向我报告。

问:什么被认为是欺诈性的科学形象?

答:图像中的问题是欺诈性的还是诚实的错误,并不总是很清楚。我研究了三种类型的重复。一种是用完全相同的照片来表示图1和图3。这是同一张照片,但他们代表不同的实验。这可能是无心之失,有人抓错了照片。第二个是图像是否重叠、旋转、移动或拉伸。这更有可能是故意的,故意误导,尤其是当它是一张旋转的照片时。这通常不是偶然发生的。第三种类型是当你在一张照片中看到重复的条带或细胞或组织。这是有意为之,单元格没有使用Photoshop。

Microbiologist Elisabeth Bik photographed at her home in an image provided by the scientist.

问:为什么有人要用Photoshop复制单元格的图像?

答:有时是为了掩盖镜头上的裂缝、头发或灰尘。但也可能是故意让它看起来有更多的细胞或更少的细胞。例如,它们在一些细胞上复制背景。你永远不会[完全]知道为什么要这样做,或者这是否是欺诈。我们可能知道某件事是故意做的,但背后可能有一个无辜的原因。对我来说,这很难知道。有些情况很明显是不当行为,但大多数情况下,你都不太确定。

问:接下来会发生什么?

A.编辑需要询问作者,作者需要提供原始照片。我见过一些案例,作者说角落里有个裂缝,他们用一些背景组织把它修补好。在大多数情况下,只有机构才能进行调查。他们需要调查作者或研究小组,他们需要将实验室书籍与已发表的书籍进行比较。这显然需要很长时间。这也是这些论文没有被撤回的另一个原因。在某些情况下,该机构声称正在调查,但他们并不想调查,因为这是他们的明星教授。

问:你怎么知道一篇文章是否可能包含这类图片?

答:我从别人那里得到一些建议,但我仍在完成对2万篇文章的初步研究。我发现了800篇有问题的论文,我可以跟着线索走。例如,我在某篇文章中发现了一个问题,我可以查看同一作者的其他文章,看看是否有问题与特定的人有关,从一个实验室转移到另一个实验室,或者这个实验室是否有问题,可能是粗心大意或不当行为的文化。我跟踪了所有这些线索,每天都有很多人说,你能看看这篇论文吗?

问:识别被篡改图像的过程是什么?

答:我下载文章或在网上看。我看的数据是照片,或条形图或线形图或类似的东西。我寻找诸如缺失的误差条或奇怪的条或没有意义的轴编号,或频谱上的重复特征。我用眼睛扫描,但我也用ImageTwin和Proofic软件。第一个有很多误报,因为很多照片看起来很相似,你必须通过它们并取消点击。但它有一个数据库,里面有来自其他开放获取论文的照片,并将某篇文章中的所有照片与这个大数据库进行比较。它就像一个谷歌图片搜索,但专注于科学论文。

问:你不止一次提到,你的询问,尤其是在开始的时候,并不总是被认真对待。

答:一开始,很多人不相信我的发现。他们以为只有我看到了。想象一下,你写了一堆文章,有人回来对你说:“你五年前写的一些文章有一个错字,我希望你能改正。”你会想,“谁在乎呢?”他们只是没有注意到。甚至我的合作者一开始也不相信我。在我们发表了这篇文章之后,我们展示了这种情况的发生,你可以在每25篇文章中发现一篇错误,他们看到这是一个真正的问题,并更加认真地对待我们。我已经赢得了不会做出错误指控的信誉,但这需要时间。

问:多年以后,你仍然会遇到来自科学界的阻力和不太积极的反应。

答:没有人喜欢因为自己的工作成果而受到批评。如果有人发现并指出你工作中的错误,你可能会感到恼火、愤怒和防御。他们会说,“是的,但我感觉不舒服,”或者“我们只是换了实验室,犯了一些错误。”他们试图找借口或声称这是别人的错。他们中的大多数人变得有点自卫,但有些人甚至变得咄咄逼人,开始攻击我,挖掘我的过去,他们发现我住在哪里,我的家人是谁。然后他们在推特上抨击我,或者写一些关于我的奇怪文章,说我是一个多么邪恶的人。但没有证据表明我错了。目前我还没有被起诉,他们只是威胁我。我一直非常幸运,但在某些时候,我的运气会耗尽。

问:近年来,篡改图像的使用是增加了、减少了还是保持不变?

答:它增加了,也减少了。它从2010年增长到2018-2019年,现在正在下降,因为人们只是把Photoshop做得更好,他们知道我们可以筛选这些东西。有许多欺骗的方法不留痕迹,而且越来越难以发现,因为欺诈者越来越聪明。还有一个原因是人工智能(使用)的增加。现在我们可以创造出完全独特和相当逼真的图像,用我的技术和软件,我无法发现这是一个问题。

问:你担心人工智能吗?

答:非常喜欢。很明显,它确实可以被用来做好事,但它也可以被骗子用来制造假图像、假数据、假文本。我并不完全担心假短信;比起文本生成,科学数据欺诈更让我担心。你可以让它生成一组假的病人,把他们分成两组,用他们做一些实验。它是如此之好,以至于我们再也无法将这些数据集与真实数据集区分开来。我们只会抓住真正愚蠢的骗子,因为他们会留下痕迹让我们去发现。有些聪明的骗子会非常感谢人工智能,因为人工智能可以帮助他们制作更多的假论文。

问:你认为问题的部分原因是否与科学出版物的出版速度有关?

答:当然。我们专注于评估科学家职业生涯的指标:他们发表了多少篇文章,被引用了多少次,所有这些文章的影响因素是什么。这些都是你可以看到的数字,并且很容易根据这些指标对候选人进行排名。人们会试图伪造这些指标,他们会经常引用自己,或者他们会从造纸厂买一篇论文,或者把他们的论文切成小块,然后全部发表。有些大学有严格的要求。例如,如果你想获得博士学位,你需要发表两到三篇论文才能获得它。这并不完全公平,因为你可能是一位杰出的科学家,但你的实验可能不成功,你可能没有发表任何论文。

问:你认为科学期刊如何应对图像操纵的检测和预防?

答:现在他们意识到了,但我认为已经太晚了。他们在发现这些问题,特别是造纸厂的问题时,不是很警惕。作弊的不仅仅是个别实验室,还有一个犯罪组织在源源不断地炮制论文。这些并没有被期刊收录,而是被志愿者收录。我们一直在提醒期刊他们需要设置更高的防护措施不要让这些垃圾通过。文章发表后,很明显是假的。

期刊开始设置保护措施,比如通过筛查chatgpt生成的语言来检测图像复制,与此同时,欺诈者知道我们会对这些东西进行筛查。这是一场激烈的竞争,骗子总是会赢,但我们可以让他们更难。我们需要放慢科学出版的速度。