L'IA alimente la fraude scientifique : un problème industriel croissant
Le fondement du progrès scientifique est confronté à une menace sans précédent, car la recherche frauduleuse passe d’incidents isolés à une entreprise sophistiquée à l’échelle industrielle. Il ne s’agit pas simplement de l’œuvre de quelques individus malhonnêtes ; nous assistons plutôt à la montée en puissance d’une fraude scientifique organisée et systématique, menée par des entités telles que les “usines à articles” qui produisent des articles stéréotypés, des courtiers garantissant la publication moyennant des frais, et des “revues prédatrices” qui contournent les mécanismes essentiels d’assurance qualité. Ces opérations se masquent souvent sous des étiquettes inoffensives comme “services d’édition” ou “consultants académiques”, mais leur modèle commercial principal repose sur la subversion du processus scientifique lui-même.
Les usines à articles fonctionnent un peu comme des fermes de contenu, inondant les revues de soumissions pour submerger les systèmes traditionnels d’évaluation par les pairs. Leur stratégie implique le “ciblage de revues”, où plusieurs articles sont envoyés à une seule publication, et le “saut de revue”, en soumettant le même article à diverses publications simultanément. C’est un jeu de chiffres calculé : même si une petite fraction de ces soumissions frauduleuses passe à travers, les auteurs en tirent des profits considérables.
La prolifération de ces services n’est pas simplement une question d’indolence académique ; elle reflète un écosystème plus complexe et troublant. Les chercheurs d’aujourd’hui opèrent sous une pression immense, en particulier la culture de longue date du “publier ou périr”, où une production continue de nouvelles recherches est cruciale pour obtenir des financements et avancer dans sa carrière. Cette pression est aggravée par les contraintes financières mondiales, qui poussent les gouvernements à réduire les budgets de recherche. La réduction des financements intensifie la concurrence, créant un “piège à double sens” pour les scientifiques qui ont besoin de publications pour obtenir des subventions, mais qui ont besoin de subventions pour mener des recherches publiables. De plus, dans un paysage de recherche de recherche de plus en plus mondialisé, les voix individuelles peuvent se sentir perdues au milieu d’une mer de concurrence, rendant la promesse de publication garantie de plus en plus tentante, bien qu’elle s’apparente à un pacte faustien.
L’avènement de l’intelligence artificielle générative a considérablement amplifié cette industrie de la fraude. Les chercheurs observent désormais une explosion d’articles qui semblent exploiter les logiciels d’IA pour produire des documents à des vitesses sans précédent. Ces articles générés à la hâte extraient souvent des preuves superficielles de bases de données publiques et portent les signes révélateurs de la production des usines à articles, y compris la fabrication de preuves, la manipulation de données, la faute éthique et le plagiat pur et simple. Là où un évaluateur par les pairs aurait pu traiter dix soumissions par an, il est maintenant submergé par 30 ou 40 en six mois, enfouissant la recherche légitime sous une avalanche de contenu douteux. Cela a dégénéré en un jeu du chat et de la souris, les évaluateurs débordés ayant parfois recours à des outils d’IA pour la synthèse ou l’identification des lacunes, pour être ensuite confrontés à des chercheurs qui intègrent du texte caché dans les soumissions pour outrepasser les invites de l’IA et manipuler les évaluations.
Le garde-fou traditionnel de l’académie contre la fraude, le système d’évaluation par les pairs, fait face à ses propres défis inhérents. Bien qu’indispensable pour assurer la qualité, c’est un processus notoirement lent, exigeant un examen et un test minutieux des nouvelles idées. Historiquement, même des figures comme Albert Einstein ont exprimé leur dédain pour son rythme. Cette lenteur a stimulé l’essor des plateformes de prépublication, où les découvertes peuvent être partagées immédiatement. Au moment où une recherche subit une évaluation par les pairs rigoureuse et atteint une revue légitime, les versions non évaluées par les pairs peuvent déjà être largement diffusées, créant une pression pour être le premier et revendiquer le crédit des découvertes, un dilemme qui fait écho à la percée de calcul d’Isaac Newton restée inédite tandis que Gottfried Leibniz en revendiquait le crédit. Ce qui a changé, cependant, c’est l’ampleur et la systématisation de ces raccourcis.
Un indicateur frappant de ce problème à l’échelle industrielle est l’augmentation alarmante des “rétractations par lots” – le retrait simultané de dix articles ou plus. Dans les années 1990, de telles rétractations étaient pratiquement inexistantes. En 2020, il y en avait environ 3 000, et en 2023, ce chiffre a grimpé à plus de 6 000. Pour mettre cela en perspective, les rétractations par lots en 2023 étaient trois fois plus fréquentes que les rétractations d’un seul article, qui s’élevaient à environ 2 000.
Aborder cette crise exige plus que de simplement débusquer les scientifiques peu éthiques. Cela demande une remise en question fondamentale de la manière dont les propres structures de la communauté scientifique —ses métriques de publication, ses mécanismes de financement et ses incitations de carrière— ont involontairement créé des vulnérabilités que ces systèmes frauduleux exploitent. Tant que ces problèmes systémiques ne seront pas affrontés et résolus, l’industrie de la fraude continuera de prospérer, sapant l’entreprise même qui a rendu notre monde plus sûr, plus propre et plus accessible. La question n’est pas de savoir si nous pouvons nous permettre de réparer ce système, mais plutôt si nous pouvons nous permettre de ne pas le faire.