Juin 2025 : Top 40 Nouveaux Paquets R CRAN, dont IA et Données
En juin, 123 nouveaux paquets ont été ajoutés à CRAN, le réseau d’archives R complet. Parmi cette collection, une sélection de 40 paquets notables a été mise en évidence dans 21 catégories diverses, y compris l’IA, les Échecs, les Méthodes Computationnelles, les Données, l’Analyse de Décision, l’Écologie, l’Épidémiologie, la Finance, la Génomique, la Linguistique, l’Apprentissage Automatique, les Mathématiques, les Statistiques Médicales, la Théorie Musicale, les Réseaux, la Programmation, les Statistiques, les Séries Temporelles, les Utilitaires et la Visualisation.
IA
statlingua v0.1.0: Facilite la transformation de résultats statistiques complexes en descriptions en langage naturel claires et contextuelles à l’aide de grands modèles linguistiques (LLM). Il s’intègre avec des fournisseurs LLM populaires tels qu’OpenAI, Google AI Studio et Anthropic.
vitals v0.1.0: Fournit un port R d’Inspect, un cadre Python largement adopté pour l’évaluation des grands modèles linguistiques. Ce paquet prend en charge l’ingénierie d’invites, l’utilisation d’outils, le dialogue multi-tours et les évaluations notées par modèle, spécifiquement conçu pour les utilisateurs d’
ellmer
afin d’évaluer leurs produits basés sur les LLM.
Échecs
chess2plyrs v0.3.0: Implémente un programme d’échecs basé sur le moteur d’échecs Minimax, permettant aux utilisateurs de créer des parties et de gérer les données FEN (Forsyth-Edwards Notation).
Méthodes Computationnelles
tvdenoising v1.0.0: Implémente le dénoising par variation totale, une méthode pour approximer des séquences de données bruitées avec des fonctions constantes par morceaux qui présentent des points de rupture choisis de manière adaptative (Johnson, 2013).
wideRhino v1.0.2: Offre des fonctions pour construire des biplots canoniques d’Analyse de Variables en utilisant la Décomposition en Valeurs Singulières Généralisée. Ceci est particulièrement utile lorsque le nombre d’échantillons est inférieur au nombre de variables (Gower et al., 2011; Edelman & Wang, 2020).
Données
avilistr v0.0.1: Fournit un accès facile à la liste de contrôle mondiale des oiseaux AviList, une taxonomie aviaire mondiale unifiée qui harmonise les différences entre les principales listes ornithologiques (Comité Ornithologique International, Clements et BirdLife).
ecoteach v0.1.0: Une collection de jeux de données éducatifs curatés pour l’enseignement des concepts d’écologie et d’agriculture. Il comprend des données documentées issues d’études scientifiques publiées sur la surveillance de la faune, les traitements des plantes et les observations écologiques.
jpinfect v0.1.2: Offre des fonctions pour télécharger et post-traiter les données de cas de maladies infectieuses de l’Institut Japonais pour la Sécurité Sanitaire.
LBDiscover v0.1.0: Une suite d’outils pour la découverte basée sur la littérature en recherche biomédicale. Elle comprend des fonctions pour récupérer des articles scientifiques de PubMed et d’autres bases de données NCBI, extraire des entités biomédicales, construire des réseaux de co-occurrence et appliquer divers modèles de découverte.
Rdatasets v0.0.1: Fournit des fonctions pour rechercher, télécharger et consulter la documentation de milliers de jeux de données provenant de paquets R inclus dans l’archive Rdatasets, disponibles aux formats CSV et Parquet.
Analyse de Décision
RMCDA v0.3: Implémente diverses méthodes pour soutenir la prise de décision multicritères (MCDM), y compris AHP, TOPSIS, PROMETHEE, VIKOR, MCDM stratifié et la méthode stratifiée Best–Worst (Najafi & Mirzaei, 2025).
Écologie
climodr v1.0.0: Fournit des outils pour automatiser les flux de travail de cartographie climatique prédictive à l’aide de données de stations climatiques et pour créer des modèles climatiques reproductibles (Meyer, 2019; Meyer, 2022).
movedesign v0.3.1: Offre une boîte à outils et une application Shiny pour aider les chercheurs à concevoir des études d’écologie du mouvement. Il se concentre sur l’estimation des zones d’habitat des animaux et des comportements de mouvement à petite échelle comme la vitesse et la distance parcourue (Silva et al., 2023).
Épidémiologie
infectiousR v0.1.0: Fournit des fonctions pour accéder aux données en temps réel sur les maladies infectieuses depuis l’API disease.sh, y compris les données mondiales sur le COVID-19, la couverture vaccinale et les données sur les maladies de type grippal du CDC. Il comprend également des jeux de données curatés sur diverses maladies infectieuses.
rifttable v0.7.1: Automatise la production de tableaux reproductibles et prêts à être présentés pour les épidémiologistes. Les utilisateurs peuvent spécifier des conceptions de tableau avec des lignes et des colonnes définies par des expositions, des modificateurs d’effet et des estimateurs (Rothman, 2017).
Finance
fEGarch v1.01: Fournit des fonctions pour implémenter et ajuster une variété de modèles à mémoire courte et longue de la vaste famille des modèles EGARCH (Exponential Generalized Autoregressive Conditional Heteroskedasticity), y compris MEGARCH, FIEGARCH et FIMLog-GARCH.
Génomique
multiDEGGs 1.0.0: Offre des fonctions pour effectuer des analyses de réseaux différentiels multi-omiques, identifiant les interactions différentielles entre entités moléculaires (gènes, protéines, facteurs de transcription) à travers les ensembles de données omiques fournis (Sciacca et al., 2023). Il construit des visualisations complètes des réseaux différentiels pour chaque ensemble de données.
rsynthbio v2.0.0: Implémente un wrapper pour l’API Synthesize Bio, permettant aux utilisateurs de générer des données d’expression génique réalistes basées sur des conditions biologiques spécifiées. Les chercheurs peuvent accéder à des données transcriptomiques générées par l’IA pour diverses modalités, y compris les données RNA-seq en vrac, RNA-seq unicellulaire et de microréseaux.
Linguistique
tidynorm v0.3.0: Implémente la normalisation des voyelles de locuteurs de manière ordonnée, offrant des fonctions génériques pour définir de nouvelles méthodes de normalisation pour les points, les pistes de format et les coefficients de transformée en cosinus discrète, ainsi que des fonctions de commodité pour les méthodes établies (Johnson, 2020; Lobanov, 1971; Watt & Fabricius, 2002).
Apprentissage Automatique
midr v0.5.0: Implémente la Décomposition d’Interprétation Maximale, une technique de décomposition fonctionnelle qui fournit une méthode agnostique au modèle pour interpréter et expliquer les modèles prédictifs boîte noire en créant un modèle de substitution globalement interprétable (Asashiba et al., 2025).
Mathématiques
polarzonoid v0.1-2: Implémente des applications du zonoïde polaire, une généralisation du zonoèdre polaire en 3D, et inclut un solveur de racines pour les polynômes trigonométriques.
Statistiques Médicales
bbssr v1.0.2: Fournit des outils complets pour la réestimation de la taille de l’échantillon en aveugle dans les essais cliniques à deux bras avec des critères de jugement binaires, permettant des ajustements adaptatifs de la taille de l’échantillon tout en maintenant l’intégrité statistique et l’aveuglement de l’étude. Il implémente cinq tests statistiques exacts : chi-carré de Pearson, exact de Fisher, mid-p de Fisher, Z-pooled exact inconditionnel et Boschloo exact inconditionnel (Mehrotra et al., 2003; Kieser, 2020).
causens v0.0.3: Implémente des méthodes d’analyse de sensibilité causale pour ajuster les facteurs de confusion non mesurés potentiels lors du travail avec des données observationnelles. Les méthodes incluent celles développées par Brumback et al. (2004), Li et al. (2011), et les approches bayésiennes et Monte Carlo de McCandless et al. (2017).
door v0.0.2: Offre des fonctions pour la conception, l’analyse et l’interprétation des essais cliniques et d’autres études de recherche basées sur une évaluation bénéfice-risque centrée sur le patient (Hamasaki & Evans, 2025).
Théorie Musicale
musicMCT v0.2.0: Fournit des fonctions pour analyser les gammes musicales à l’aide de la Théorie des Couleurs Modales (Sherrill, 2025), travailler avec la théorie conventionnelle de la hauteur musicale et les géométries continues de Callender et al. (2008), et identifier les propriétés structurelles des gammes.
Réseaux
INetTool v0.1.1: Implémente des méthodes pour modéliser des systèmes complexes comme un réseau de consensus où les nœuds représentent des unités statistiques ou des variables observées, et les arêtes représentent des métriques de distance ou des corrélations entre les unités (Policastro et al., 2024).
Programmation
putior v0.1.0: Fournit des outils pour extraire et traiter les annotations structurées des fichiers source R et Python afin de faciliter la visualisation du flux de travail. Il scanne les fichiers à la recherche d’annotations définissant les nœuds, les connexions et les métadonnées au sein d’un flux de travail de traitement de données, générant des représentations visuelles des flux de données à travers des environnements logiciels polyglottes (Knuth, 1984).
quickr v0.1.0: Offre des fonctions R compilées annotées avec des déclarations de type et de forme pour des performances rapides et une vérification de type robuste à l’exécution. Il prend en charge la compilation juste-à-temps (JIT) et anticipée (AOT) en abaissant le code R vers FORTRAN.
Statistiques
aamatch v0.3.7: Implémente une version simplifiée de l’appariement multivarié utilisant les scores de propension, l’appariement quasi-exact, l’équilibre quasi-fin et l’appariement robuste par distance de Mahalanobis (Rosenbaum, 2020).
bayesmsm v1.0.0: Implémente des modèles structurels marginaux bayésiens pour l’estimation de l’effet causal avec traitement et confusion variant dans le temps, y compris une extension pour le censure à droite informative (Saarela, 2015).
BCD v0.1.1: Implémente des distributions binomiales, géométriques et de Poisson bivariées basées sur des spécifications conditionnelles. Il inclut des outils pour la génération de données et les tests d’adéquation pour ces trois familles de distributions (Ghosh et al., 2025; Ghosh et al., 2023; Ghosh et al., 202?).
lognGPD v0.1.0: Fournit des fonctions pour estimer un modèle de mélange log-normal, Pareto généralisé via l’algorithme Espérance-Maximisation, ainsi que des fonctions pour la simulation de nombres aléatoires et l’évaluation de densité (Bee & Santi, 2025).
QuantilePeer v0.0.1: Fournit des fonctions pour simuler et estimer des modèles d’effet de pairs, y compris des spécifications basées sur les quantiles (Houndetoungan, 2025) et des modèles avec des normes sociales basées sur l’Élasticité de Substitution Constante (CES) (Boucher et al., 2024).
riskdiff v0.2.1: Offre des fonctions pour calculer les différences de risque (ou les différences de prévalence pour les données transversales) en utilisant des modèles linéaires généralisés avec sélection automatique de la fonction de lien (Austin, 2011; Donoghoe & Marschner, 2018).
survextrap v1.0: Fournit des fonctions pour l’analyse de survie utilisant des modèles bayésiens pour les données censurées à droite au niveau individuel. Les fonctions de risque sont modélisées avec des M-splines, et les distributions a priori peuvent être personnalisées. Les distributions a posteriori sont estimées à l’aide de Stan (Jackson, 2023).
unsum v0.2.0: Reconstruit toutes les données brutes possibles qui auraient pu conduire aux statistiques récapitulatives rapportées, fournissant un wrapper pour l’implémentation Rust de l’algorithme CLOSURE.
Séries Temporelles
gseries v3.0.2: Fournit des fonctions pour améliorer la cohérence des données de séries temporelles en utilisant des méthodes décrites par Dagum & Cholette (2006).
Utilitaires
blocking v1.0.1: Offre des méthodes de blocage pour le chaînage d’enregistrements et la déduplication utilisant des algorithmes de voisins les plus proches approximatifs. Il comprend des fonctions pour générer des shingles à partir de chaînes de caractères, des vecteurs de similarité pour la comparaison d’enregistrements et des métriques d’évaluation pour évaluer les performances de blocage (Papadakis et al., 2020; Steorts et al., 2014; Dasylva and Goussanou, 2021; Dasylva and Goussanou, 2022).
flir v0.5.0: Fournit des fonctions pour identifier et corriger les “lints” (modèles de code inefficaces) dans le code R.
Visualisation
fractalforest v1.0.1: Fournit des fonctions pour créer et visualiser des arbres fractals et des forêts fractales basées sur le système Lindenmayer (système L) (Lindenmayer, 1968a; Lindenmayer, 1968b).
ggtime v0.1.0: Étend ggplot2 en implémentant une grammaire des graphiques temporels et des fonctions d’aide pour visualiser les motifs temporels dans les graphiques de séries temporelles, les tracés temporels, les tracés saisonniers et les tracés de sous-séries saisonnières.