Junio 2025: Los 40 Mejores Paquetes R CRAN Nuevos, con IA y Datos

Feedburner

En junio, se añadieron 123 nuevos paquetes a CRAN, la red integral de archivo de R. De esta colección, se ha destacado una selección de 40 paquetes notables en 21 categorías diversas, incluyendo IA, Ajedrez, Métodos Computacionales, Datos, Análisis de Decisiones, Ecología, Epidemiología, Finanzas, Genómica, Lingüística, Aprendizaje Automático, Matemáticas, Estadística Médica, Teoría Musical, Redes, Programación, Estadística, Series Temporales, Utilidades y Visualización.

IA

  • statlingua v0.1.0: Facilita la transformación de resultados estadísticos complejos en descripciones de lenguaje natural claras y contextualizadas utilizando Grandes Modelos de Lenguaje (LLM). Se integra con proveedores populares de LLM como OpenAI, Google AI Studio y Anthropic.

  • vitals v0.1.0: Proporciona un puerto R de Inspect, un marco Python ampliamente adoptado para evaluar grandes modelos de lenguaje. Este paquete soporta ingeniería de prompts, uso de herramientas, diálogo multi-turno y evaluaciones calificadas por modelos, diseñado específicamente para usuarios de ellmer para evaluar sus productos basados en LLM.

Ajedrez

  • chess2plyrs v0.3.0: Implementa un programa de ajedrez basado en el motor de ajedrez Minimax, permitiendo a los usuarios crear juegos y gestionar datos FEN (Forsyth-Edwards Notation).

Métodos Computacionales

  • tvdenoising v1.0.0: Implementa la eliminación de ruido por variación total, un método para aproximar secuencias de datos ruidosas con funciones constantes por partes que presentan puntos de ruptura elegidos adaptativamente (Johnson, 2013).

  • wideRhino v1.0.2: Ofrece funciones para construir biplots canónicos de Análisis de Variantes utilizando la Descomposición Generalizada de Valores Singulares. Esto es particularmente útil cuando el número de muestras es menor que el número de variables (Gower et al., 2011; Edelman & Wang, 2020).

Datos

  • avilistr v0.0.1: Proporciona acceso fácil a la Lista Global de Aves AviList, una taxonomía global unificada que armoniza las diferencias entre las principales listas ornitológicas (Comité Ornitológico Internacional, Clements y BirdLife).

  • ecoteach v0.1.0: Una colección de conjuntos de datos educativos curados para la enseñanza de conceptos de ecología y agricultura. Incluye datos documentados de estudios científicos publicados sobre monitoreo de vida silvestre, tratamientos de plantas y observaciones ecológicas.

  • jpinfect v0.1.2: Ofrece funciones para descargar y post-procesar datos de casos de enfermedades infecciosas del Instituto Japonés para la Seguridad Sanitaria.

  • LBDiscover v0.1.0: Un conjunto de herramientas para el descubrimiento basado en la literatura en investigación biomédica. Incluye funciones para recuperar artículos científicos de PubMed y otras bases de datos de NCBI, extraer entidades biomédicas, construir redes de co-ocurrencia y aplicar varios modelos de descubrimiento.

  • Rdatasets v0.0.1: Proporciona funciones para buscar, descargar y ver documentación para miles de conjuntos de datos de paquetes R incluidos en el archivo Rdatasets, disponibles en formatos CSV y Parquet.

Análisis de Decisiones

  • RMCDA v0.3: Implementa varios métodos para apoyar la toma de decisiones multicriterio (MCDM), incluyendo AHP, TOPSIS, PROMETHEE, VIKOR, MCDM Estratificado y el Método Estratificado Best–Worst (Najafi & Mirzaei, 2025).

Ecología

  • climodr v1.0.0: Proporciona herramientas para automatizar flujos de trabajo para mapeo climático predictivo utilizando datos de estaciones climáticas y para crear modelos climáticos reproducibles (Meyer, 2019; Meyer, 2022).

  • movedesign v0.3.1: Ofrece una caja de herramientas y una aplicación Shiny para ayudar a los investigadores en el diseño de estudios de ecología del movimiento. Se centra en la estimación de las áreas de distribución de los animales y los comportamientos de movimiento a pequeña escala, como la velocidad y la distancia recorrida (Silva et al., 2023).

Epidemiología

  • infectiousR v0.1.0: Proporciona funciones para acceder a datos de enfermedades infecciosas en tiempo real desde la API disease.sh, incluyendo datos globales de COVID-19, cobertura de vacunación y datos de enfermedades similares a la gripe del CDC. También incluye conjuntos de datos curados sobre diversas enfermedades infecciosas.

  • rifttable v0.7.1: Automatiza la producción de tablas reproducibles y listas para presentación para epidemiólogos. Los usuarios pueden especificar diseños de tabla con filas y columnas definidas por exposiciones, modificadores de efecto y estimandos (Rothman, 2017).

Finanzas

  • fEGarch v1.01: Proporciona funciones para implementar y ajustar una variedad de modelos de memoria corta y larga de la amplia familia de modelos de heterocedasticidad condicional autorregresiva generalizada exponencial (EGARCH), incluyendo MEGARCH, FIEGARCH y FIMLog-GARCH.

Genómica

  • multiDEGGs 1.0.0: Ofrece funciones para realizar análisis de redes diferenciales multi-ómicas, identificando interacciones diferenciales entre entidades moleculares (genes, proteínas, factores de transcripción) a través de los conjuntos de datos ómicos proporcionados (Sciacca et al., 2023). Construye visualizaciones completas de redes diferenciales para cada conjunto de datos.

  • rsynthbio v2.0.0: Implementa un wrapper para la API Synthesize Bio, permitiendo a los usuarios generar datos realistas de expresión génica basados en condiciones biológicas especificadas. Los investigadores pueden acceder a datos transcriptómicos generados por IA para diversas modalidades, incluyendo RNA-seq masivo, RNA-seq de una sola célula y datos de micromatrices.

Lingüística

  • tidynorm v0.3.0: Implementa la normalización de vocales de hablantes de forma ordenada, ofreciendo funciones genéricas para definir nuevos métodos de normalización para puntos, pistas de formato y coeficientes de Transformada Coseno Discreta, junto con funciones de conveniencia para métodos establecidos (Johnson, 2020; Lobanov, 1971; Watt & Fabricius, 2002).

Aprendizaje Automático

  • midr v0.5.0: Implementa la Descomposición de Interpretación Máxima, una técnica de descomposición funcional que proporciona un método agnóstico al modelo para interpretar y explicar modelos predictivos de caja negra mediante la creación de un modelo sustituto globalmente interpretable (Asashiba et al., 2025).

Matemáticas

  • polarzonoid v0.1-2: Implementa aplicaciones del zonoid polar, una generalización del zonoedro polar en 3D, e incluye un solucionador de raíces para polinomios trigonométricos.

Estadística Médica

  • bbssr v1.0.2: Proporciona herramientas completas para la reestimación ciega del tamaño de muestra en ensayos clínicos de dos brazos con puntos finales binarios, permitiendo ajustes adaptativos del tamaño de muestra mientras se mantiene la integridad estadística y el cegamiento del estudio. Implementa cinco pruebas estadísticas exactas: chi-cuadrado de Pearson, exacta de Fisher, mid-p de Fisher, Z-pooled exacta incondicional y Boschloo exacta incondicional (Mehrotra et al., 2003; Kieser, 2020).

  • causens v0.0.3: Implementa métodos para el análisis de sensibilidad causal para ajustar posibles factores de confusión no medidos al trabajar con datos observacionales. Los métodos incluyen los desarrollados por Brumback et al. (2004), Li et al. (2011) y los enfoques bayesiano y Monte Carlo de McCandless et al. (2017).

  • door v0.0.2: Ofrece funciones para el diseño, análisis e interpretación de ensayos clínicos y otros estudios de investigación basados en la evaluación de riesgo-beneficio centrada en el paciente (Hamasaki & Evans, 2025).

Teoría Musical

  • musicMCT v0.2.0: Proporciona funciones para analizar escalas musicales utilizando la Teoría del Color Modal (Sherrill, 2025), trabajar con la teoría de la altura musical convencional y las geometrías continuas de Callender et al. (2008), e identificar propiedades estructurales de las escalas.

Redes

  • INetTool v0.1.1: Implementa métodos para modelar sistemas complejos como una red de consenso donde los nodos representan unidades estadísticas o variables observadas, y los bordes representan métricas de distancia o correlaciones entre unidades (Policastro et al., 2024).

Programación

  • putior v0.1.0: Proporciona herramientas para extraer y procesar anotaciones estructuradas de archivos fuente de R y Python para facilitar la visualización del flujo de trabajo. Escanea archivos en busca de anotaciones que definen nodos, conexiones y metadatos dentro de un flujo de trabajo de procesamiento de datos, generando representaciones visuales de flujos de datos a través de entornos de software políglotas (Knuth, 1984).

  • quickr v0.1.0: Ofrece funciones R compiladas anotadas con declaraciones de tipo y forma para un rendimiento rápido y una sólida verificación de tipo en tiempo de ejecución. Admite tanto la compilación Just-In-Time (JIT) como la Ahead-Of-Time (AOT) al reducir el código R a FORTRAN.

Estadística

  • aamatch v0.3.7: Implementa una versión simplificada de emparejamiento multivariado utilizando puntuaciones de propensión, emparejamiento casi exacto, equilibrio casi fino y emparejamiento robusto por distancia de Mahalanobis (Rosenbaum, 2020).

  • bayesmsm v1.0.0: Implementa modelos estructurales marginales bayesianos para la estimación del efecto causal con tratamiento y confusión que varían en el tiempo, incluyendo una extensión para el censoramiento derecho informativo (Saarela, 2015).

  • BCD v0.1.1: Implementa distribuciones binomiales, geométricas y de Poisson bivariadas basadas en especificaciones condicionales. Incluye herramientas para la generación de datos y pruebas de bondad de ajuste para estas tres familias de distribución (Ghosh et al., 2025; Ghosh et al., 2023; Ghosh et al., 202?).

  • lognGPD v0.1.0: Proporciona funciones para estimar un modelo de mezcla log-normal y Pareto generalizado mediante el algoritmo de Expectación-Maximización, junto con funciones para la simulación de números aleatorios y la evaluación de densidad (Bee & Santi, 2025).

  • QuantilePeer v0.0.1: Proporciona funciones para simular y estimar modelos de efecto de pares, incluyendo especificaciones basadas en cuantiles (Houndetoungan, 2025) y modelos con normas sociales basadas en la Elasticidad de Sustitución Constante (CES) (Boucher et al., 2024).

  • riskdiff v0.2.1: Ofrece funciones para calcular diferencias de riesgo (o diferencias de prevalencia para datos transversales) utilizando modelos lineales generalizados con selección automática de función de enlace (Austin, 2011; Donoghoe & Marschner, 2018).

  • survextrap v1.0: Proporciona funciones para el análisis de supervivencia utilizando modelos bayesianos para datos censurados por la derecha a nivel individual. Las funciones de riesgo se modelan con M-splines, y las distribuciones previas se pueden personalizar. Las distribuciones posteriores se estiman utilizando Stan (Jackson, 2023).

  • unsum v0.2.0: Reconstruye todos los datos brutos posibles que podrían haber llevado a las estadísticas resumidas reportadas, proporcionando un wrapper para la implementación en Rust del algoritmo CLOSURE.

Series Temporales

  • gseries v3.0.2: Proporciona funciones para mejorar la coherencia de los datos de series temporales utilizando métodos descritos por Dagum & Cholette (2006).

Utilidades

  • blocking v1.0.1: Ofrece métodos de bloqueo para el enlace de registros y la deduplicación utilizando algoritmos de vecinos más cercanos aproximados. Incluye funciones para generar shingles a partir de cadenas de caracteres, vectores de similitud para la comparación de registros y métricas de evaluación para evaluar el rendimiento del bloqueo (Papadakis et al., 2020; Steorts et al., 2014; Dasylva and Goussanou, 2021; Dasylva and Goussanou, 2022).

  • flir v0.5.0: Proporciona funciones para identificar y corregir “lints” (patrones de código ineficientes) en el código R.

Visualización

  • fractalforest v1.0.1: Proporciona funciones para crear y visualizar árboles fractales y bosques fractales basados en el sistema Lindenmayer (sistema L) (Lindenmayer, 1968a; Lindenmayer, 1968b).

  • ggtime v0.1.0: Extiende ggplot2 implementando una gramática de gráficos temporales y funciones de ayuda para visualizar patrones temporales en gráficos de series temporales, gráficos de tiempo, gráficos de temporada y gráficos de subseries estacionales.