Juni 2025: Top 40 neue R CRAN Pakete – KI & Daten-Tools im Fokus

Feedburner

Im Juni wurden 123 neue Pakete zu CRAN, dem umfassenden R-Archivnetzwerk, hinzugefügt. Aus dieser Sammlung wurden 40 bemerkenswerte Pakete in 21 verschiedenen Kategorien hervorgehoben, darunter KI, Schach, Computergestützte Methoden, Daten, Entscheidungsanalyse, Ökologie, Epidemiologie, Finanzen, Genomik, Linguistik, Maschinelles Lernen, Mathematik, Medizinische Statistik, Musiktheorie, Netzwerke, Programmierung, Statistik, Zeitreihen, Dienstprogramme und Visualisierung.

KI

  • statlingua v0.1.0: Ermöglicht die Umwandlung komplexer statistischer Ergebnisse in klare, kontextbezogene natürliche Sprachbeschreibungen mithilfe großer Sprachmodelle (LLMs). Es integriert sich mit beliebten LLM-Anbietern wie OpenAI, Google AI Studio und Anthropic.

  • vitals v0.1.0: Bietet eine R-Portierung von Inspect, einem weit verbreiteten Python-Framework zur Bewertung großer Sprachmodelle. Dieses Paket unterstützt Prompt-Engineering, Werkzeugnutzung, Mehrrunden-Dialoge und modellgestufte Evaluierungen, speziell entwickelt für ellmer-Benutzer zur Bewertung ihrer LLM-basierten Produkte.

Schach

  • chess2plyrs v0.3.0: Implementiert ein Schachprogramm basierend auf der Minimax-Schachengine, das Benutzern ermöglicht, Spiele zu erstellen und FEN-Daten (Forsyth-Edwards Notation) zu verwalten.

Computergestützte Methoden

  • tvdenoising v1.0.0: Implementiert die Total-Variation-Denoising, eine Methode zur Approximation von verrauschten Datenreihen mit stückweise konstanten Funktionen, die adaptiv gewählte Haltepunkte aufweisen (Johnson, 2013).

  • wideRhino v1.0.2: Bietet Funktionen zur Konstruktion kanonischer Variatenanalyse-Biplots unter Verwendung der Generalisierten Singulärwertzerlegung. Dies ist besonders nützlich, wenn die Anzahl der Stichproben kleiner ist als die Anzahl der Variablen (Gower et al., 2011; Edelman & Wang, 2020).

Daten

  • avilistr v0.0.1: Bietet einfachen Zugang zur AviList Global Avian Checklist, einer vereinheitlichten globalen Vogel-Taxonomie, die Unterschiede zwischen großen ornithologischen Checklisten (International Ornithological Committee, Clements und BirdLife) harmonisiert.

  • ecoteach v0.1.0: Eine Sammlung kuratierter Bildungsdatensätze für den Unterricht von Ökologie- und Agrarkonzepten. Sie enthält dokumentierte Daten aus veröffentlichten wissenschaftlichen Studien zur Wildtierüberwachung, Pflanzenbehandlungen und ökologischen Beobachtungen.

  • jpinfect v0.1.2: Bietet Funktionen zum Herunterladen und Nachbearbeiten von Fallzahlen für Infektionskrankheiten vom Japan Institute for Health Security.

  • LBDiscover v0.1.0: Eine Suite von Tools für die literatur-basierte Entdeckung in der biomedizinischen Forschung. Sie umfasst Funktionen zum Abrufen wissenschaftlicher Artikel aus PubMed und anderen NCBI-Datenbanken, zum Extrahieren biomedizinischer Entitäten, zum Aufbau von Kookkurrenz-Netzwerken und zur Anwendung verschiedener Entdeckungsmodelle.

  • Rdatasets v0.0.1: Bietet Funktionen zum Suchen, Herunterladen und Anzeigen von Dokumentationen für Tausende von Datensätzen aus R-Paketen, die im Rdatasets-Archiv enthalten sind und sowohl im CSV- als auch im Parquet-Format verfügbar sind.

Entscheidungsanalyse

  • RMCDA v0.3: Implementiert verschiedene Methoden zur Unterstützung der Mehrkriterien-Entscheidungsfindung (MCDM), einschließlich AHP, TOPSIS, PROMETHEE, VIKOR, Stratified MCDM und der Stratified Best–Worst Method (Najafi & Mirzaei, 2025).

Ökologie

  • climodr v1.0.0: Bietet Tools zur Automatisierung von Workflows für die prädiktive Klimakartierung unter Verwendung von Klimastationsdaten und zur Erstellung reproduzierbarer Klimamodelle (Meyer, 2019; Meyer, 2022).

  • movedesign v0.3.1: Bietet eine Toolbox und eine Shiny-Anwendung zur Unterstützung von Forschern bei der Gestaltung von Bewegungsökologie-Studien. Der Fokus liegt auf der Schätzung von Tierheimatgebieten und feinräumigen Bewegungsverhalten wie Geschwindigkeit und zurückgelegter Strecke (Silva et al., 2023).

Epidemiologie

  • infectiousR v0.1.0: Bietet Funktionen zum Zugriff auf Echtzeitdaten zu Infektionskrankheiten von der disease.sh API, einschließlich globaler COVID-19-Daten, Impfquoten und Grippe-ähnlicher Erkrankungsdaten vom CDC. Es enthält auch kuratierte Datensätze zu verschiedenen Infektionskrankheiten.

  • rifttable v0.7.1: Automatisiert die Erstellung reproduzierbarer, präsentationsfertiger Tabellen für Epidemiologen. Benutzer können Tabellendesigns mit Zeilen und Spalten festlegen, die durch Expositionen, Effektmodifikatoren und Schätzer definiert sind (Rothman, 2017).

Finanzen

  • fEGarch v1.01: Bietet Funktionen zur Implementierung und Anpassung einer Vielzahl von Kurzzeit- und Langzeitmodellen aus der breiten Familie der Exponential Generalized Autoregressive Conditional Heteroskedasticity (EGARCH)-Modelle, einschließlich MEGARCH, FIEGARCH und FIMLog-GARCH.

Genomik

  • multiDEGGs 1.0.0: Bietet Funktionen zur Durchführung von Multi-Omics-Differenznetzwerkanalysen, die differenzielle Interaktionen zwischen molekularen Entitäten (Gene, Proteine, Transkriptionsfaktoren) über die bereitgestellten Omics-Datensätze identifizieren (Sciacca et al., 2023). Es erstellt umfassende Visualisierungen von Differenznetzwerken für jeden Datensatz.

  • rsynthbio v2.0.0: Implementiert einen Wrapper für die Synthesize Bio API, der es Benutzern ermöglicht, realistische Genexpressionsdaten basierend auf spezifischen biologischen Bedingungen zu generieren. Forscher können auf KI-generierte Transkriptomdaten für verschiedene Modalitäten zugreifen, einschließlich Bulk-RNA-seq, Einzelzell-RNA-seq und Microarray-Daten.

Linguistik

  • tidynorm v0.3.0: Implementiert die saubere Sprechervokalnormalisierung und bietet generische Funktionen zur Definition neuer Normalisierungsmethoden für Punkte, Formatspuren und Diskrete-Kosinus-Transformation-Koeffizienten, zusammen mit Komfortfunktionen für etablierte Methoden (Johnson, 2020; Lobanov, 1971; Watt & Fabricius, 2002).

Maschinelles Lernen

  • midr v0.5.0: Implementiert die Maximale Interpretationszerlegung, eine funktionale Zerlegungstechnik, die eine modellunabhängige Methode zur Interpretation und Erklärung von Black-Box-Vorhersagemodellen durch die Erstellung eines global interpretierbaren Ersatzmodells bietet (Asashiba et al., 2025).

Mathematik

  • polarzonoid v0.1-2: Implementiert Anwendungen des Polaren Zonoids, einer Verallgemeinerung des Polaren Zonoeders in 3D, und enthält einen Wurzel-Solver für trigonometrische Polynome.

Medizinische Statistik

  • bbssr v1.0.2: Bietet umfassende Tools zur verblindeten Stichprobenumfangs-Neuschätzung in zweiarmigen klinischen Studien mit binären Endpunkten, die adaptive Stichprobenanpassungen ermöglichen, während die statistische Integrität und die Studienverblindung erhalten bleiben. Es implementiert fünf exakte statistische Tests: Pearson-Chi-Quadrat, Fisher-Exakt, Fisher-Mid-p, Z-pooled exakt unbedingter und Boschloo exakt unbedingter Tests (Mehrotra et al., 2003; Kieser, 2020).

  • causens v0.0.3: Implementiert Methoden zur kausalen Sensitivitätsanalyse, um bei der Arbeit mit Beobachtungsdaten potenzielle ungemessene Störfaktoren zu berücksichtigen. Die Methoden umfassen die von Brumback et al. (2004), Li et al. (2011) entwickelten sowie die Bayes’schen und Monte-Carlo-Ansätze von McCandless et al. (2017).

  • door v0.0.2: Bietet Funktionen für das Design, die Analyse und die Interpretation von klinischen Studien und anderen Forschungsstudien, basierend auf einer patientenzentrierten Nutzen-Risiko-Bewertung (Hamasaki & Evans, 2025).

Musiktheorie

  • musicMCT v0.2.0: Bietet Funktionen zur Analyse musikalischer Skalen mithilfe der Modal Color Theory (Sherrill, 2025), zur Arbeit mit der konventionellen Musiktonhöhentheorie und den kontinuierlichen Geometrien von Callender et al. (2008) sowie zur Identifizierung struktureller Eigenschaften von Skalen.

Netzwerke

  • INetTool v0.1.1: Implementiert Methoden zur Modellierung komplexer Systeme als Konsensnetzwerk, wobei Knoten statistische Einheiten oder beobachtete Variablen darstellen und Kanten Distanzmetriken oder Korrelationen zwischen Einheiten darstellen (Policastro et al., 2024).

Programmierung

  • putior v0.1.0: Bietet Tools zum Extrahieren und Verarbeiten strukturierter Anmerkungen aus R- und Python-Quelldateien, um die Workflow-Visualisierung zu erleichtern. Es scannt Dateien nach Anmerkungen, die Knoten, Verbindungen und Metadaten innerhalb eines Datenverarbeitungsworkflows definieren, und generiert visuelle Darstellungen von Datenflüssen über polyglotte Softwareumgebungen hinweg (Knuth, 1984).

  • quickr v0.1.0: Bietet kompilierte R-Funktionen, die mit Typ- und Shape-Deklarationen versehen sind, für schnelle Leistung und robuste Laufzeit-Typüberprüfung. Es unterstützt sowohl die Just-In-Time- (JIT) als auch die Ahead-Of-Time- (AOT) Kompilierung durch Herabstufung von R-Code zu FORTRAN.

Statistik

  • aamatch v0.3.7: Implementiert eine vereinfachte Version des multivariaten Abgleichs unter Verwendung von Propensity Scores, nahezu exaktem Abgleich, nahezu feiner Balance und robustem Mahalanobis-Distanz-Abgleich (Rosenbaum, 2020).

  • bayesmsm v1.0.0: Implementiert Bayes’sche Marginal Structural Models zur Schätzung kausaler Effekte bei zeitvariabler Behandlung und Konfundierung, einschließlich einer Erweiterung für informatives rechtes Zensieren (Saarela, 2015).

  • BCD v0.1.1: Implementiert bivariate Binomial-, Geometrie- und Poisson-Verteilungen basierend auf bedingten Spezifikationen. Es enthält Tools zur Datengenerierung und Güte-der-Anpassung-Tests für diese drei Verteilungsfamilien (Ghosh et al., 2025; Ghosh et al., 2023; Ghosh et al., 202?).

  • lognGPD v0.1.0: Bietet Funktionen zur Schätzung eines lognormalen, verallgemeinerten Pareto-Mischmodells über den Expectation-Maximization-Algorithmus, zusammen mit Funktionen zur Zufallszahlensimulation und Dichteberechnung (Bee & Santi, 2025).

  • QuantilePeer v0.0.1: Bietet Funktionen zur Simulation und Schätzung von Peer-Effekt-Modellen, einschließlich quantilbasierter Spezifikationen (Houndetoungan, 2025) und Modellen mit sozialen Normen basierend auf konstanter Substitutionselastizität (CES) (Boucher et al., 2024).

  • riskdiff v0.2.1: Bietet Funktionen zur Berechnung von Risikodifferenzen (oder Prävalenzdifferenzen für Querschnittsdaten) unter Verwendung generalisierter linearer Modelle mit automatischer Linkfunktionsauswahl (Austin, 2011; Donoghoe & Marschner, 2018).

  • survextrap v1.0: Bietet Funktionen für die Überlebenszeitanalyse unter Verwendung Bayes’scher Modelle für individuelle rechtszensierte Daten. Hazard-Funktionen werden mit M-Splines modelliert, und Prior-Verteilungen können angepasst werden. Posterior-Verteilungen werden mit Stan geschätzt (Jackson, 2023).

  • unsum v0.2.0: Rekonstruiert alle möglichen Rohdaten, die zu den gemeldeten Zusammenfassungsstatistiken geführt haben könnten, und bietet einen Wrapper für die Rust-Implementierung des CLOSURE-Algorithmus.

Zeitreihen

  • gseries v3.0.2: Bietet Funktionen zur Verbesserung der Kohärenz von Zeitreihendaten unter Verwendung der von Dagum & Cholette (2006) beschriebenen Methoden.

Dienstprogramme

  • blocking v1.0.1: Bietet Blocking-Methoden für die Datensatzverknüpfung und Deduplizierung unter Verwendung von Algorithmen für ungefähre nächste Nachbarn. Es enthält Funktionen zum Generieren von Shingles aus Zeichenketten, Ähnlichkeitsvektoren für den Datensatzvergleich und Bewertungsmetriken zur Beurteilung der Blocking-Leistung (Papadakis et al., 2020; Steorts et al., 2014; Dasylva and Goussanou, 2021; Dasylva and Goussanou, 2022).

  • flir v0.5.0: Bietet Funktionen zum Identifizieren und Korrigieren von “lints” (ineffizienten Code-Mustern) in R-Code.

Visualisierung

  • fractalforest v1.0.1: Bietet Funktionen zum Erstellen und Visualisieren von Fraktalbäumen und Fraktalwäldern basierend auf dem Lindenmayer-System (L-System) (Lindenmayer, 1968a; Lindenmayer, 1968b).

  • ggtime v0.1.0: Erweitert ggplot2 durch die Implementierung einer Grammatik temporaler Grafiken und Hilfsfunktionen zur Visualisierung temporaler Muster in Zeitreihengrafiken, Zeitplots, Saisonplots und saisonalen Unterreihenplots.