2025年6月R CRAN新着パッケージ トップ40:AI・データツールに注目

Feedburner

2025年6月、包括的なRアーカイブネットワークであるCRANに123の新しいパッケージが追加されました。このコレクションから、AI、チェス、計算手法、データ、意思決定分析、生態学、疫学、金融、ゲノミクス、言語学、機械学習、数学、医療統計、音楽理論、ネットワーク、プログラミング、統計、時系列、ユーティリティ、視覚化を含む21の多様なカテゴリにわたる注目すべき40のパッケージがハイライトされています。

AI

  • statlingua v0.1.0: 大規模言語モデル(LLM)を使用して、複雑な統計結果を明確で状況に応じた自然言語記述に変換することを容易にします。OpenAI、Google AI Studio、Anthropicなどの人気LLMプロバイダーと統合されています。

  • vitals v0.1.0: 大規模言語モデルの評価に広く採用されているPythonフレームワークInspectのRポートを提供します。このパッケージは、プロンプトエンジニアリング、ツール利用、多ターン対話、モデル採点評価をサポートしており、ellmerユーザーがLLMベースの製品を評価するために特別に設計されています。

チェス

  • chess2plyrs v0.3.0: Minimaxチェスエンジンに基づいたチェスプログラムを実装し、ユーザーがゲームを作成し、FEN(Forsyth-Edwards Notation)データを管理できるようにします。

計算手法

  • tvdenoising v1.0.0: 全変動ノイズ除去を実装しています。これは、適応的に選択されたブレークポイントを持つ区分的定数関数でノイズの多いデータシーケンスを近似する方法です(Johnson, 2013)。

  • wideRhino v1.0.2: 一般化特異値分解を用いて正規変量分析バイプロットを構築する関数を提供します。これは、サンプル数が変数数よりも少ない場合に特に有用です(Gower et al., 2011; Edelman & Wang, 2020)。

データ

  • avilistr v0.0.1: 主要な鳥類チェックリスト(International Ornithological Committee、Clements、BirdLife)間の違いを調和させる統一されたグローバル鳥類分類法であるAviList Global Avian Checklistに簡単にアクセスできます。

  • ecoteach v0.1.0: 生態学と農業の概念を教えるための厳選された教育用データセットのコレクションです。野生生物モニタリング、植物処理、生態学的観察に関する公開された科学研究からの文書化されたデータが含まれています。

  • jpinfect v0.1.2: 日本保健安全保障研究所から感染症の症例データをダウンロードし、後処理するための関数を提供します。

  • LBDiscover v0.1.0: 生物医学研究における文献ベースの発見のためのツールスイートです。PubMedおよびその他のNCBIデータベースから科学記事を取得し、生物医学的エンティティを抽出し、共起ネットワークを構築し、さまざまな発見モデルを適用するための関数が含まれています。

  • Rdatasets v0.0.1: Rdatasetsアーカイブに含まれるRパッケージからの数千のデータセットを検索、ダウンロード、およびドキュメントを表示するための関数を提供し、CSVおよびParquet形式で利用できます。

意思決定分析

  • RMCDA v0.3: AHP、TOPSIS、PROMETHEE、VIKOR、層化MCDM、および層化最良-最悪法(Najafi & Mirzaei, 2025)を含む、多基準意思決定(MCDM)をサポートするためのさまざまな方法を実装しています。

生態学

  • climodr v1.0.0: 気象観測所データを使用して予測気候マッピングのワークフローを自動化し、再現可能な気候モデルを作成するためのツールを提供します(Meyer, 2019; Meyer, 2022)。

  • movedesign v0.3.1: 移動生態学研究の設計を支援するためのツールボックスとShinyアプリケーションを提供します。動物の生息域面積や、速度や移動距離などの微細な移動行動の推定に焦点を当てています(Silva et al., 2023)。

疫学

  • infectiousR v0.1.0: disease.sh APIからリアルタイムの感染症データにアクセスするための関数を提供します。これには、世界のCOVID-19データ、ワクチン接種率、CDCからのインフルエンザ様疾患データが含まれます。また、さまざまな感染症に関する厳選されたデータセットも含まれています。

  • rifttable v0.7.1: 疫学者のための再現可能で提示準備の整ったテーブルの作成を自動化します。ユーザーは、暴露、効果修飾因子、推定値によって定義された行と列を持つテーブルデザインを指定できます(Rothman, 2017)。

金融

  • fEGarch v1.01: MEGARCH、FIEGARCH、FIMLog-GARCHを含む、広範な指数型一般化自己回帰条件付き異分散性(EGARCH)モデルファミリーのさまざまな短期記憶および長期記憶モデルを実装および適合させるための関数を提供します。

ゲノミクス

  • multiDEGGs 1.0.0: 提供されたオミックスデータセット(遺伝子、タンパク質、転写因子)間で分子エンティティ間の差分相互作用を特定するマルチオミックス差分ネットワーク分析を実行するための関数を提供します(Sciacca et al., 2023)。各データセットの差分ネットワークの包括的な視覚化を構築します。

  • rsynthbio v2.0.0: Synthesize Bio APIのラッパーを実装しており、ユーザーが指定された生物学的条件に基づいて現実的な遺伝子発現データを生成できるようにします。研究者は、バルクRNA-seq、シングルセルRNA-seq、マイクロアレイデータを含むさまざまなモダリティのAI生成トランスクリプトームデータにアクセスできます。

言語学

  • tidynorm v0.3.0: 整然とした話者母音正規化を実装し、点、フォーマットトラック、離散コサイン変換係数に対する新しい正規化方法を定義するための汎用関数と、確立された方法に対する便利な関数を提供します(Johnson, 2020; Lobanov, 1971; Watt & Fabricius, 2002)。

機械学習

  • midr v0.5.0: 最大解釈分解を実装しています。これは、グローバルに解釈可能な代替モデルを作成することで、ブラックボックス予測モデルを解釈および説明するためのモデルに依存しない方法を提供する機能分解手法です(Asashiba et al., 2025)。

数学

  • polarzonoid v0.1-2: 3Dにおける極ゾノヘドロンの一般化である極ゾノイドの応用を実装し、三角多項式の根ソルバーを含みます。

医療統計

  • bbssr v1.0.2: 二腕臨床試験における二値エンドポイントを用いた盲検下サンプルサイズ再推定のための包括的なツールを提供し、統計的整合性と研究の盲検性を維持しながら、適応的なサンプルサイズ調整を可能にします。Pearsonカイ二乗検定、Fisherの正確確率検定、Fisherのmid-p検定、Z-pooledの正確無条件検定、Boschlooの正確無条件検定の5つの正確な統計検定を実装しています(Mehrotra et al., 2003; Kieser, 2020)。

  • causens v0.0.3: 観測データを取り扱う際に、潜在的な未測定交絡因子を調整するための因果感度分析手法を実装しています。手法には、Brumback et al. (2004)、Li et al. (2011)によって開発されたもの、およびMcCandless et al. (2017)のベイジアンおよびモンテカルロアプローチが含まれます。

  • door v0.0.2: 患者中心のベネフィット-リスク評価に基づいた臨床試験およびその他の研究の設計、分析、解釈のための関数を提供します(Hamasaki & Evans, 2025)。

音楽理論

  • musicMCT v0.2.0: モーダルカラー理論(Sherrill, 2025)を用いて音階を分析し、Callender et al. (2008)の従来の音楽音高理論と連続幾何学を扱い、音階の構造的特性を特定するための関数を提供します。

ネットワーク

  • INetTool v0.1.1: ノードが統計単位または観測変数を表し、エッジが単位間の距離メトリックまたは相関を表すコンセンサスネットワークとして複雑なシステムをモデル化する方法を実装しています(Policastro et al., 2024)。

プログラミング

  • putior v0.1.0: RおよびPythonのソースファイルから構造化されたアノテーションを抽出し処理するためのツールを提供し、ワークフローの可視化を容易にします。データ処理ワークフロー内のノード、接続、メタデータを定義するアノテーションをファイルからスキャンし、多言語ソフトウェア環境全体でのデータフローの視覚的表現を生成します(Knuth, 1984)。

  • quickr v0.1.0: 型および形状宣言が付けられたコンパイル済みR関数を提供し、高速なパフォーマンスと堅牢な実行時型チェックを実現します。RコードをFORTRANに変換することで、ジャストインタイム(JIT)コンパイルと事前(AOT)コンパイルの両方をサポートします。

統計

  • aamatch v0.3.7: 傾向スコア、ニアエグザクトマッチング、ニアファインバランス、ロバストマハラノビス距離マッチングを用いた多変量マッチングの簡易版を実装しています(Rosenbaum, 2020)。

  • bayesmsm v1.0.0: 時間変動する治療および交絡因子を伴う因果効果推定のためのベイジアン周辺構造モデルを実装しており、情報性右側打ち切りに対する拡張も含まれます(Saarela, 2015)。

  • BCD v0.1.1: 条件付き仕様に基づいた二変量二項分布、幾何分布、およびポアソン分布を実装しています。これら3つの分布族のデータ生成および適合度検定のためのツールが含まれています(Ghosh et al., 2025; Ghosh et al., 2023; Ghosh et al., 202?)。

  • lognGPD v0.1.0: 期待値最大化アルゴリズムを介して対数正規分布-一般化パレート混合モデルを推定するための関数と、乱数シミュレーションおよび密度評価のための関数を提供します(Bee & Santi, 2025)。

  • QuantilePeer v0.0.1: 分位数ベースの仕様(Houndetoungan, 2025)や定数代替弾力性(CES)ベースの社会的規範を持つモデル(Boucher et al., 2024)を含む、ピア効果モデルをシミュレートおよび推定するための関数を提供します。

  • riskdiff v0.2.1: 自動リンク関数選択を備えた一般化線形モデルを使用して、リスク差(または横断データの場合の有病率差)を計算するための関数を提供します(Austin, 2011; Donoghoe & Marschner, 2018)。

  • survextrap v1.0: 個人レベルの右側打ち切りデータに対するベイジアンモデルを用いた生存分析のための関数を提供します。ハザード関数はM-スプラインでモデル化され、事前分布はカスタマイズ可能です。事後分布はStanを使用して推定されます(Jackson, 2023)。

  • unsum v0.2.0: 報告された要約統計量に繋がる可能性のあるすべての生データを再構築し、CLOSUREアルゴリズムのRust実装のラッパーを提供します。

時系列

  • gseries v3.0.2: Dagum & Cholette (2006)によって記述された方法を用いて、時系列データの一貫性を向上させるための関数を提供します。

ユーティリティ

  • blocking v1.0.1: 近似最近傍アルゴリズムを用いたレコードリンケージおよび重複排除のためのブロッキングメソッドを提供します。文字列からシャングルを生成する関数、レコード比較のための類似度ベクトル、ブロッキング性能を評価するための評価指標が含まれています(Papadakis et al., 2020; Steorts et al., 2014; Dasylva and Goussanou, 2021; Dasylva and Goussanou, 2022)。

  • flir v0.5.0: Rコード内の「lints」(非効率なコードパターン)を特定し修正するための関数を提供します。

可視化

  • fractalforest v1.0.1: リンデンマイヤーシステム(L-system)に基づいて、フラクタルツリーとフラクタルフォレストを作成および視覚化するための関数を提供します(Lindenmayer, 1968a; Lindenmayer, 1968b)。

  • ggtime v0.1.0: ggplot2を拡張し、時間系列グラフ、時間プロット、季節プロット、季節サブシリーズプロットにおける時間パターンを視覚化するための時間グラフィックスの文法とヘルパー関数を実装しています。