LangExtract:AIが診療記録を構造化データに変革

Towardsdatascience

広大で複雑な医療の世界では、重要な患者データの大部分が非構造化テキスト、主に診療記録の中に埋もれたままになっています。これらの文書は、しばしば長く、略語、矛盾、医療専門用語で満たされており、データ抽出と分析に手ごわい課題を提示します。薬剤名、投薬量、そして特に有害事象(ADR)などの重要な詳細が、テキストの氾濫の中で見失われがちで、迅速な検出と対応が困難です。この課題に対処するため、Googleの開発者はLangExtractを導入しました。これは、大規模言語モデル(LLM)の力を活用して、煩雑な非構造化テキストをクリーンな構造化データに変換するために設計された新しいオープンソースプロジェクトです。Googleの開発者によって開発されましたが、LangExtractはGoogleが公式にサポートする製品ではないことに注意することが重要です。

有害事象のタイムリーな検出は、患者の安全とより広範な医薬品安全性監視の分野にとって極めて重要です。ADRとは、薬剤の使用によって生じる有害で意図しない結果のことで、吐き気のような軽度の副作用から、即時の医療処置を必要とする重篤な結果まで多岐にわたります。これらの反応を迅速に特定することは不可欠ですが、診療記録では、ADRは患者の病歴、検査結果、その他の文脈情報と絡み合っていることが多く、手動での抽出は骨が折れ、エラーが発生しやすいプロセスです。LLMはADR検出のための活発な研究分野ですが、最近の研究では、潜在的な問題を効果的に特定できるものの、決定的な抽出にはまだ信頼できる精度ではないことが示されています。このため、ADR抽出はLangExtractにとって優れたストレステストとなり、他の多くの医療エンティティの中から特定の有害事象を特定する能力を評価できます。

LangExtractは、シンプルな3ステップのワークフローで動作します。ユーザーはまず、抽出したい正確な情報を指定する、明確で記述的なプロンプトを通じて抽出タスクを定義します。次に、「Few-shot学習例」として知られるいくつかの高品質な例を提供します。これらは、モデルが出力に必要な形式と詳細レベルを理解するためのガイドとなります。最後に、ユーザーは入力テキストを送信し、好みのLLM(独自のAPIベースのモデルまたはOllamaなどのプラットフォームを介したローカルモデルのいずれか)を選択し、LangExtractにデータを処理させます。結果として得られる構造化データは、その後レビュー、視覚化、またはダウンストリームの分析パイプラインに直接統合することができます。このツールの汎用性は診療記録を超えており、文学テキストからのエンティティ抽出から放射線レポートの構造化まで多岐にわたる例があります。

臨床環境でのその能力を実証するために、LangExtractはGoogleのGemini 2.5 Flashモデルを使用してADRを特定する能力についてテストされました。抽出タスクは明確に定義されました:薬剤、投薬量、有害事象、および取られた措置を抽出し、言及されている場合は反応の重症度を属性として含めること。特に、プロンプトはモデルに対し、元のメモから正確なテキストスパンを使用し、言い換えを避け、エンティティを出現順に返すよう指示しました。指導例も提供され、「イブプロフェン400mg」が「軽度の胃痛」を引き起こし、患者が「薬を中止した」という詳細なメモがどのように構造化されるべきかが示されました。ADE Corpus v2データセットからの実際の臨床文が提示された際、LangExtractは患者の既存の病状と混同することなく、有害事象を成功裏に特定しました。これはこのようなタスクにおける一般的な障害です。

実際の診療記録は、単純な文よりもはるかに長いことがよくあります。LangExtractは、パフォーマンスを向上させるための特定のパラメータを提供することで、これらの拡張されたテキストに対応します。extraction_passes は、テキストの複数回のスキャンを可能にし、リコールを改善し、より微妙な詳細を捉えます。max_workers は並列処理を容易にし、より大きな文書の迅速な処理を可能にします。一方、max_char_buffer はテキストをより小さく、管理しやすいチャンクに分割し、非常に長い入力でもモデルが精度を維持するのに役立ちます。さらに、LangExtractはOllamaを介してローカルLLMと連携する柔軟性を提供します。これは、安全なオンプレミス環境から出ることができないプライバシーに敏感な臨床データを扱う組織にとって大きな利点です。

要約すると、LangExtractは非構造化された診療記録を実行可能な構造化データに変換するための有望なソリューションを提供し、情報検索システムやメタデータ抽出アプリケーションにとってかなりの前処理作業を節約します。ADR実験でのその性能は奨励されるものであり、薬剤、投薬量、および反応を正確に特定しました。しかし、抽出された出力の品質は、提供されたFew-shot学習例の品質に直接影響されるため、人間の専門知識がループ内で不可欠な要素であることに変わりはありません。初期の結果は肯定的ですが、臨床データの高リスクな性質は、LangExtractが本番環境で広く採用される前に、多様なデータセットにわたるより広範で厳格なテストを必要とします。