AIによる法律報告書：証拠力をどう検証するか？

警察署やその他の機関による人工知能の採用が拡大していることは、報告書や法的記述の生成において、証拠の性質に関する重大な疑問を提起しています。伝統的に、警察報告書、保険金請求、法的声明などの文書は、人間の観察、証言、または直接経験に基づいています。しかし、AIシステムは現在、ボディカメラの音声、警察官の口述、メタデータなどの入力から完全な書面報告書を作成しています。これらのシステムは速度、標準化、一貫性を提供する一方で、人間の著者とは根本的に異なります。彼らは、記述する出来事を直接目撃したことがありません。

この変化は、人間が直接知覚することなく、法的に大きな重みを持つ言語が生成されていることを意味します。これらのAI生成報告書は、因果関係の記述、証拠への言及、行動の記述など、法的証言の権威あるトーンをしばしば模倣します。これは、重要な法的および倫理的ジレンマを引き起こします。人間が実際に発言したり、記述された出来事を目撃したり、その生成をレビューしたりしていなくても、その文は証拠と見なせるのでしょうか？憂慮すべきことに、答えはしばしば「はい」であり、法的および行政的文脈において潜在的に問題のある影響をもたらします。

最近発表された論文「予測的証言：AI生成警察報告書と司法記述におけるコンパイルされた構文」は、これらのAIシステムがどのように「コンパイルされた構文エンジン」として機能するかを深く掘り下げています。これは、事前定義された言語規則、テンプレート、文法構造を適用して、生の、しばしば非構造化された入力を、洗練された法的に響くテキストに変換することを意味します。このプロセスにおいて、論文は「オペレーター条件付き証拠」と呼ばれるものの導入を特定しています。これは、AIによって行われる微妙な選択であり、文の認識される権威、確実性、解釈を著しく変更する可能性があります。

論文は、報告書が証拠として機能する方法に影響を与える6つの主要な「オペレーター」を強調しています。

エージェント削除（Agent Deletion）：行動を実行する主体を削除し、誰が何をしたかを不明瞭にする。
モダル減衰（Modal Attenuation）：「かもしれない」「あり得る」「どうやら」といった、より弱く、明確でない用語で強い主張を置き換える。
証拠フレーム挿入（Evidential Frame Insertion）：「記録によると…」といったフレーズを追加するが、基礎となる記録自体へのアクセスは提供しない。
時間的アンカーシフト（Temporal Anchoring Shift）：イベントの報告時間を、実際の発生時ではなく、システムの処理時間に合わせて変更する。
連続名詞化（Serial Nominalization）：動的な行動を静的な名詞に変換し、イベントを非人格化する。
準引用（Quasi Quotation）：言い換えられた陳述を直接引用のように聞かせ、元の意図や文脈を潜在的に変更する。

これらの言語操作のそれぞれが、報告書内で責任、確実性、因果関係がどのように理解されるかを微妙に形成し、単なる記述を超えて認識に影響を与えることができます。

これらのAI生成報告書の影響は甚大であり、逮捕、保険金請求の却下、法廷への提出など、現実世界の意思決定に積極的に使用されています。多くの場合、これらの文が生成されるプロセスは検証されません。例えば、「命令が出された後、被験者は拘束された」という文は、誰が命令を出したか、またはその命令が何であったかについての重要な詳細を欠いています。同様に、「システム記録によると、容疑者は関与を否定した」という文は、これらの「システム記録」の場所と検証可能性、および実際に誰が否定を聞いたかについての疑問を提起します。「強制侵入があったかもしれない」というフレーズは、推定原因と単なる憶測との境界を曖昧にします。

このような言語は、まさに「正しい響き」を持ち、機関の期待に沿うため、法制度内で異議なく通用することがあります。しかし、それは構造的に空虚であり、明確な主体、検証可能な情報源、または現実における確固たるアンカーを欠いている可能性があります。

AI生成報告書の禁止を提唱するのではなく、論文はより実践的な解決策を提案しています。それは、構文を監査可能にすることです。報告書がその生データから最終形式へと進化する過程を追跡するための4段階の経路を概説しています。

入力ストリーム（Input Stream）：音声記録、タイムログ、フォームなどの初期生データ。
コンパイルログ（Compilation Log）：テキストを生成するために使用されたシステムの内部プロセスと規則の記録。
オペレータートレース（Operator Trace）：どの特定の言語オペレーターが、テキスト内のどこで適用されたかの特定。
証拠表面（Evidentiary Surface）：最終的な、洗練された報告書。

このフレームワークにより、機関は特定の文がどのように構築されたかを追跡し、どのオペレーターがその表現に影響を与えたかを特定し、結果として生じる証拠の弱点を評価することができます。論文はまた、スクリーニングテストを提案しています。既知の発言者がいない、検証不能な情報源を引用している、または時間参照のずれを示している条項は、フラグを立て、修正するか、考慮から除外すべきです。

このアプローチは革新的です。なぜなら、AIの「意図」（AIには意図がない）を推測しようとはしないからです。代わりに、生成された言語の客観的な構造に焦点を当て、各文を一つの行動として扱います。もし構造が、基礎となる実体なしに証拠の外観を作り出すならば、その構造は厳密にテストされなければなりません。この解決策は、弁護士、裁判官、エンジニア、倫理学者に広く適用可能であり、そして重要なことに、既存の自動化されたワークフローを解体する必要はありません。なぜなら、ログ、プロンプト、編集履歴など、必要とされる多くの成果物はすでにこれらのシステム内に存在しているからです。鍵は、それらを活用して透明性と説明責任を強化することです。

AIによる法律報告書：証拠力をどう検証するか？

関連記事

AIによる剽窃：学術界における「思考の外注」と「幻覚」

リーダーの個人AI利用が急増、職場導入はなぜ遅れる？

衝撃！豪州の著作権方針：AIにコンテンツ無料提供か