AWS自動推論:AIの「幻覚」を99%の精度で防ぐ
アマゾン ウェブ サービス (AWS) は、Amazon Bedrock Guardrailsポリシーシステムの大幅な強化となる「自動推論チェック」の一般提供を開始しました。この新機能は、基盤モデルによって生成されたコンテンツを特定のドメイン知識と照合して堅牢に検証することで、AIの「幻覚」、すなわち事実に基づかない不正確な情報や意味不明な出力という喫緊の課題に直接対処します。その目的は、特に精度が最重要視される分野において、AIアプリケーションの信頼性と安定性を強化することです。
結果の可能性を評価する従来の確率的推論方法とは異なり、自動推論チェックは数学的論理と形式検証技術を採用しています。このアプローチにより、AIの応答を厳密にチェックするための明確なルールとパラメーターが確立され、証明可能な精度保証が提供されます。このシステムは、最大99%という驚異的な検証精度を誇り、モデルの出力が複数の解釈を許すような曖昧な場合でも、その曖昧さを検出するのに役立ちます。
今回の一般提供リリースでは、これらのチェックの実装と管理を効率化するために設計されたいくつかの主要機能が導入されています。ユーザーは、1回のビルドで最大80,000トークン(約100ページ分のコンテンツに相当)の大規模なドキュメントをサポートし、広範なドキュメントを処理できるようになりました。ポリシーの検証は簡素化され、ユーザーは検証テストを保存して繰り返し実行できるため、長期的なメンテナンスが容易になります。さらに、システムはユーザー定義のパラメーターからテストシナリオを自動的に生成できるため、時間を節約し、より包括的なカバレッジを確保できます。強化されたポリシーフィードバックは、ポリシー改善のための自然言語の提案を提供し、カスタマイズ可能な検証設定により、ユーザーは自信スコアのしきい値を特定の運用ニーズに合わせて調整できます。
実際には、自動推論チェックの実装には、特定の知識ドメインからのルールを自動推論ポリシーにエンコードすることが含まれます。このポリシーは、AIが生成したコンテンツを検証するための決定的な基準として機能します。例えば、組織は住宅ローン承認ポリシーを作成し、AIアシスタントの予測が確立された融資ガイドラインに厳密に準拠していることを確認し、重要な金融規制からの逸脱を防ぐことができます。このようなポリシーは、ルール、変数、およびカスタムタイプに基づいて構築されており、自然言語のポリシー文書を形式論理に変換します。ルールは変数と閾値間の関係を定義し、変数は主要な概念(頭金や信用スコアなど)を表し、カスタムタイプは非数値または非ブール値(異なる種類の住宅ローンなど)を処理します。このシステムは、自動シナリオ生成や手動テスト入力を含む堅牢なテストを容易にし、初期ポリシーの品質を評価し、その後の変更を検証します。
自動推論チェックは、より広範なAmazon Bedrock Guardrailsフレームワーク内でシームレスに統合されるように設計されています。これらは、コンテンツフィルタリングや文脈接地チェックなどの他の保護機能と組み合わせて使用でき、ApplyGuardrail APIを介してAmazon Bedrockによって提供されるモデルや、OpenAIやGoogle Geminiなどのサードパーティモデルにも適用できます。この機能は、Strands AgentsやAmazon Bedrock AgentCoreを使用してデプロイされたものを含むエージェントフレームワークにも拡張されます。
この技術の説得力のある実世界での応用例は、AWSとPwCの協力によるもので、電力会社のアウトテージ管理システムに焦点を当てています。電力供給が途絶える際に1分1秒が重要となるこの重要な領域では、効率を向上させるためにAIソリューションが導入されています。自動推論チェックは、このプロセスにおいて不可欠であり、規制要件を満たす自動プロトコル生成、確立されたポリシーに対する応答計画のリアルタイム検証、および明確な応答目標を持つ構造化された重要度ベースのワークフローの作成を可能にします。AIが生成した応答を評価することで、システムは無効または曖昧な出力を特定し、その改善を導き、応答時間の短縮、精度の向上、そして電力会社とその顧客の両方にとってより良い結果をもたらします。PwCのグローバルおよび米国商業技術・イノベーション責任者であるマット・ウッド氏は、この協力の重要性を強調し、「責任あるAIにおける画期的な進歩:数学的に評価された安全対策が、Amazon Bedrock Guardrailsに直接組み込まれた」と述べました。これは、信頼が不可欠な厳しく規制された業界にとって特に重要です。
Amazon Bedrock Guardrailsにおける自動推論チェックは、現在、米国東部 (オハイオ、バージニア北部)、米国西部 (オレゴン)、および欧州 (フランクフルト、アイルランド、パリ) を含む一部のAWSリージョンで利用可能です。サービスの料金は、処理されるテキストの量に基づいています。