AIが牽引するセマンティックレイヤー覇権争い

Datanami

人工知能とビジネスインテリジェンスの融合は、重要な依存関係、すなわちセマンティックレイヤーを露呈しています。AIモデルがデータベースと対話するためにSQLクエリを生成することが増えるにつれて、テーブル内にどのようなデータが存在するかを正確に理解する能力が最も重要になります。ここでセマンティックレイヤーが介入し、自然言語クエリを正確なデータ取得に変換する不可欠な「地図」として機能し、その制御がテクノロジー界で急成長する戦場となっています。

AI革命以前、セマンティックレイヤーは主にBIツールを実装し、データウェアハウス内でデータをモデリングする専門家の関心事でした。OracleやTeradataなどの分析データベースの上にTableauやLookerのようなプラットフォームを採用する組織は、通常、これらのBI製品に組み込まれたセマンティック機能を活用していました。その機能は明確でした。データのソース検証、必要な変換、整合性チェックなど、データに関するルールを定義し、適用することです。例えば、最高財務責任者は、ダッシュボード上の「営業収益」の数値が毎回一貫して正確に計算されることを保証するためにセマンティックレイヤーに依存しており、それが分析インフラストラクチャの重要なコンポーネントとなっていました。

特に2022年のChatGPTの登場以来、大規模言語モデルの出現は、セマンティックレイヤーをニッチなデータモデリング作業からAI-BIランドスケープの基礎へと押し上げました。このコンテキストマップなしにAIモデルをデータベースに投入することは、誤報、フラストレーション、および潜在的なビジネス上の挫折の元となります。ガイドとなるセマンティックレイヤーがなければ、言語モデルはデータを誤解する可能性がほぼ確実であり、重大なビジネス上の影響をもたらすエラーにつながります。

過去数年間、ささやかなセマンティックレイヤーは着実にその存在感を増してきました。AtScaleやCubeのように、BIツールに関係なくアナリストが基盤となるデータベースとどのように対話するかを標準化する独立したセマンティックレイヤーを開発したベンダーは、開発とマーケティングの取り組みを大幅に強化しています。人気のあるデータ変換ツールで知られるdbt Labsでさえ、2023年に独自のセマンティックレイヤーを立ち上げました。

今、業界の巨人たちが自らの主張を打ち出しています。Snowflakeは、最近のSummit 2025で「セマンティックビュー」機能を導入しました。負けじと、DatabricksはAI & Data Summit 2025で「Unity Catalogメトリックビュー」を発表しました。

Snowflakeのセマンティックビューは、そのエンジニアによって、すべてのセマンティックモデル情報をデータベース内に直接ネイティブに格納する新しいスキーマレベルのオブジェクトとして説明されています。この革新は、以前のメタデータファイルを置き換え、AI駆動の分析、BIクライアント、カスタムアプリケーションを含む幅広いSnowflakeエクスペリエンスのための標準化されたメタデータ定義を確立します。現在ベータ版であるSnowflakeは、ユーザーインターフェース、データベースオブジェクトエクスプローラー、または直接DDLステートメントなど、これらのビューを作成するためのさまざまな方法を提供しています。同社は、物理モデルオブジェクト(テーブルまたはビュー)、それらの間の関係、ディメンション(グループ化およびフィルタリングのためのビジネスフレンドリーな属性)、およびメトリック(KPIを表すビジネスフレンドリーな計算)などのコア属性をユーザーが定義できるモデル定義言語を採用しています。Snowflakeのエンジニアは、セマンティックビューが一般的な顧客の懸念、すなわち管理されていないデータアクセスや一貫性のない結果のリスクなしにAI駆動の会話型分析を望む声に対処していることを強調しました。

Databricksは、集中型データカタログとガバナンスの提供に基づいて、Unity Catalogメトリックビューで同様の道を追求しています。Databricksは、メトリックをBIレイヤー内だけでなく、データレイヤーで定義することで、ダッシュボードからAIモデル、データエンジニアリングジョブまで、すべてのワークロードでの再利用性と統合性を確保すると主張しています。これらのメトリックビューはYAMLで定義され、Unity Catalogに登録されており、SQLを介して完全にアクセスでき、使用するツールに関係なく組織全体で一貫したメトリックビューを促進します。Databricksは、メトリックビューがデフォルトでガバナンスされ、監査可能であることを強調しており、信頼できる洞察のために組み込みの監査とリネージを備えた認定メトリックを提供します。今夏に一般提供が開始される予定で、これらのビューはUnity Catalogで一度作成し、さまざまなDatabricksツール全体に適用できます。将来的には、DatabricksはTableau、Hex、Sigma、ThoughtSpot、Omniなどの外部BIツール、およびAnomaloやMonte Carloなどのオブザーバビリティツールへのサポートを拡大する予定です。

SnowflakeとDatabricksの戦略的な動きが示すように、堅牢なセマンティックレイヤーに対する強い需要は否定できません。この重要なメタデータレイヤーがなければ、ビジネスデータベース向けの自然言語クエリの約束は未 fulfilment のままになる可能性が高いでしょう。

現在の中心的な問題は、セマンティックレイヤーの勢いが、それらがBIツールや歴史的に関連付けられていたデータプラットフォームから分離された独立した製品カテゴリとして浮上するのに十分であるかどうかです。SnowflakeとDatabricksによる最近の行動は、セマンティック機能をプラットフォームに深く統合しており、エコシステムに縛られたソリューションを好むことを示唆しています。しかし、歴史は異なる前例を提供しています。データスタックのさらに上では、独立したテーブル形式への需要がApache Icebergの広範な採用につながりました。SnowflakeとDatabricksの両社は最終的にIcebergを標準化し、これはデータ独立性の勝利であり、ベンダーロックインに対する後退でした。

セマンティックレイヤーも同様に、データ相互運用性を実現し、AI駆動型BIの再現性と信頼性を確保するための不可欠なコンポーネントとして具現化されました。業界の巨人たちが、すべての人に利益をもたらす普遍的でオープンな標準に収束するのか、それともセマンティックレイヤーを独自の競争優位性にしようとするのか、最終的な結果はまだわかりません。