Google BigQueryがAIエージェントで進化:データ分析を自動化
Googleは、マネージドデータウェアハウスサービスであるBigQueryに一連の重要な機能強化を発表しました。これは、企業のデータ実務者向けに複雑なデータ分析タスクをさらに自動化することを目的としています。これらのアップデートは、ハイパースケーラーが4月の年次Google Cloud Nextイベントで最初に発表したデータエンジニアリングおよびデータサイエンスエージェントを基盤としています。
これまで基本的なデータ準備に焦点を当てていたデータエンジニアリングエージェントは、包括的なエンドツーエンドの機能へと進化しました。Google CloudのデータおよびAIプロダクトマネージャーであるYasmeen Ahmad氏によると、このエージェントは現在、パイプラインの構築、データ変換、トラブルシューティングを網羅しています。データスキーマを理解し、既存のメタデータから学習し、さまざまなデータアセット間の関係を識別しながら、自然言語コマンドを解釈できます。これにより、データプロフェッショナルはデータパイプラインのライフサイクル全体を通じてエージェントと連携し、新しいパイプラインの生成、既存のパイプラインの変更、さらにはコードとログを分析して問題を特定し修正案を提示するといったトラブルシューティングタスクを要求できます。
同様に、特徴量エンジニアリングの自動化のためにGoogleの無料のクラウドベースJupyterノートブックサービスColabを通じて当初アクセス可能だったデータサイエンスエージェントは、BigQuery Notebookにシームレスに統合されました。この統合により、エージェントが自動化されたエンドツーエンドのデータサイエンスワークフローをサポートする能力が大幅に向上します。現在、多段階の計画を作成し、コードを生成・実行し、結果について推論し、発見を提示できるようになり、データサイエンスプロセス全体が合理化されます。
特筆すべき追加機能は、BigQuery内での自律的なベクトル埋め込みと生成の導入です。これは、企業がベクトル検索のためにマルチモーダルデータを自動的に準備・インデックス化するのを支援するために設計されています。Ahmad氏は、「自律的」とは、データエンジニアリングとMLOpsに関わる、しばしば複雑で差別化されていない「重労働」の自動化を指すと説明しました。従来、データサイエンスチームは手動でデータを抽出し、コンピューティングリソースを設定し、API呼び出しのためにデータをバッチ処理し、その後ベクトルインデックスを構築・微調整していました。この新機能は、これらのチームが最適なモデルの選択や特定のビジネス成果に対する有効性の検証といった、より価値の高い活動に集中できるようにすることを目的としています。Ahmad氏はまた、これらの埋め込みがデータエージェントの長期的なセマンティックメモリを構築するために不可欠になると考えています。
HyperFrame ResearchのアナリストであるStephanie Walter氏は、Ahmad氏の評価に同意し、その変革的な可能性を強調しました。彼女は、自律型ベクトル埋め込みが非構造化およびマルチモーダルな企業データを数値ベクトルに変換し、スケーラブルなセマンティック検索、類似性比較、コンテンツ推奨、異常検出を可能にすると述べました。これらはすべて、高度なAI駆動型ソリューションを開発し加速するための重要な機能です。Walter氏はまた、MicrosoftのAzure Cognitive SearchとSynapse、AWSのAmazon OpenSearch Serverless、SnowflakeのCortex、DatabricksのLakehouse AIを含むGoogleの競合他社も同様の機能を提供していると指摘しました。
これらのエージェントの強化に加えて、BigQuery内のGoogleのAIクエリエンジン(データ実務者が構造化データと非構造化データを同時に分析できる)は、早期テスターフェーズからすべての顧客向けの公式パブリックプレビューへと移行しました。
最後に、GoogleはLooker内の会話型分析エージェントを大幅にアップグレードしています。4月の会議でビジネスユーザーが自然言語を使用してデータをクエリできるように導入されたこのエージェントは、新しいGemini搭載コードインタープリターを組み込みました。現在プレビュー段階にあるこのインタープリターは、ビジネスユーザーがITサポートを必要とせずに、より複雑なシナリオベースの「もしも」の質問をできるようにします。Ahmad氏は、インタープリターがコードを生成し、明確な自然言語の説明を提供し、インタラクティブな視覚化の作成を促進できると説明しました。エージェント自身がPythonで記述した高度なコードとワークフローを通じて、複雑な自然言語クエリを処理します。このインタープリターは、Lookerの自然言語処理機能をより広範な企業アプリケーションやワークフローに統合する会話型分析APIにも拡張されています。このAPIは、当初Cloud Next ’25でプライベートプレビューとして発表されましたが、現在ではすべての顧客およびパートナーに公開されています。