BigQuery de Google: Agentes de IA para Análisis de Datos Automatizado

Infoworld

Google ha revelado una serie de mejoras significativas en su servicio de almacén de datos gestionado BigQuery, con el objetivo de automatizar aún más las complejas tareas de análisis de datos para los profesionales de datos empresariales. Estas actualizaciones se basan en los agentes de ingeniería y ciencia de datos anunciados inicialmente por el hiperescalador en su evento anual Google Cloud Next en abril.

El agente de ingeniería de datos, anteriormente centrado en la preparación básica de datos, ha evolucionado hacia una capacidad integral de extremo a extremo. Según Yasmeen Ahmad, gerente de producto de datos e IA en Google Cloud, el agente ahora abarca la construcción de pipelines, la transformación de datos y la resolución de problemas. Puede interpretar comandos en lenguaje natural mientras comprende esquemas de datos, aprende de metadatos existentes y discierne relaciones entre varios activos de datos. Esto permite a los profesionales de datos interactuar con el agente a lo largo de todo el ciclo de vida de la pipeline de datos, solicitando tareas como generar nuevas pipelines, modificar las existentes o incluso solucionar problemas analizando código y registros para identificar y sugerir soluciones.

De manera similar, el agente de ciencia de datos, inicialmente accesible a través del servicio gratuito de cuadernos Jupyter basado en la nube de Google, Colab, para automatizar la ingeniería de características, ahora está perfectamente integrado en BigQuery Notebook. Esta integración mejora significativamente la capacidad del agente para soportar flujos de trabajo de ciencia de datos automatizados y de extremo a extremo. Ahora puede crear planes de varios pasos, generar y ejecutar código, razonar sobre los resultados y presentar hallazgos, agilizando todo el proceso de ciencia de datos.

Una adición notable es la introducción de incrustaciones y generación de vectores autónomas dentro de BigQuery, diseñadas para ayudar a las empresas a preparar e indexar automáticamente datos multimodales para la búsqueda vectorial. Ahmad aclaró que “autónomo” se refiere a la automatización del “trabajo pesado” a menudo complejo y no diferenciado involucrado en la ingeniería de datos y MLOps. Tradicionalmente, los equipos de ciencia de datos extraían datos manualmente, configuraban recursos informáticos, procesaban datos por lotes para llamadas a API y luego construían y ajustaban índices vectoriales. Esta nueva característica tiene como objetivo liberar a estos equipos para que se concentren en actividades de mayor valor, como seleccionar modelos óptimos y validar su efectividad contra resultados comerciales específicos. Ahmad también cree que estas incrustaciones serán cruciales para construir una memoria semántica a largo plazo para los agentes de datos.

Stephanie Walter, analista de HyperFrame Research, se hizo eco de la evaluación de Ahmad, enfatizando el potencial transformador. Señaló que las incrustaciones vectoriales autónomas convierten datos empresariales no estructurados y multimodales en vectores numéricos, lo que permite la búsqueda semántica escalable, comparaciones de similitud, recomendaciones de contenido y detección de anomalías, todas capacidades críticas para desarrollar y acelerar soluciones avanzadas impulsadas por IA. Walter también señaló que los rivales de Google, incluidos Microsoft con Azure Cognitive Search y Synapse, AWS con Amazon OpenSearch Serverless, Cortex de Snowflake y Lakehouse AI de Databricks, ofrecen capacidades similares.

Más allá de estas mejoras de agentes, el motor de consulta de IA de Google dentro de BigQuery, que permite a los profesionales de datos analizar datos estructurados y no estructurados simultáneamente, ha pasado de una fase de prueba temprana a una vista previa pública oficial para todos los clientes.

Finalmente, Google está actualizando significativamente el agente de análisis conversacional dentro de Looker. Introducido en la conferencia de abril para permitir a los usuarios de negocios consultar sus datos utilizando lenguaje natural, este agente ahora incorpora un nuevo intérprete de código impulsado por Gemini. Actualmente en vista previa, este intérprete permite a los usuarios de negocios hacer preguntas “qué pasaría si” más complejas y basadas en escenarios sin requerir soporte de TI. Ahmad explicó que el intérprete puede generar código, proporcionar explicaciones claras en lenguaje natural y facilitar la creación de visualizaciones interactivas. Procesa consultas complejas en lenguaje natural a través de código avanzado y flujos de trabajo escritos en Python por el propio agente. Este intérprete también se está extendiendo a la API de análisis conversacional, que integra las capacidades de procesamiento de lenguaje natural de Looker en aplicaciones y flujos de trabajo empresariales más amplios. Esta API, inicialmente anunciada en vista previa privada en Cloud Next ’25, ahora está disponible públicamente para todos los clientes y socios.