Apple prueba Siri con IA para comandos de voz multi-app

Theaiinsider

Según informes, Apple está logrando avances significativos en la transformación de su asistente de voz, Siri, en una herramienta mucho más potente e intuitiva, capaz de ejecutar comandos complejos de múltiples aplicaciones utilizando únicamente la voz del usuario. Esta ambiciosa revisión, detallada en informes recientes que citan a Bloomberg, tiene como objetivo que Siri pase de ser un simple respondedor de consultas a un centro de comando central para la vida digital del usuario.

En el corazón de este avance se encuentra un marco App Intents sustancialmente actualizado, la herramienta para desarrolladores de Apple que permite a las aplicaciones exponer sus funcionalidades principales al sistema. Esta mejora significa que Siri ya no se limitará a lanzamientos básicos de aplicaciones o comandos de una sola acción. En cambio, podría permitir a los usuarios realizar tareas complejas de varios pasos a través de diversas aplicaciones sin interrupciones. Imagine instruir a Siri para que “encuentre mis fotos de la playa, las edite para mejorar los colores y envíe la mejor a John”, y ver cómo ejecuta toda la secuencia sin un solo toque.

Más allá de la gestión de fotos, se prevé que el Siri mejorado maneje una amplia gama de interacciones digitales diarias. Los usuarios podrían publicar comentarios en plataformas de redes sociales, iniciar sesión sin esfuerzo en diferentes servicios o incluso completar transacciones en línea, como navegar por aplicaciones de compras y agregar artículos a un carrito, todo mediante comandos de voz. Este desarrollo marca un momento crucial, prometiendo una interacción más fluida, manos libres y menos intrusiva con los dispositivos Apple.

Si bien Apple mostró una demostración avanzada e inteligente de Siri en su Conferencia Mundial de Desarrolladores (WWDC) en 2024, el lanzamiento completo de estas características de próxima generación ha enfrentado retrasos. Las fuentes ahora indican un posible lanzamiento en la primavera de 2026, coincidiendo con una revisión más amplia de la infraestructura subyacente de Siri. Apple está actualmente inmersa en extensas pruebas internas de esta funcionalidad, no solo con sus propias aplicaciones, sino también con una selección de aplicaciones populares de terceros, incluidas Uber, Amazon, YouTube, Facebook, WhatsApp, Threads y Temu.

Sin embargo, el camino hacia este control de voz avanzado no está exento de desafíos. Debido a estrictas preocupaciones de seguridad y precisión, categorías altamente sensibles como las aplicaciones bancarias, financieras y de salud pueden ver capacidades limitadas de Siri o incluso ser excluidas por completo de este control multi-aplicación en el lanzamiento. El retraso en sí se atribuye en parte a la complejidad de adaptar la arquitectura de Siri, con una década de antigüedad, para la IA generativa, y la necesidad de garantizar una fiabilidad absoluta, particularmente en escenarios de alto riesgo.

Este cambio estratégico subraya la estrategia más amplia de inteligencia artificial de Apple para 2025, que prioriza la inteligencia en el dispositivo, la integración del ecosistema y la confianza del usuario a través de su marco “Apple Intelligence” y “Private Cloud Compute”. El movimiento de la compañía hacia un ecosistema interactivo “de voz primero” también se considera crucial para futuras innovaciones de hardware, incluyendo una pantalla inteligente planificada y un robot de mesa, los cuales dependerían en gran medida de la interacción natural basada en la voz. A medida que Apple navega por el competitivo panorama de la IA, también se informa que está explorando adquisiciones estratégicas y asociaciones con proveedores externos de IA, como Perplexity AI y OpenAI, para mejorar aún más las capacidades de Siri y acelerar su hoja de ruta de IA.