¿Alexa, Siri y el Asistente de Google utilizan IA?



Si tienes una casa inteligente, es probable que utilices un asistente como Alexa, Google Assistant o Siri. Pero, ¿utilizan estos populares asistentes domésticos la IA para funcionar? Y, de ser así, ¿cómo?


¿Los asistentes virtuales como Alexa utilizan IA?

Debido a que los asistentes virtuales pueden escuchar comandos de voz, se benefician del procesamiento del lenguaje basado en inteligencia artificial, ya que les ayuda a comprender y responder mejor a los comandos de voz y las preguntas.

Todos los asistentes virtuales difieren entre sí y el tipo de IA que utilizan también difiere. Sin embargo, el aprendizaje automático es una tecnología común utilizada por la mayoría de los asistentes virtuales. Siri, Alexa y el Asistente de Google utilizan inteligencia artificial y aprendizaje automático para interpretar solicitudes y realizar tareas.


Alexa utiliza aprendizaje automático y PNL (procesamiento del lenguaje natural) para cumplir con las solicitudes. «Lenguaje natural» se refiere al lenguaje utilizado en las conversaciones humanas, que fluye de forma natural. Para procesar mejor los comandos de voz, los asistentes virtuales dependen de la PNL para comprender completamente lo que se solicita.

Sin embargo, la propia Amazon llama a esto comprensión del lenguaje natural, o NLU. Amazon afirma que utiliza NLU para «deducir lo que realmente quiere decir un hablante, y no sólo las palabras que dice». Amazon usa un ejemplo aquí, afirmando que NLU ayuda a Alexa a proporcionar un pronóstico del tiempo si un usuario pregunta cómo está afuera. Sin decir específicamente «pronóstico del tiempo», NLU permite a Alexa discernir lo que el usuario está pidiendo.

Además, Amazon afirma que NLU «se trata de proporcionar a las computadoras el contexto necesario detrás de lo que decimos y la flexibilidad para comprender las muchas variaciones en cómo podríamos decir cosas idénticas». En resumen, NLU proporciona los medios para determinar mejor qué pide un usuario cuando se comunica verbalmente.


El Asistente de Google utiliza PNL y una serie de algoritmos complejos para procesar solicitudes de voz y entablar conversaciones bidireccionales. Funciones como Look and Talk, que se introdujo en 2022, utilizan estos algoritmos para determinar si usted, como usuario, simplemente está pasando por su Nest Hub o tiene la intención de interactuar con él.

Desde entonces, el Asistente de Google ha sufrido varias actualizaciones. En enero de 2024, Google anunció que eliminaría funciones menos utilizadas, como alarmas multimedia y control por voz de Google Play Books.

Finalmente, está Siri de Apple. Actualmente, Siri utiliza IA para sus funciones, utilizando tanto PNL como aprendizaje automático. Al igual que los otros dos asistentes virtuales que se analizan aquí, Siri reconoce los activadores de voz y puede captar la frase desencadenante «Hey Siri» utilizando una red neuronal recurrente.


Los asistentes de IA también están avanzando hacia el uso de IA generativa. Este es un tipo más reciente de IA que ya se utiliza en herramientas como ChatGPT.

Tanto Google como Alexa están desarrollando actualmente capacidades de IA generativa para sus asistentes de voz. Google está utilizando Gemini, su propio modelo de lenguaje grande (LLM). Amazon, por otro lado, está desarrollando su propio LLM que actualmente se conoce como «Alexa AI».

Como afirmó Amazon, Alexa AI permitirá algunas ventajas, incluidas conversaciones continuas sin palabras de activación repetidas, respuestas más personalizadas y control de múltiples dispositivos conectados mediante una sola solicitud.

En julio de 2023 se anunció que Apple estaba trabajando en su propio LLM, conocido como Ajax, que se utilizará en su chatbot, Apple GPT. A principios de 2024, comenzaron a surgir informes sobre Apple trabajando para mejorar Siri utilizando IA generativa. En un informe de Bloomberg Power On, se afirmó que Apple está «planeando una gran revisión» para Siri.


Más específicamente, se informa que Apple está desarrollando código AI, tanto para Siri como para su servicio Apple Care. 2024 puede revelar más información sobre estos desarrollos.

¿Deberían considerarse IA a Siri, Alexa y el Asistente de Google?

Dado lo mucho que los asistentes virtuales dependen de la IA, ya sea a través de PNL o aprendizaje automático, es natural categorizarlos directamente como IA. Los asistentes de voz como Alexa, Google Assistant y Siri a menudo se denominan herramientas de inteligencia artificial, dado su uso constante de PNL y aprendizaje automático.

Si bien estos asistentes virtuales tienen muchas otras funciones que no utilizan IA, dependen en gran medida de la IA para funcionar. Por tanto, pueden considerarse IA.

El futuro de la IA en los asistentes virtuales

Una cosa que muchos proveedores de asistentes virtuales tienen en común es que actualmente están trabajando en el uso de IA generativa en sus sistemas.

La IA generativa es un campo específico de la IA que utiliza aprendizaje profundo y redes neuronales para generar texto o medios basados ​​en las indicaciones del usuario (que también pueden ser en forma de texto o imágenes). La introducción de IA generativa en asistentes virtuales se está realizando mediante la integración de LLM.


En el futuro, la IA generativa podría brindar a los asistentes virtuales las siguientes capacidades:

  • Personalizar aún más la experiencia del usuario (según la ubicación, preferencias, etc.).
  • Brindando consejos y recomendaciones para temas del día a día.
  • Ofreciendo conversaciones más significativas con los usuarios.

A medida que la IA se vuelve más sofisticada, es posible que veamos que nuestros confiables asistentes de voz se vuelven altamente capaces y pueden ayudarnos en todo tipo de cosas. La IA tiene el potencial de catapultar las tecnologías existentes a una nueva era de capacidades, y los asistentes de voz no son una excepción.