Los asistentes de voz se hacen mayores

El avance de la inteligencia artificial impulsa el desarrollo de la tecnología capaz de procesar el lenguaje natural

¿Seguirá siendo en el futuro la pantalla táctil la principal interfaz de los dispositivos tecnológicos o será más habitual interactuar mediante la voz? La pregunta tiene sentido a tenor de la creciente apuesta de la industria por la inclusión de funciones de voz en los smartphones, dispositivos domóticos y automóviles.

La última compañía que se ha sumado a la tendencia es Samsung, que ha confirmado que el Galaxy S8, que se presentará el próximo 29 de marzo, incluirá una nuevo asistente de voz propio, Bixby. De esta forma, Samsung busca ganar independencia respecto a Google, que ha desarrollado un asistente virtual, Google Assistant, con el que se puede interactuar mediante comandos de voz.

Google intenta replicar con Google Assistant -se espera que pronto pueda hablar español- su estrategia de Android, ofreciendo una tecnología que pueda adoptar el resto de la industria. El asistente se incluyó inicialmente en sus móviles Google Pixel y en su altavoz Google Home, pero ya está disponible en teléfonos de otras marcas, como los nuevos LG G6.

Samsung, consciente de la necesidad de construir su propia propuesta de valor en este terreno, adquirió el año pasado la compañía de inteligencia artificial Viv Labs, que había desarrollado un asistente de voz. Detrás de esta start up se encuentran los creadores de Siri, el asistente de Apple. La compañía incluyó por primera vez Siri en sus iPhone en 2011 y, actualmente, a Siri se le pueden pedir cosas tan variadas como que envíe mensajes, busque una ruta o localice una tienda.

Los asistentes de voz son una de las muestras del avance de la inteligencia artificial en el campo del procesamiento del lenguaje natural. Según Google, la tasa de error en la comprensión de palabras, incluso en una habitación con ruido, está en el entorno del 8%, cuando hace unos años se situaba en el 25%.

Sin embargo, los desarrolladores todavía tienen mucho margen de mejora, puesto que las ironías y dobles sentidos no se lo ponen fácil al procesamiento del lenguaje natural. El machine learning, es decir, la capacidad de que un programa aprenda a partir de la interacción con los usuarios, requiere supervisión humana.

Por ejemplo, Microsoft tiene un equipo trabajando para dotar a su asistente virtual de personalidad porque creen que los consumidores simpatizan con el asistente si éste muestra emociones y comprende ironías. Por eso, la mayoría de estos asistentes tienen voces femeninas: los estudios muestran que los humanos sintonizan mejor con voces más cálidas.

Más allá de estas cuestiones, está claro que hay un interés compartido de los gigantes tecnológicos por los asistentes de voz. Por ejemplo, Google estima que en Estados Unidos alrededor del 20% de las búsquedas en Android se realizan ya mediante la voz y no tecleando en la caja de búsqueda.

Además de los móviles, la voz tendrá un papel protagonista en el despliegue del Internet de las Cosas. Amazon es una de las compañías mejor situadas en este terreno gracias a su asistente virtual Alexa, la base de Echo, un altavoz inteligente que entiende órdenes de voz para, por ejemplo, poner música en casa. Durante el último CES se pudieron ver docenas de dispositivos que utilizan Alexa, desde coches de Ford a electrodomésticos o móviles.

Según revela The Wall Street Journal, tanto Amazon Echo como Google Home podrían incorporar en un futuro cercano nuevas funcionalidades para permitir a los usuarios hacer llamadas telefónicas a través de estos altavoces sin necesidad de un móvil.

Apple Siri

SIRI.png

Siri apareció por primera vez en el iPhone 4S de 2011. Desde entonces, el asistente de voz de la compañía ha ido evolucionando, aunque es mejorable aún la tasa de comprensión de las palabras. Además de poder dictar mensajes y hacer llamadas, permite utilizar la voz para cosas como lanzar búsquedas en Internet, preguntar por el pronóstico del tiempo, dictar modificaciones en la agenda, solicitar la instalación de aplicaciones o poner música. Siri también funciona con la tecnología domótica Homekit de Apple, de forma que los usuarios pueden usar la voz para controlar los sistemas domóticos del hogar compatibles con esta tecnología. Siri entiende órdenes como encender la calefacción o apagar la radio.

Google Assistant

Google Assistant permite mantener una conversación con los usuarios tanto mediante el texto, como con comandos de voz. La tecnología está ya presente en los móviles de Google (Pixel) y el nuevo LG G6. También se utiliza en el altavoz inteligente para el hogar Google Home (el mayor competidor de Amazon Echo) y de la aplicación de mensajería Allo. La compañía ha confirmado que Google Assistant estará muy pronto en español. El procesamiento del lenguaje natural permite a Google Assistant buscar respuestas a preguntas en Google, ejecutar órdenes como poner música o anotar citas en el calendario. Google asegura que el asistente mejora con la interacción con el usuario.

Amazon Alexa

Amazon Echo se convirtió estas Navidades en el producto de mayor éxito de la cibertienda. Echo es un pequeño altavoz que entiende el lenguaje natural gracias a la tecnología Alexa, también de Amazon. Así, se le puede pedir que ponga música en Spotify, lea una noticia, ofrezca información sobre el tráfico, ponga la alarma o controle las luces o la calefacción del hogar, gracias a su integración con dispositivos de otras compañías. Precisamente, uno de los puntos fuertes de Amazon es cómo ha logrado que otras compañías integren Alexa (aún no entiende el español) en diferentes dispositivos. Con Alexa, Amazon quiere prepararse para un futuro en el que la compra online puede hacerse a través de comandos de voz.


Fuente: Expansión