Archivo de la etiqueta: Asistentes de voz

Acusan a Amazon de violar la ley de privacidad infantil al conservar para siempre las grabaciones de voz de los niños con «Alexa» y socavar las peticiones de borrado de los padres

«FTC and DOJ Charge Amazon with Violating Children’s Privacy Law by Keeping Kids’ Alexa Voice Recordings Forever and Undermining Parents’ Deletion Requests | Federal Trade Commission». Accedido 1 de junio de 2023.

Ver noticia

La Comisión Federal de Comercio y el Departamento de Justicia exigirán a Amazon que revise sus prácticas de supresión de datos y aplique estrictas salvaguardias de privacidad para resolver las acusaciones de que la empresa infringió la norma COPPA (Children’s Online Privacy Protection Act Rule) y engañó a los padres y usuarios del servicio de asistente de voz Alexa sobre sus prácticas de supresión de datos.

Según una denuncia presentada por el Departamento de Justicia en nombre de la FTC, Amazon impidió que los padres ejercieran sus derechos de eliminación en virtud de la Regla COPPA, conservó datos sensibles de voz y geolocalización durante años y los utilizó para sus propios fines, mientras ponía los datos en riesgo de daño por acceso innecesario.

«El historial de Amazon de engañar a los padres, conservar indefinidamente las grabaciones de los niños y hacer caso omiso de las solicitudes de supresión de los padres violó la COPPA y sacrificó la privacidad en aras de los beneficios», dijo Samuel Levine, Director de la Oficina de Protección del Consumidor de la FTC. «La COPPA no permite a las empresas conservar los datos de los niños para siempre por ningún motivo, y menos para entrenar sus algoritmos».

En virtud de la propuesta de orden judicial federal presentada también por el DOJ, se exigirá a Amazon que elimine las cuentas inactivas de menores y determinadas grabaciones de voz e información de geolocalización, y se le prohibirá utilizar esos datos para entrenar sus algoritmos. La orden propuesta debe ser aprobada por el tribunal federal para entrar en vigor.

Según la demanda, Amazon aseguró de forma destacada y reiterada a sus usuarios, incluidos los padres, que podían eliminar las grabaciones de voz recogidas por su asistente de voz Alexa y la información de geolocalización recopilada por la aplicación Alexa. Sin embargo, la empresa incumplió estas promesas cuando conservó parte de esta información durante años y utilizó los datos que retuvo ilegalmente para ayudar a mejorar su algoritmo Alexa, según la denuncia.

La voz se está convirtiendo en una tecnología de búsqueda primaria

Voice is becoming a primary search technology. ComputerWor. By Jonny Evans, Computerworld JUL 20, 2021 8:15 AM PDT

Texto completo

Vixen Labs y Open Voice Network hablaron con 6.000 personas en EE. UU., Reino Unido y Alemania para averiguar cómo utilizan sus asistentes de voz. Los resultados  están disponibles aquí.

Uno de los grandes hallazgos es la ubicuidad. Más del 30% de nosotros usamos asistentes de voz a diario, y alrededor del 23% los usamos varias veces al día. Casi todo el mundo sabe que estas cosas existen.

El informe también proporciona datos demográficos útiles. Me interesó saber que el 60% de los usuarios de 18 a 24 años y el 36% de los de 25 a 34 años utilizan Siri más que cualquier otro asistente. Alexa se usa más en grupos demográficos más antiguos, mientras que el Asistente de Google también es popular. (Cortana y Bixby son jugadores menores en el espacio).

Asistentes de voz virtuales en entornos bibliotecarios y educativos.

Virtual Voice Assistants (Library Technology Reports): Amazon.es: Rivero,  Erin, Shih, Win: Libros en idiomas extranjeros

Win Shih y Erin Rivero «Virtual Voice Assistants» Library Technology Reports vol. 56, no. 4 (May/June 2020)

Texto completo

Con el rápido avance de la tecnología de voz, los dispositivos de altavoces inteligentes han penetrado en muchos hogares y empresas estadounidenses. Los asistentes de voz, como Alexa de Amazon, Siri de Apple y Google Assistant, están integrados en una gran cantidad de productos de consumo e IoT. Los asistentes digitales actúan como agentes inteligentes que interactúan con las voces de los usuarios, respondiendo con respuestas y apoyo.

Este número de Library Technology Reports (vol. 56, nº 4), «Asistentes de voz virtuales», ofrece en primer lugar una visión general de la tecnología que hay detrás de los altavoces inteligentes y los asistentes de voz, también conocidos como asistentes digitales o virtuales. Además, explora los usos innovadores de dicha tecnología en entornos bibliotecarios y educativos. A continuación, el informe aborda cuestiones relacionadas con la ética, la privacidad, la seguridad y la confianza, y concluye con una revisión de las tendencias futuras y consejos para los responsables de la toma de decisiones que se preparan para integrar los asistentes de voz en sus organizaciones.

Google Duplex: un sistema de inteligencia artificial para realizar gestiones telefónicas sin intervención humana

 

actualidad_318235842_130243985_1024x576

 

Google Duplex

 

El sistema Google Duplex es capaz de llevar a cabo conversaciones sofisticadas y completa la mayoría de sus tareas de forma totalmente autónoma, sin participación humana. El sistema tiene una capacidad de autocontrol, que le permite reconocer las tareas que no puede completar de forma autónoma (por ejemplo, programar una cita inusualmente compleja).

 

Google Duplex es un nuevo proyecto de Google que permite a ciertos usuarios hacer una reserva en un restaurante por teléfono. Sin embargo, en lugar de que el usuario hable directamente con el empleado del restaurante, Google Duplex, con la ayuda de Google Assistant, habla por el usuario. Lo hace con una voz basada en la inteligencia artificial, pero que suena humana. También se está usando para acelerar el pago de las entradas de cine online.

La tecnología está dirigida a completar tareas específicas, como programar ciertos tipos de citas. Para tales tareas, el sistema hace que la experiencia de conversación sea lo más natural posible, permitiendo que las personas hablen normalmente, como lo harían con otra persona, sin tener que adaptarse a una máquina.

En el habla espontánea natural, las personas hablan más rápido y con menos claridad que cuando hablan con una máquina, por lo que el reconocimiento de voz es más difícil y vemos tasas de error de palabras más altas. El problema se agrava durante las llamadas telefónicas, que a menudo tienen ruidos de fondo fuertes y problemas de calidad de sonido.

El sistema Google Duplex es capaz de llevar a cabo conversaciones sofisticadas y completa la mayoría de sus tareas de forma totalmente autónoma, sin participación humana. El sistema tiene una capacidad de autocontrol, que le permite reconocer las tareas que no puede completar de forma autónoma (por ejemplo, programar una cita inusualmente compleja). En estos casos, señala a un operador humano, que puede completar la tarea.

Técnicamente, el núcleo de Duplex se basa en una red neuronal recurrente (RNN) diseñada para hacer frente a estos desafíos, construida utilizando TensorFlow Extended (TFX).

 

 

Importante incremento en el uso de altavoces inteligentes

 

20200123201830_npr-smartaudioreport-winter2019-web

 

The Smart Audio Report. NPR and Edison Research, 2020

Texto completo

 

El Informe sobre Audio Inteligente del Invierno 2019 confirmó el crecimiento continuo del mercado de altavoces inteligentes con el 24% de los adultos de EE.UU. – 60 millones de personas – que poseen al menos un dispositivo de altavoz inteligente. El promedio de hogares con altavoces inteligentes ahora cuenta con 2,6 dispositivos, en comparación con los 2,3 dispositivos por hogar en la misma época del año pasado. Con el 54% de la población estadounidense que ha utilizado alguna vez la tecnología de voz, los altavoces inteligentes y los asistentes de voz en todos los dispositivos forman parte cada vez más de la vida cotidiana.

 

Los nuevos datos de la última entrega de The Smart Audio Report (Invierno 2020) de NPR y Edison Research confirman que la adopción de altavoces inteligentes continúa creciendo en los EE.UU. con 60 millones de adultos A18+ (24% de la población) que ahora poseen un altavoz inteligente. Y con la escucha de audio de palabra hablada en un 20% a partir de 2014, reduciendo el tiempo dedicado a la música, está claro que el panorama del audio está cambiando drásticamente – impulsado por los avances tecnológicos y las preferencias de uso de contenido por igual.

Los principales hallazgos de la encuesta incluyen:

  • El 54% de la población de EE.UU. ha utilizado alguna vez la tecnología de voz y comando.
  • De los que usan comandos de voz, el 24% usa comandos de voz casi todos los días
  • El hogar promedio con altavoces inteligentes ahora cuenta con 2,6 dispositivos, en comparación con los 2,3 dispositivos por hogar en la misma época del año pasado.

 

 

Los dispositivos activados por voz en España

 

1230130

¿Sabes cómo suena tu marca? La voz, una revolución.  Estado del audio y la voz en España. Madrid: SEIN, 2019

Texto completo

Cada persona tiene una voz única. También las marcas. La irrupción de las interfaces de voz cambia por completo la forma de relacionarnos con nuestros dispositivos y, con ello, la interacción con empresas e instituciones. Saber escuchar y hablar es hoy más importante que nunca.

Las interfaces de voz de los nuevos altavoces inteligentes y otros dispositivos como los teléfonos móviles modifican, y modificarán cada vez más, el ecosistema digital y, por tanto, la forma de solicitar y ofrecer productos y servicios. La voz se convierte en la nueva gran interfaz transversal.

¿Realizar una consulta? Voz. ¿Pedir comida a domicilio? Voz. ¿Pagar la compra? Voz. ¿Por qué no?

Más de la mitad de los internautas españoles, un 50,5%, “habla” con un asistente de voz, ya sea a través de un altavoz inteligente, el móvil o el coche.

El 6,2% de los internautas españoles ya tiene un altavoz inteligente en su hogar solo un año después de su llegada al mercado local.

La mayoría de los usuarios emplean los altavoces para tareas sencillas como escuchar música (90,3% de los usuarios de altavoces inteligentes), consultar el tiempo (84,1%), hacer preguntas generales (70,8%) y conocer las noticias (66,4%). Mientras realizan tareas del hogar (72,6%) y al despertarse o antes de salir de casa (46,9%) son los momentos preferidos para ello

A medida que las máquinas entienden mejor lo que escuchan, más oportunidades tienen las empresas de aprovechar estos nuevos puntos de contacto. Las nuevas formas de interacción exigen dar un paso más. Se trata de crear voces únicas y reconocibles, pero también eficaces y consistentes; que garanticen una experiencia satisfactoria.

Smart Talk. Cómo las organizaciones y los consumidores están adoptando los asistentes de voz y chat

 

captura-4

Smart Talk. How organizations and consumers are embracing voice and chat assistants’. Capgemini Research Institute, 2019

Texto completo

 

Los asistentes de conversación están ganando los corazones y las mentes de los consumidores, están aquí para quedarse, haciendo que todo, desde hervir un huevo hasta hacer un pago mucho más fácil. Y los consumidores esperan más de ellos día a día. Si cumplen con estas expectativas crecientes, los asistentes de conversación están en condiciones de transformar el panorama de la experiencia del usuario. Pero, ¿tienen las organizaciones la centralidad en el cliente y las capacidades organizativas necesarias para desplegar estas tecnologías con éxito?

En el nuevo informe del Capgemini Research Institute, Smart Talk: How organizations and consumers are embracing voice and chat assistants, se recoge una encuesta a más de 12.000 consumidores que han usado y continúan usando asistentes de voz y/o chat y con 1.000 ejecutivos de productos de consumo y minoristas, servicios financieros y de automoción, incluyendo reproductores digitales de juego puro. Encontramos eso:

  • Los asistentes de conversación se están convirtiendo en parte de la corriente principal – tanto los consumidores como las organizaciones los consideran cruciales para el compromiso y la experiencia de los clientes.
  • La voz se está convirtiendo rápidamente en la forma preferida de los consumidores para interactuar en una serie de actividades, y está en aumento.
  • Muchas organizaciones ya están obteniendo beneficios significativos de los asistentes de conversación: el 76% ha obtenido beneficios cuantificables de ellos y el 58% dice que estos beneficios cumplieron o superaron sus expectativas.
  • Menos del 30% de las empresas muestran madurez en la interfaz conversacional, y los grupos pequeños que sí enfocan sus esfuerzos en factores relacionados con el consumidor, tales como ganar confianza, comprender las preferencias y satisfacer mejor las necesidades, así como las capacidades organizativas, tales como crear conciencia y capacitar a sus empleados.

 

 

Iniciativa para una mayor interoperabilidad de los sistemas asistentes de voz de las diferentes compañías

 

img_npalou_20190130-115212_imagenes_lv_otras_fuentes_familia_echo_4_6_96135399-k8mi-u461432842830jgi-992x55840lavanguardia-web

Voice Interoperability Initiative

 

En un mundo con múltiples servicios de voz, cada uno con diferentes capacidades, los clientes deben tener la libertad de elegir su servicio preferido para cualquier tarea. El objetivo de este programa es ofrecer esta experiencia a través de servicios de voz múltiples y simultáneos en el mismo producto, cada uno con su propia «palabra de activación» o nombre de invocación, lo que permite a los clientes hablar con el servicio de su elección de forma segura, simplemente diciendo su nombre.

 

Los servicios y dispositivos de voz se configuran como una de las principales tecnologías de información del futuro. Por ejemplo Alexa, el dispositivo de voz de Amazon que funciona a través de un servicio de voz ubicado en la nube. Con Alexa, se crea una experiencia de voz natural que ofrecer una forma más intuitiva de interactuar con la tecnología que usamos a diario.

Sin embargo, todos los sistemas de voz de las diferentes compañías no funcionan de manera coordinada. De este modo Amazon y las principales empresas de tecnología acaban de presentar «Voice Interoperability Initiative», un nuevo programa para garantizar que los productos habilitados para voz ofrezcan a los clientes opciones y flexibilidad a través de múltiples servicios de voz interoperables. La iniciativa se basa en la creencia compartida de que los servicios de voz deben funcionar a la perfección entre sí en un único dispositivo, y que los productos habilitados para voz deben estar diseñados para soportar múltiples palabras de activación simultánea.

Más de 30 empresas apoyan el esfuerzo, entre las que se incluyen marcas globales como Amazon, Baidu, BMW, Bose, Cerence, ecobee, Harman, Logitech, Microsoft, Salesforce, Sonos, Sound United, Sony Audio Group, Spotify y Tencent; operadores de telecomunicaciones como Free, Orange, SFR y Verizon; proveedores de soluciones de hardware como Amlogic, InnoMedia, Intel, MediaTek, NXP Semiconductors, Qualcomm Technologies, Inc, SGW Global y Tonly; e integradores de sistemas como CommScope, DiscVision, Libre, Linkplay, MyBox, Sagemcom, StreamUnlimited y Sugr.

La Iniciativa de Interoperabilidad de la Voz se basa en cuatro prioridades:

  • Desarrollar servicios de voz que puedan funcionar a la perfección con otros, protegiendo al mismo tiempo la privacidad y la seguridad de los clientes.
  • Construir dispositivos habilitados para voz que promuevan la elección y la flexibilidad a través de palabras múltiples y simultáneas.
  • Lanzamiento de tecnologías y soluciones que facilitan la integración de múltiples servicios de voz en un solo producto.
  • Acelerar el aprendizaje automático y la investigación de la IA en conversaciones para mejorar la amplitud, la calidad y la interoperabilidad de los servicios de voz.

 

 

 

La voz. La lengua hablada es patrimonio de la humanidad

telos111

 

La Voz. Telos 111. Fundación Telefónica, 2019

Texto completo

El número 111 de TELOS está dedicado a la voz. La lengua hablada es patrimonio de la humanidad y su poder se extiende a la tecnología, a las máquinas y a los robots. La tecnología, a su vez, nos permite recuperar y difundir los valores de las lenguas, muchas olvidadas e incluso maltratadas, para evitar que se pierdan definitivamente y puedan contribuir en cambio al desarrollo, la consolidación de la paz y la reconciliación, como señala la asamblea de Naciones Unidas en la proclamación de 2019 como el Año Internacional de las Lenguas Indígenas.La oralidad ha distinguido a los seres humanos desde el principio de sus días y hoy, al inicio de un cambio de era comandado por la tecnología, la voz recobra relevancia gracias a los sistemas de procesamiento del lenguaje natural, de la inteligencia artificial y de los asistentes virtuales con voz, capaces de interactuar con la lengua humana y de aprender de nosotros para entender –también las máquinas- el contexto en que vivimos.En la portada de este número aparece Juliana Rueda, maestra de música e ingeniera de sonido, es directora y propietaria del estudio de sonido miut, especializado en audiolibros y proyectos audiovisuales.

La experiencia híbrida. Donde el mundo digital y el físico se encuentran

vye08gty190614photo01

Experiencia híbrida. Donde el mundo digital y el físico se encuentran. Madrid: Accenture, 2019

Texto completo

 

Los asistentes de voz, los avances en movilidad con coches cada vez más autónomos, el vídeo a la carta e incluso aplicaciones con realidad virtual y aumentada están pasando a constituir el día a día del consumidor de forma rápida y natural, en una experiencia híbrida que desdibuja las fronteras entre el espacio físico y el digital.

 

Digital Consumer Survey 2019 recoge las expectativas y los avances en la adopción de las tecnologías que hacen confluir el mundo digital y el físico. Cuáles son estas tecnologías y en qué ámbitos de su vida los están incorporando los consumidores con mayor aceptación. Qué oportunidades se presentan ante un usuario que requiere personalización, transparencia y sencillez en la relación. Cómo ha de ser la respuesta de los líderes del sector de las TIC, para los que la relevancia es clave.

En este nuevo espacio híbrido, el consumidor quiere un servicio más personalizado, satisfactorio y productivo, de manos de un proveedor que merezca su confianza y le ofrezca todos estos servicios de forma rápida, sencilla y sin complicaciones. El reto para para los proveedores de servicios de comunicaciones y tecnologías de la información (TIC) es claro: permanecer relevantes.

La comodidad del uso de la voz en las actividades cotidianas está provocando una rápida adopción del altavoz inteligente, retrayendo incluso el uso del ‘smartphone’ para algunas funciones e influyendo en la compra de cualquier dispositivo inteligente para el hogar por su facilidad de integración con su asistente de voz. Paralelamente, la demanda de una mayor personalización hace que cada vez más consumidores resten importancia a interactuar con un ‘chatbot’ para obtener una solución más rápida y ajustada a sus necesidades.

Los consumidores quieren incorporar la realidad aumentada o virtual de una forma práctica en sus actividades del día a día y no simplemente en el juego. El atractivo y la practicidad de estas tecnologías los ven en ámbitos como el aprendizaje de nuevas habilidades o el seguimiento de instrucciones de montaje, conocer más sobre un lugar que se visita, probarse una ropa de forma virtual o relacionarse con amigos a distancia. La integración de estas tecnologías en los dispositivos de la vida diaria constituye el desafío.

Los hábitos de consumo en la movilidad están cambiando, con nuevas experiencias, como los coches conectados o la multiplicación de vehículos compartidos. De hecho, los consumidores digitales se muestran cada vez más preparados para aceptar el concepto del vehículo autónomo. Casi dos de cada tres están dispuestos a ser pasajeros y uno de cada dos muestra interés por estos automóviles. La libertad de poder realizar otras tareas durante el desplazamiento es uno de sus alicientes principales, lo que constituye una de las grandes oportunidades.

El consumo de televisión y de contenidos de vídeo ha cambiado radicalmente. La televisión en vivo ha dado paso a un nuevo modelo de consumo de vídeo a la carta, ante el que la televisión de pago muestra también signos de erosión en favor de los servicios de suscripción OTT, que crecen sustancialmente sobre todo entre los más jóvenes. Sin embargo, la complejidad de administrar múltiples proveedores para obtener los contenidos deseados abre una gran oportunidad a los integradores que sean capaces de ofrecer una experiencia simplificada y a medida.