Archivo de la etiqueta: Grabadora de voz

La nueva IA de Microsoft puede simular la voz de cualquier persona con una muestra de 3 segundos de audio

Edwards, Benj. «Microsoft’s New AI Can Simulate Anyone’s Voice with 3 Seconds of Audio». Ars Technica, 9 de enero de 2023. https://arstechnica.com/information-technology/2023/01/microsofts-new-ai-can-simulate-anyones-voice-with-3-seconds-of-audio/.

El jueves, investigadores de Microsoft anunciaron un nuevo modelo de inteligencia artificial de texto a voz llamado VALL-E que puede simular fielmente la voz de una persona cuando se le da una muestra de audio de tres segundos. Una vez que aprende una voz específica, VALL-E puede sintetizar el audio de esa persona diciendo cualquier cosa y hacerlo de una manera que intenta preservar el tono emocional del hablante.

Sus creadores especulan con que VALL-E podría utilizarse para aplicaciones de conversión de texto a voz de alta calidad, edición de voz en las que una grabación de una persona podría editarse y cambiarse a partir de una transcripción de texto (haciéndole decir algo que originalmente no dijo), y creación de contenido de audio cuando se combina con otros modelos generativos de IA como GPT-3.

Microsoft llama a VALL-E un «modelo de lenguaje de códec neural», y se basa en una tecnología llamada EnCodec, que Meta anunció en octubre de 2022. A diferencia de otros métodos de conversión de texto en voz que suelen sintetizar el habla manipulando formas de onda, VALL-E genera códigos de códec de audio a partir de texto e indicaciones acústicas. Básicamente, analiza cómo suena una persona, descompone esa información en componentes (llamados «tokens») gracias a EnCodec, y utiliza datos de entrenamiento para hacer coincidir lo que «sabe» sobre cómo sonaría esa voz si pronunciara otras frases fuera de la muestra de tres segundos. O, como dice Microsoft en el artículo sobre VALL-E

Microsoft entrenó las capacidades de síntesis de voz de VALL-E con una biblioteca de audio, reunida por Meta, llamada LibriLight. Contiene 60.000 horas de habla inglesa de más de 7.000 hablantes, en su mayoría extraídas de audiolibros de dominio público de LibriVox. Para que VALL-E genere un buen resultado, la voz de la muestra de tres segundos debe ser muy parecida a la de los datos de entrenamiento.

Media History Digital Library (MHDL): un recurso en línea gratuito, con millones de páginas de libros y revistas de las historias del cine, la radiodifusión y el sonido grabado.

Media History Digital Library (MHDL)

https://mediahistoryproject.org/

La historia temprana de la industria cinematográfica está escrita en revistas y periódicos amarillentos que acumulan polvo en rincones remotos. Media History Digital Library (MHDL), un recurso gratuito en línea que contiene copias digitalizadas de revistas, libros y documentos comerciales relacionados con la historia del cine, la radiodifusión y el sonido grabado.

El MHDL se encuentra en el Centro de Investigación de Cine y Teatro de Wisconsin y en el Departamento de Artes de la Comunicación, aunque su alcance en línea es global. Desde su creación, la MHDL ha pasado de 100.000 páginas de contenido digitalizado a 3 millones de páginas.

Durante décadas, los investigadores han recurrido a los periódicos comerciales y a las revistas de aficionados para escribir las historias del cine, los medios de comunicación y la radiodifusión. Los periódicos del sector, como Variety y Film Daily, ofrecen una amplia documentación sobre el desarrollo de las industrias de los medios de comunicación y su impacto en el público y la cultura. Sin embargo, el acceso a estas fuentes sigue siendo limitado. Los estudiosos dependían de facsímiles de microfilmes incompletos y de baja calidad. La mayoría de las revistas de cine y radiodifusión, que nunca se habían transferido al microfilme, sólo estaban disponibles en un puñado de instituciones. Y ninguno de los microfilmes ni de los ejemplares impresos permitía la búsqueda de textos completos. En su lugar, los investigadores tenían que pasar página por página para buscar artículos relevantes para sus preguntas de investigación.

Media History Digital Library (MHDL) digitaliza, organiza y distribuye libros y revistas históricos sobre cine, radiodifusión y sonido grabado que pone a disposición de lso investigadores y también se relaciona con un público más amplio fuera del ámbito académico. Los aficionados al cine, los entusiastas de la radio clásica y los genealogistas visitan regularmente el sitio web.

Se digitalizan y publican en línea 2.400 grabaciones raras de Thomas Edison, inventor del fonógrafo

2.400 Rare Edison Disc Phonograph Recordings Digitized and Released Online

The Discography of American Historical Recordings (DAHR)

El Parque Histórico Nacional Thomas Edison (TENHP) ha publicado 2.400 grabaciones históricas de discos de Edison, digitalizadas y puestas en línea en colaboración con las Colecciones de Investigación Especial de la Biblioteca de la Universidad de California, Santa Bárbara, en el sitio web Discography of American Historical Recordings (DAHR). Las grabaciones de TENHP incluyen muchas rarezas, entre ellas impresión de prueba no publicadas.

Los discos proceden de la propia colección del inventor del fonógrafo Thomas Edison conservada en TEHNP y contienen música grabada por Thomas A. Edison, Incorporated en la ciudad de Nueva York y en ciudades europeas entre 1910 y 1929.

El esfuerzo de cooperación para hacer que las grabaciones de discos de Edison estén disponibles para el público sin costo alguno comenzó en 2012 cuando TENHP compartió su base de datos de catálogo de información textual de discos de Edison con la Biblioteca de la UCSB. TEHNP también compartió copias de los históricos libros de contabilidad de las grabaciones escritas a mano y de los libros de caja de los estudios.

Gracias a la financiación de la National Endowment for the Humanities, los datos de TENHP constituyeron la base a partir de la cual los investigadores de la UCSB Library desarrollaron la discografía completa en línea de las grabaciones de discos de Edison. El DAHR documenta más de 14.000 sesiones de grabación de Edison que dieron lugar a más de 8.000 discos de dos caras publicados. Con las grabaciones de audio digitalizadas de TENHP, el DAHR tiene ahora un total de más de 7.400 grabaciones de discos de Edison disponibles para su escucha.

Archivo de Poesía y Literatura Grabada de la Library of Congress: más de 2000 grabaciones

 

2018-10-11_17-13-42

 

Archive of Recorded Poetry and Literature

 

El Archivo de Poesía y Literatura Grabada en la Biblioteca del Congreso se remonta a 1943, cuando Allen Tate era Consultor en Poesía. Contiene casi dos mil grabaciones de poetas y escritores en prosa que participan en eventos literarios en el campus de la Biblioteca de Capitol Hill, así como sesiones en el Laboratorio de Grabación de la Biblioteca.

La mayoría de estas grabaciones se capturan en carretes de cinta magnética, y solo son accesibles en la propia biblioteca. Al digitalizar el archivo y presentarlo en línea, la Biblioteca del Congreso espera ampliar considerablemente su uso y valor. El material presentado en esta presentación en línea representa una muestra de esta colección. El sitio continuará proporcionando elementos adicionales de este archivo mensualmente durante los próximos años.

Tutorial para grabar vídeos

 

daniborron

 

Guía básica “narración audiovisual”. Grabarnos por nuestra cuenta (un título un poco largo, la verdad). Tutorial para grabar vídeos. AEDAAsociación de Profesionales de la Narración Oral en España, 2020

Texto completo

 

Son días de quedarse en casa para tratar de controlar la pandemia provocada por el coronavirus CoVid19 en nuestro país, por eso muchas narradoras y narradores han decidido grabarse contando cuentos para compartirlos en redes y colaborar, de esta manera, para que este tiempo de cuarentena resulte menos pesaroso.

Por ese motivo le hemos pedido a nuestro compañero Dani Borrón, de Borrón y Cuento Nuevo, que nos haga un sencillo (¡y muy completo!) tutorial con pautas básicas para que esa grabación sea lo mejor posible.

Los dispositivos activados por voz en España

 

1230130

¿Sabes cómo suena tu marca? La voz, una revolución.  Estado del audio y la voz en España. Madrid: SEIN, 2019

Texto completo

Cada persona tiene una voz única. También las marcas. La irrupción de las interfaces de voz cambia por completo la forma de relacionarnos con nuestros dispositivos y, con ello, la interacción con empresas e instituciones. Saber escuchar y hablar es hoy más importante que nunca.

Las interfaces de voz de los nuevos altavoces inteligentes y otros dispositivos como los teléfonos móviles modifican, y modificarán cada vez más, el ecosistema digital y, por tanto, la forma de solicitar y ofrecer productos y servicios. La voz se convierte en la nueva gran interfaz transversal.

¿Realizar una consulta? Voz. ¿Pedir comida a domicilio? Voz. ¿Pagar la compra? Voz. ¿Por qué no?

Más de la mitad de los internautas españoles, un 50,5%, “habla” con un asistente de voz, ya sea a través de un altavoz inteligente, el móvil o el coche.

El 6,2% de los internautas españoles ya tiene un altavoz inteligente en su hogar solo un año después de su llegada al mercado local.

La mayoría de los usuarios emplean los altavoces para tareas sencillas como escuchar música (90,3% de los usuarios de altavoces inteligentes), consultar el tiempo (84,1%), hacer preguntas generales (70,8%) y conocer las noticias (66,4%). Mientras realizan tareas del hogar (72,6%) y al despertarse o antes de salir de casa (46,9%) son los momentos preferidos para ello

A medida que las máquinas entienden mejor lo que escuchan, más oportunidades tienen las empresas de aprovechar estos nuevos puntos de contacto. Las nuevas formas de interacción exigen dar un paso más. Se trata de crear voces únicas y reconocibles, pero también eficaces y consistentes; que garanticen una experiencia satisfactoria.

La Library of Congress pone a disposición de todos 200 grabaciones de audio de escritores Hispano-Lusos gratis

 

ahlotelizabeth-819x1024

Acceso a las grabaciones

 

The Archive of Hispanic Literature on Tape de la Library of Congress, es una colección histórica de cerca de 800 grabaciones de audio de escritores Luso-Hispanos. Desde su creación en 1943, los conservadores de la Hispanic Division  han continuado expandiendo este proyecto grabando, en el laboratorio de grabación de la biblioteca y en otras agencias en el extranjero, a algunos de los escritores y poetas más importantes de los siglos XX y XXI. Los esfuerzos para digitalizar toda esta colección están en curso, por el momento hay 200 grabaciones disponibles vía streaming gratuitamente en línea.

Este primer anuncio incluye grabaciones desde los años 50 en adelante, con muchas sesiones grabadas en los últimos cinco años. Reflejando la inmensa y rica diversidad cultural y lingüística de la región, la lista incluye las literaturas de naciones como Haití, Cuba, España, Colombia, Panamá, Puerto Rico, Chile, Argentina, y Portugal. También incluye, por primera vez, grabaciones de obras en lenguas indígenas, como la del erudito mexicano Ángel María Garibay (1892-1967) que lee poesía azteca en náhuatl y español; El escritor mexicano Andrés Henestrosa (1906-2008) que lee obras en zapoteco, una lengua precolombina de Oaxaca, México; y el poeta Andrés Alencastre (1909-1984) que lee versos en quechua, la lengua del Imperio Inca. Otra joya lingüística incluida en esta publicación es una lectura de la escritora española Unai Elorriaga (1973-) en euskera, una lengua pre-indoeuropea hablada en el norte de España.

Grabadora de voz en tu movil

Grabadora de voz avanzado

Grabadora de voz avanzada es una aplicación móvil para Andoid, gratuita muy solvente y fácil de usar que te permite llevar una grabadora de voz en tu dispositivo móvil, muy útil para entrevistas o para elaborar podcast, permite grabar fácilmente, simplemente pulsando en el botón rojo de la primera figura, en el triangulo puedes ver todas las grabaciones (Fig.2) y si abres una la puedes oir, o bien borrar, enviar por correo, compartir en redes sociales, enviar por WhatsApp, Dropbox, etc. El audio resultante tiene salida a MP3, lo que hace de esta aplicación una de las más útiles ya que es el formato de sonido comprimido más estandarizado. Una buena solución para llevar siempre encima. Además dispone de Siete opciones diferentes de calidades de audio, permite grabar sonido directo y grabación de sonidos en el fondo. Muy útil también para elaborar tutoriales de audio a través de podcast

Un buen complemento para limpiar, quitar, poner y editar el podcast de sonido de las grabaciones es la el software libre AUDIACITY

Una grabadora de voz en tu móvil

Grabadora de voz avanzada es una aplicación móvil para Andoid, gratuita muy solvente y fácil de usar que te permite llevar una grabadora de voz en tu dispositivo móvil, muy útil para entrevistas o para elaborar podcast, permite grabar fácilmente, simplemente pulsando en el botón rojo de la primera figura, en el triangulo puedes ver todas las grabaciones (Fig.2) y si abres una la puedes oir, o bien borrar, enviar por correo, compartir en redes sociales, enviar por WhatsApp, Dropbox, etc. El audio resultante tiene salida a MP3, lo que hace de esta aplicación una de las más útiles ya que es el formato de sonido comprimido más estandarizado. Una buena solución para llevar siempre encima. Además dispone de Siete opciones diferentes de calidades de audio, permite grabar sonido directo y grabación de sonidos en el fondo. Muy útil también para elaborar tutoriales de audio a través de podcast. De especial utilidad para traductores e intérpretes.

[]

 

Un buen complemento para limpiar, quitar, poner y editar el podcast de sonido de las grabaciones es la el software libre AUDIACITY