Archivo de la etiqueta: Videos

OpenAI ha retirado el generador de vídeos con IA Sora

Digital Trends. “OpenAI Killed the Sora AI Video Generator — and You’re Probably Guessing the Why Wrong.” Digital Trends, 2026. https://www.digitaltrends.com/computing/openai-killed-the-sora-ai-video-generator-and-youre-probably-guessing-the-why-wrong/

El cierre de Sora no se debió principalmente a motivos éticos, sino a su alto coste y baja rentabilidad. OpenAI ha priorizado proyectos más sostenibles y alineados con su estrategia empresarial.

El artículo de Digital Trends plantea una lectura especialmente interesante sobre la desaparición del generador de vídeo Sora, desmontando una interpretación que se ha vuelto casi automática en el debate público sobre inteligencia artificial. En un primer momento, muchos usuarios y analistas asumieron que la retirada de esta herramienta respondía a cuestiones éticas: el peligro de los deepfakes, la posible vulneración de derechos de autor o el uso indebido de contenidos generados. Sin embargo, el texto insiste en que esta explicación, aunque plausible y coherente con el clima de preocupación actual en torno a la IA, resulta en realidad incompleta. Estas problemáticas existían, pero no fueron el factor determinante. La narrativa ética, según el artículo, funciona más como una interpretación intuitiva que como una causa real.

La explicación de fondo es considerablemente más pragmática y, en cierto modo, más reveladora sobre el estado actual de la industria tecnológica. El desarrollo de herramientas de generación de vídeo mediante inteligencia artificial implica un coste computacional extremadamente elevado, muy superior al de otros sistemas como los modelos de lenguaje o los generadores de imágenes. Esta exigencia técnica se traduce en un gasto económico difícil de sostener si no viene acompañado de una adopción masiva o de un modelo de negocio claro. El artículo subraya que, pese a la espectacularidad de Sora y su impacto mediático, su uso real no alcanzó los niveles necesarios para justificar la inversión. En consecuencia, la ecuación entre costes e ingresos resultaba desfavorable, lo que llevó a su cancelación como una decisión empresarial más que tecnológica o moral.

Este cierre debe entenderse también dentro de un cambio estratégico más amplio en OpenAI y, por extensión, en el sector de la inteligencia artificial. La compañía parece estar orientándose hacia productos con mayor retorno económico y utilidad inmediata, como herramientas empresariales, asistentes inteligentes o sistemas de automatización. En este contexto, proyectos altamente innovadores pero intensivos en recursos, como la generación de vídeo, pasan a un segundo plano si no logran integrarse en una lógica de sostenibilidad económica. El artículo sugiere así que estamos entrando en una fase de madurez en el desarrollo de la IA, donde la innovación ya no se mide únicamente por su capacidad disruptiva, sino también por su viabilidad financiera y su alineación con objetivos estratégicos más amplios.

En última instancia, el texto invita a reflexionar sobre cómo interpretamos los movimientos de las grandes tecnológicas. Existe una tendencia a atribuir decisiones de este tipo a grandes debates éticos o culturales, cuando en realidad, como muestra este caso, los factores económicos siguen siendo determinantes. El cierre de Sora no implica un fracaso tecnológico —de hecho, su capacidad era notable—, sino más bien un reajuste de prioridades en un entorno competitivo y costoso. La lección que se desprende es clara: en el ecosistema actual de la inteligencia artificial, la innovación solo prospera si logra sostenerse en el tiempo, y eso depende tanto de la eficiencia técnica como de la rentabilidad económica.

La señal principal de que podrías estar viendo un video generado por IA

Germain, Thomas. “The Number One Sign You Might Be Watching an AI Video.” BBC Future, 31 octubre 2025. https://www.bbc.com/future/article/20251031-the-number-one-sign-you-might-be-watching-ai-video

La detección de videos generados o manipulados por inteligencia artificial (IA) en un entorno en el que estas tecnologías se han vuelto extremadamente sofisticadas y aún más difíciles de distinguir del material real. Su tesis central es que, aunque las herramientas de IA continúan mejorando, todavía existen ciertos indicadores confiables que pueden ayudar a identificar contenido sintético —siempre y cuando los espectadores sepan qué observar.

El autor introduce la idea de que los avances recientes en generación de video mediante IA han erosionado nuestra confianza tradicional en las imágenes como prueba de realidad: “Lo que parece real ya no es garantía de autenticidad”. En este contexto, advierte que la audiencia probablemente será engañada repetidamente con videos falsos antes de que llegue a cuestionar sistemáticamente todo lo que ve.

El artículo presenta la opinión de Hany Farid, profesor de ciencias de la computación en la Universidad de California, Berkeley y pionero en el estudio forense de medios digitales. Farid destaca que el aspecto más revelador de un video generado por IA, en muchos casos, es su calidad visual: los materiales sintéticos suelen exhibir baja resolución, imágenes borrosas o apariencia “grumosa” que se asemeja a grabaciones de muy mala calidad. Esta característica se vuelve particularmente evidente en clips que emulan estilo doméstico o de “found footage”, como cámaras de seguridad o grabaciones improvisadas, donde la compresión y los artefactos introducidos para ocultar imperfecciones pueden ser un signo de síntesis.

Germain también explora cómo los generadores de video por IA deliberadamente reducen la calidad de imagen como técnica para ocultar artefactos o fallos, lo cual puede ser paradójicamente una pista de que el contenido no proviene de una cámara real. La lógica detrás de este fenómeno es que las imperfecciones artificiales se camuflan mejor en clips de mala calidad que en aquellos nítidos y bien definidos: cuando un video parece demasiado familiar o responde a patrones genéricos sin una procedencia clara, esto debería activar las alertas del espectador.

El artículo contextualiza la discusión dentro de un panorama en el que las tecnologías de generación de video han alcanzado tal nivel que incluso expertos pueden ser engañados si no se presta atención a señales sutiles o a la procedencia del material. Este análisis forma parte de un esfuerzo más amplio por promover una alfabetización mediática crítica: es decir, la capacidad de evaluar no solo la calidad visual, sino también la fuente, la metadata disponible y el contexto en que aparece un video antes de aceptarlo como genuino.

Aunque no existe un método infalible para detectar todo video generado por IA, la principal señal —imágenes con mala calidad o artefactos visuales contradictorios con la supuesta fuente del video— ofrece un punto de partida valioso para discernir contenido potencialmente sintético en la era de los deepfakes avanzados.

Chewy Decimal System: una crítica satírica a la clasificación decimal en bibliotecas

Video humorístico compartido en el blog Kottke.org, en el que se presenta la propuesta del divulgador científico Hank Green, quien argumenta que la forma en la que están organizados las bibliotecas es ineficiente y frustrante para los usuarios. Como solución, sugiere reorganizarlos siguiendo una lógica inspirada en el sistema de clasificación bibliotecario, al que llama irónicamente el “Chewy Decimal System” (Sistema Decimal Masticable), parodiando el Dewey Decimal System usado en bibliotecas.

El artículo también sirve como una crítica indirecta a dicho sistema bibliotecario. Se menciona que muchos bibliotecarios no lo aprecian, ya que fue diseñado en el siglo XIX con una visión eurocentrista y colonial, reflejando prejuicios como:

  • Priorizar el cristianismo en la clasificación religiosa.
  • Colocar a los pueblos indígenas en la sección de historia como si fueran del pasado.
  • Separar arbitrariamente animales salvajes y domésticos.

Además, se cuestiona su utilidad para niños, ya que exige comprensión de decimales antes de que se enseñen en la escuela, y se señala que existen sistemas alternativos más intuitivos, aunque su implementación es costosa.

La propuesta de Hank Green es, en esencia, un comentario satírico sobre la rigidez de los sistemas organizativos tradicionales, tanto en bibliotecas como en supermercados, y una invitación a repensar cómo organizamos la información (o los productos) en función de la experiencia del usuario.

¿Cómo obtener la transcripción de un video de YouTube con Inteligencia Artificial?

Para obtener la transcripción del video de YouTube puedes utilizar herramientas en línea que convierten el audio de los videos en texto. Aquí tienes algunas opciones:​

  1. Maestra.ai: Esta plataforma permite transcribir videos de YouTube de manera gratuita. Solo necesitas ingresar la URL del video y la herramienta generará la transcripción en segundos. Además, ofrece funciones adicionales como resúmenes y traducciones. ​Maestra AI
  2. Vizard.ai: Otra opción para transcribir videos de YouTube. Al igual que Maestra.ai, solo debes proporcionar la URL del video y la herramienta se encargará del resto. También ofrece características como la traducción de contenido a más de 100 idiomas y la posibilidad de reutilizar el contenido del video en diferentes formatos. ​Vizard
  3. Tactiq.io: Esta herramienta permite obtener transcripciones de videos de YouTube de forma gratuita. Puedes ingresar la URL del video y generar la transcripción directamente desde su plataforma. ​Tactiq
  4. Noiz.io: Ofrece la posibilidad de transcribir videos de YouTube a texto en múltiples idiomas. Al ingresar la URL del video, la herramienta genera una transcripción que puedes descargar o compartir. Noiz+3

Pasos para obtener la transcripción:

  1. Copia la URL del video de YouTube que deseas transcribir.​
  2. Accede a una de las herramientas mencionadas anteriormente.​
  3. Pega la URL en el campo correspondiente de la herramienta.​
  4. Sigue las instrucciones proporcionadas por la herramienta para generar y, si lo deseas, descargar la transcripción.​

Ten en cuenta que la precisión de las transcripciones puede variar según la calidad del audio y el lenguaje utilizado en el video. Además, algunas herramientas pueden ofrecer funciones adicionales, como la edición de la transcripción o la traducción a otros idiomas.

EJEMPLO

Ejemplo: VIDEO Esteban Galán. Universitat Jaume I de Castelló . Grupo de investigación ITACA-UJI entrevista a Julio Alonso Arévalo https://www.youtube.com/watch?v=zXQukeWm0jI

TRANSCRIPCIÓN

0:01 – 0:50
Transmedia Esteban Galán
[Música]
Sintonizamos con el bibliotecario Julio Alonso Arévalo, que nos acompaña en el maravilloso universo de la biblioteca.

Julio Alonso:
Una biblioteca, hoy, sobre todo —fundamentalmente— la hacemos cada vez más los bibliotecarios que los libros, curiosamente. ¿Por qué? Porque ahora mismo muchas de las cosas que se podían encontrar habitualmente en la biblioteca, en la esfera del mundo físico, ahora mismo están en ese mundo analógico-digital que es internet. Y si nosotros no aportamos un valor añadido a esa información, evidentemente terminaremos desapareciendo, como terminaron desapareciendo los que hacían carruajes en el siglo XIX y principios del XX.

0:48 – 1:28

Nosotros nos estamos reinventando, estamos reimaginando nuestros espacios. Ahora mismo, concretamente, está sucediendo una cosa: ¿qué puede aportar la biblioteca a un usuario del siglo XXI que normalmente va a internet y encuentra cualquier cosa.
Si quieres cualquier lectura, hay sistemas comerciales como el que tiene Amazon Unlimited, que te permite leer, por una tarifa de siete dólares al mes, cientos de miles de libros. Entonces, lo que nosotros aportamos …ahora mismo es otro tipo de valor. Y el valor que nosotros estamos aportando ahora, precisamente, tiene que ver —en las bibliotecas universitarias— con el apoyo a nuestros investigadores.

1:26 – 2:05

Esto es ahora mismo lo que están haciendo las bibliotecas: están reimaginando sus espacios. Muchas bibliotecas que tenían secciones de referencia muy amplias, muy grandes, están retirando esas secciones de referencia. Porque si hay que consultar un dato, es más fácil ir a internet.
De hecho, un icono como es la Enciclopedia Británica, después de 400 años de vida, ha desaparecido. El icono más importante de la cultura occidental donde se reunían todos los saberes.

2:03 – 2:43

Ahora mismo estamos viendo la televisión, nos están informando sobre una persona, vamos a la Wikipedia y obtenemos esa información rápidamente. Con lo cual, la sección de referencia ha perdido esa capacidad que ha tenido siempre como una parte fundamental de la biblioteca.
Entonces, las bibliotecas están retirando esos espacios: son libros de consulta completamente desactualizados, porque la versión digital incorpora el dato de forma inmediata. Se muere un señor, y en cinco minutos ya tenemos la fecha de su muerte. Esto, para que ocurriera en formato …papel, tendría que esperarse a la edición del suplemento de esa enciclopedia con la fecha de muerte.

2:39 – 3:24

Entonces, ¿qué están haciendo? Se están retirando las enciclopedias, se están retirando los catálogos y otras cosas, y ese espacio se está dedicando al aprendizaje.
Además, cada vez más las teorías sobre el aprendizaje tienden a esto. Las teorías de PISA, el Espacio de Alfabetización Superior de EE. UU.: que los alumnos aprendan investigando más contenidos.

[Música]

La biblioteca y la construcción de la cultura de alfabetización en inteligencia artificial generativa

La biblioteca y la construcción de la cultura de alfabetización en inteligencia artificial generativa

por Julio Alonso Arévalo. Jornadas Técnicas Asociación de Bibliotecarios de la Iglesia en España. Valladolid 14/0372025

Ver en Youtube

En la era de la IA, la alfabetización informacional está evolucionando, adquiriendo una nueva dimensión. Es fundamental desarrollar la capacidad de comprender, evaluar e interactuar con la información generada por máquinas. La alfabetización en IA va más allá de la tradicional, enfrentando desafíos únicos como la identificación de medios manipulados, la comprensión de las implicaciones éticas y la distinción entre textos escritos por humanos y por IA. A medida que la IA transforma industrias, medios y comunicaciones, esta alfabetización capacita a las personas para juzgar la credibilidad de la información generada por IA, fomentando un uso ético y responsable de esta tecnología revolucionaria.

De profesión, bibliotecario: entrevista con Julio Alonso Arévalo

Ver en Youtube

Realizado por Enrique Muriel «De profesión bibliotecario» es una obra audiovisual que pretende ser un homenaje a todas las personas bibliotecarias, que gracias a sus iniciativas y proyectos consiguen influir positivamente en la vida de los miembros de su comunidad. En el mismo veremos el origen y funcionamiento del blog más influyente de biblioteconomia y ciencias de la información, un respetado programa de radio y un profesional de reconocido prestigio internacional. De alguna forma, también es un humilde homenaje a su carrera.

La inteligencia artificial y la generación de contenidos académicos

La inteligencia artificial y la generación de contenidos académicos

27 DE FEBRERO de 2025 10:00 AM de Colombia. 16 h. de España Escuela de Ingenieros Militares de Colombia Biblioteca Coronel Lino de Pombo de la Escuela de Ingenieros Militares los invita: CONFERENCIA Virtual GRATUITA

Conferenciante: Julio Alonso Arévalo Universidad de Salamanca

Sora, el esperado generador de videos de OpenAI

SORA

https://sora.com/

Sora de OpenAI promete revolucionar la generación de videos mediante inteligencia artificial, con un modelo que combina rapidez, flexibilidad y salvaguardias éticas, aunque aún se encuentra en una fase de expansión y mejoras.

Sora, el esperado generador de videos de OpenAI, finalmente fue lanzado tras una espera de 10 meses. Anunciado durante el evento  «12 days of OpenAI«, Sora Turbo es una versión mejorada que permite a los usuarios generar videos a partir de texto o sus propios materiales visuales, con una resolución de hasta 1080p y una duración máxima de 20 segundos. Este modelo es una expansión de la herramienta de generación de videos que OpenAI lanzó en febrero, y es significativamente más rápido.

Sora permite crear videos en diversos formatos, como widescreen, vertical o cuadrado, y ofrece herramientas como un «storyboard» para generar secuencias cuadro a cuadro. Además, los usuarios pueden modificar sus propios videos e imágenes, mezclándolos, extendiéndolos o reemplazándolos. Los videos generados pueden ser explorados en una interfaz similar a la de DALL-E 2, con feeds destacados y recientes para inspirar a los usuarios con creaciones de la comunidad.

Limitaciones y salvaguardias

Aunque Sora es prometedor, OpenAI advierte que el modelo tiene limitaciones, como generar físicas irreales y dificultades con acciones complejas a largo plazo. Además, para evitar el uso indebido, OpenAI ha bloqueado la creación de contenidos dañinos, como material de abuso infantil o deepfakes sexuales. Los videos generados incluyen metadatos C2PA y marcas de agua visibles para indicar que fueron creados por Sora, lo que ayuda a verificar su autenticidad.

Acceso y precios

Sora está disponible para los suscriptores de ChatGPT Plus y Pro, con diferentes niveles de acceso. Los usuarios de ChatGPT Plus (que paga 20$ al mes) pueden generar hasta 50 videos al mes a resolución 480p, mientras que los usuarios de la versión Pro (200$ al mes) tienen acceso a más videos, mayores resoluciones y duraciones más largas. OpenAI también está trabajando en un modelo de precios personalizado para diversos tipos de usuarios, que se lanzará en 2025. La disponibilidad se expandirá en los próximos meses, con la excepción de algunos países como el Reino Unido, Suiza y el Área Económica Europea.

La inteligencia artificial y su impacto en la escritura académica

Julio Alonso Arévalo. La inteligencia artificial y su impacto en la escritura académica . BUCLE, 2024

La inteligencia artificial está teniendo un impacto significativo en la escritura académica al ofrecer herramientas y recursos que facilitan el proceso de investigación, redacción y edición de documentos. Mediante el uso de algoritmos avanzados, los sistemas de inteligencia artificial pueden analizar grandes cantidades de información, extraer patrones y generar ideas para el desarrollo de un texto académico. Estas herramientas pueden ayudar a los estudiantes y profesores a ahorrar tiempo y esfuerzo al proporcionar sugerencias de vocabulario, estructura de párrafos y citas bibliográficas adecuadas. Además, la inteligencia artificial también puede contribuir a mejorar la calidad de los escritos académicos, al detectar errores gramaticales y de estilo, así como proporcionar recomendaciones para una redacción más clara y coherente. Sin embargo, es importante tener en cuenta que la inteligencia artificial no debe reemplazar el pensamiento crítico y la creatividad inherentes a la escritura académica, sino que debe utilizarse como una herramienta complementaria para mejorar y enriquecer el proceso de escritura.

VASA-1 de Microsoft puede transformar fotografías en animaciones sincronizadas en video que imitan el habla humana

VASA-1

Ejemplo 1

Ejemplo 2


Microsoft Research ha logrado un avance en tecnología de animación al desarrollar una aplicación de inteligencia artificial que convierte una imagen estática de una persona y una pista de audio en una animación realista con expresiones faciales adecuadas. El sistema, llamado VASA-1, puede transformar imágenes estáticas, como fotografías, dibujos o pinturas, en animaciones «exquisitamente sincronizadas» que imitan el habla humana y el canto.

VASA-1 está entrenado con miles de imágenes con una amplia variedad de expresiones faciales y puede producir imágenes de 512×512 píxeles a 45 cuadros por segundo. Sin embargo, debido al potencial de mal uso, el equipo de investigación actualmente no ha puesto el sistema disponible públicamente. Están dedicados a desarrollar la IA de manera responsable y no tienen planes de lanzar una demostración en línea, API, producto o detalles adicionales hasta estar seguros de que la tecnología se utilizará de manera responsable y de acuerdo con las regulaciones adecuadas.

El modelo principal, VASA-1, es capaz no solo de producir movimientos de labios exquisitamente sincronizados con el audio, sino también de capturar un amplio espectro de matices faciales y movimientos naturales de la cabeza que contribuyen a la percepción de autenticidad y vivacidad. Las innovaciones principales incluyen un modelo holístico de generación de dinámicas faciales y movimientos de cabeza que funciona en un espacio latente facial, y el desarrollo de un espacio latente facial expresivo y disociado utilizando videos. A través de experimentos extensos, incluida la evaluación en un conjunto de nuevas métricas, se demuestra que el método supera significativamente a los métodos anteriores en diversas dimensiones de manera integral. El método no solo ofrece una alta calidad de video con dinámicas faciales y de cabeza realistas, sino que también admite la generación en línea de videos de 512×512 a hasta 40 FPS con una latencia inicial insignificante. Allana el camino para interacciones en tiempo real con avatares realistas que emulan comportamientos conversacionales humanos.

El enfoque de investigación se centra en generar habilidades visuales afectivas para avatares virtuales de IA, con el objetivo de aplicaciones positivas. No pretenden crear contenido que se utilice para engañar o malinterpretar. Sin embargo, como otras técnicas relacionadas de generación de contenido, aún podría ser potencialmente mal utilizado para suplantar a humanos. Se oponen a cualquier comportamiento que cree contenidos engañosos o perjudiciales de personas reales, y están interesados en aplicar la técnica para avanzar en la detección de falsificaciones. Actualmente, los videos generados por este método aún contienen artefactos identificables, y el análisis numérico muestra que aún hay una brecha para lograr la autenticidad de los videos reales.

Aunque reconocen la posibilidad de mal uso, es imperativo reconocer el sustancial potencial positivo de la técnica. Los beneficios, como mejorar la equidad educativa, mejorar la accesibilidad para personas con desafíos de comunicación, ofrecer compañía o apoyo terapéutico a quienes lo necesitan, entre muchos otros, subrayan la importancia de la investigación y otras exploraciones relacionadas. Están dedicados a desarrollar la IA de manera responsable, con el objetivo de avanzar en el bienestar humano.

Dado dicho contexto, no tienen planes de lanzar una demostración en línea, API, producto, detalles de implementación adicionales o cualquier oferta relacionada hasta estar seguros de que la tecnología se utilizará de manera responsable y de acuerdo con las regulaciones adecuadas.