Archivo de la etiqueta: Inteligencia artificial

Gemini la herramienta de inteligencia artificial de Google permite resumir el contenido de carpetas completas antes de abrirlas

Andrew Romero, «Gemini Now Summarizes Entire Folders in Google Drive,» 9to5Google, December 12, 2024, https://9to5google.com/2024/12/12/gemini-summarizes-entire-folders-google-drive/

Google Drive ha incorporado una nueva función impulsada por Gemini, la herramienta de inteligencia artificial de Google, que permite resumir el contenido de carpetas completas antes de abrirlas. Esta funcionalidad está diseñada para ahorrar tiempo al ofrecer una visión general del contenido de carpetas grandes sin necesidad de explorar cada archivo.

Para usar esta función, los usuarios pueden hacer clic derecho sobre una carpeta y seleccionar “Summarize this folder”, lo que abre un panel lateral con un resumen de los archivos que contiene. Alternativamente, pueden arrastrar la carpeta al panel de Gemini para obtener un análisis más detallado.

Gemini puede identificar y describir diversos tipos de archivos, incluidos documentos de texto, hojas de cálculo, presentaciones, imágenes e incluso reconocer logotipos y marcas en fotos. Esta herramienta es especialmente útil para gestionar grandes volúmenes de información de manera eficiente.

La función comenzó a implementarse el 11 de diciembre y estará disponible en las próximas dos semanas para usuarios con cuentas Google One AI Premium y para suscripciones Gemini Business, Enterprise, Education y Education Premium.

ChatGPT permite usar la cámara del móvil para que la IA analice lo que ve y responda en tiempo real.

Advanced Voice Mode

Con la incorporación reciente de visión (Advanced Voice Mode con visión), ahora también puede interpretar lo que ve a través de la cámara del dispositivo o lo que aparece en la pantalla mediante el uso compartido de pantalla.

OpenAI ha lanzado una nueva función para ChatGPT llamada Advanced Voice Mode con visión, que permite usar la cámara del móvil para que la IA analice lo que ve y responda en tiempo real. Por ejemplo, puedes apuntar a un objeto y ChatGPT te dirá qué es. Además, ahora puede entender lo que aparece en la pantalla de tu dispositivo mediante el uso compartido de pantalla, ayudándote con configuraciones o incluso con problemas matemáticos.

Esta función está disponible para los usuarios de las suscripciones Plus, Team y Pro de ChatGPT. Para usarla, solo hay que tocar el icono de video en la app o activar la opción de «compartir pantalla» desde el menú. Sin embargo, no todos tendrán acceso inmediato: los usuarios de la UE, Suiza, Islandia, Noruega y Liechtenstein tendrán que esperar, al igual que los suscriptores de ChatGPT Enterprise y Edu, que lo recibirán en enero.

Durante las pruebas, ChatGPT mostró habilidades interesantes, como interpretar dibujos anatómicos en tiempo real, aunque también cometió errores en problemas de geometría. Esto demuestra que la función aún puede fallar, pero marca un gran avance en el uso de inteligencia artificial para interactuar con el mundo real.

¿Qué es Advanced Voice Mode de OpenAI?
Advanced Voice Mode es una función de ChatGPT que permite interactuar de manera más natural con la inteligencia artificial utilizando la voz. Esta tecnología hace que ChatGPT sea capaz de responder en tiempo real con una voz humanizada y mantener conversaciones más fluidas, como si estuvieras hablando con otra persona.

Con la incorporación reciente de visión (Advanced Voice Mode con visión), ahora también puede interpretar lo que ve a través de la cámara del dispositivo o lo que aparece en la pantalla mediante el uso compartido de pantalla.

¿Qué se puede hacer con Advanced Voice Mode?

Conversaciones por voz:
Habla con ChatGPT en lugar de escribir, y recibe respuestas habladas de forma natural. Ideal para cuando necesitas manos libres o quieres una interacción más directa.
Reconocimiento visual en tiempo real:
Apunta la cámara del móvil hacia un objeto y ChatGPT puede identificarlo o describirlo. Por ejemplo, podría reconocer un utensilio de cocina, una planta o un dispositivo tecnológico.
Interacción con la pantalla del dispositivo:
Al compartir la pantalla, ChatGPT puede interpretar menús, configuraciones o aplicaciones, y ayudarte a navegar por ellas o resolver problemas. Por ejemplo:
- Explicar opciones en la configuración del teléfono.
- Dar sugerencias para resolver problemas matemáticos que se muestran en la pantalla.
Asistencia en tareas visuales:
ChatGPT puede analizar dibujos o imágenes en tiempo real. Por ejemplo, puede evaluar un boceto, identificar formas o sugerir mejoras.
Experiencia personalizada:
Gracias a su capacidad de comprensión multimodal, combina texto, voz y visión para ofrecer respuestas adaptadas y ricas en contexto.

OpenAI también lanzó una función adicional llamada “Santa Mode,”, que permite cambiar la voz de ChatGPT a la de Santa Claus, agregando un toque festivo para esta temporada navideña. Mientras tanto, otras empresas como Google y Meta trabajan en funciones similares para sus propios asistentes de IA.

Sora, el esperado generador de videos de OpenAI

SORA

https://sora.com/

Sora de OpenAI promete revolucionar la generación de videos mediante inteligencia artificial, con un modelo que combina rapidez, flexibilidad y salvaguardias éticas, aunque aún se encuentra en una fase de expansión y mejoras.

Sora, el esperado generador de videos de OpenAI, finalmente fue lanzado tras una espera de 10 meses. Anunciado durante el evento «12 days of OpenAI«, Sora Turbo es una versión mejorada que permite a los usuarios generar videos a partir de texto o sus propios materiales visuales, con una resolución de hasta 1080p y una duración máxima de 20 segundos. Este modelo es una expansión de la herramienta de generación de videos que OpenAI lanzó en febrero, y es significativamente más rápido.

Sora permite crear videos en diversos formatos, como widescreen, vertical o cuadrado, y ofrece herramientas como un «storyboard» para generar secuencias cuadro a cuadro. Además, los usuarios pueden modificar sus propios videos e imágenes, mezclándolos, extendiéndolos o reemplazándolos. Los videos generados pueden ser explorados en una interfaz similar a la de DALL-E 2, con feeds destacados y recientes para inspirar a los usuarios con creaciones de la comunidad.

Limitaciones y salvaguardias

Aunque Sora es prometedor, OpenAI advierte que el modelo tiene limitaciones, como generar físicas irreales y dificultades con acciones complejas a largo plazo. Además, para evitar el uso indebido, OpenAI ha bloqueado la creación de contenidos dañinos, como material de abuso infantil o deepfakes sexuales. Los videos generados incluyen metadatos C2PA y marcas de agua visibles para indicar que fueron creados por Sora, lo que ayuda a verificar su autenticidad.

Acceso y precios

Sora está disponible para los suscriptores de ChatGPT Plus y Pro, con diferentes niveles de acceso. Los usuarios de ChatGPT Plus (que paga 20$ al mes) pueden generar hasta 50 videos al mes a resolución 480p, mientras que los usuarios de la versión Pro (200$ al mes) tienen acceso a más videos, mayores resoluciones y duraciones más largas. OpenAI también está trabajando en un modelo de precios personalizado para diversos tipos de usuarios, que se lanzará en 2025. La disponibilidad se expandirá en los próximos meses, con la excepción de algunos países como el Reino Unido, Suiza y el Área Económica Europea.

Resúmenes inteligentes: ¿Marcará la inteligencia artificial el final de las revisiones bibliográficas biomédicas?

Carlo Galli, Chiara Moretti, y Elena Calciolari, «Intelligent Summaries: Will Artificial Intelligence Mark the Finale for Biomedical Literature Reviews?», Learned Publishing n/a, n.^o n/a: e1648, accedido 11 de diciembre de 2024, https://doi.org/10.1002/leap.1648.

Se examina el impacto de la inteligencia artificial (IA), especialmente los modelos de lenguaje de gran tamaño (LLM), en la creación de resúmenes automáticos de la literatura científica, en particular en el campo biomédico. Los autores del artículo discuten cómo los avances en IA están transformando el proceso de revisión de la literatura.

El artículo destaca que los LLM han alcanzado capacidades generativas que imitan el discurso humano, lo que les permite resumir documentos y extraer información de textos con una precisión notable. Además, los sistemas de R.A.G. (retrieval-augmented generation) están en desarrollo, lo que les permitirá navegar por bases de datos como MEDLINE y extraer conocimientos relevantes para crear resúmenes completos de la literatura científica disponible.

Según los autores, estos avances pueden llevar a que los resúmenes generados por IA sean comparables a las revisiones tradicionales de literatura científica realizadas por expertos humanos. Esto podría hacer que las revisiones de literatura tradicionales sean obsoletas, ya que la IA podría realizar el trabajo de manera más rápida y con una precisión similar, si no superior.

A medida que la disponibilidad de resúmenes automatizados aumenta, el umbral para lo que se considera digno de publicación podría elevarse, ya que los investigadores y editores podrían exigir más creatividad, profundidad o perspectiva única en las publicaciones para diferenciarlas de los resúmenes automáticos. En este contexto, los resúmenes generados por IA podrían ser una herramienta útil, pero las revisiones de literatura futuras probablemente tendrán que capitalizar las capacidades humanas de imaginación, creatividad y abstracción para mantenerse relevantes y útiles en un mundo cada vez más dominado por la IA.

Así, los autores proponen que, aunque la inteligencia artificial tiene el potencial de revolucionar la forma en que se llevan a cabo las revisiones bibliográficas, estas no eliminarán por completo el papel de los humanos en el proceso. Más bien, el enfoque humano deberá evolucionar, apoyándose en capacidades que la IA no puede replicar, para asegurar que las revisiones de literatura sigan siendo valiosas en la era de la automatización.

ChatGPT y otras herramientas de IA podrían transformar la publicación científica

Gemma Conroy, «How ChatGPT and Other AI Tools Could Disrupt Scientific Publishing», Nature 622, n.^o 7982 (10 de octubre de 2023): 234-36, https://doi.org/10.1038/d41586-023-03144-w.

La inteligencia artificial generativa tiene el potencial de transformar profundamente la publicación científica, pero su integración debe gestionarse cuidadosamente. Solo a través de un enfoque responsable y ético será posible maximizar sus beneficios mientras se mitigan los riesgos asociados.

Las herramientas de inteligencia artificial generativa, como ChatGPT, están revolucionando la publicación científica al transformar la forma en que se redactan y revisan manuscritos, informes de revisión por pares y solicitudes de subvenciones. Estas herramientas ofrecen beneficios significativos, como mayor eficiencia y equidad, pero también plantean preocupaciones relacionadas con la precisión, la ética y la calidad de las publicaciones. Por ejemplo, investigadores no nativos en inglés pueden superar barreras lingüísticas con la ayuda de estas tecnologías, mientras que el tiempo necesario para redactar documentos se reduce considerablemente. Sin embargo, estas mismas herramientas presentan riesgos asociados a inexactitudes y posibles usos indebidos.

Uno de los mayores cambios que trae la inteligencia artificial es la posible transformación del formato de los artículos científicos. En el futuro, los artículos podrían presentarse como documentos interactivos que permiten al lector explorar los datos y resultados de manera personalizada, en lugar de depender de los formatos estáticos actuales. Asimismo, la IA podría facilitar la realización de meta-análisis más amplios y detallados al procesar grandes volúmenes de literatura científica, algo que excede las capacidades humanas tradicionales. Esto abriría nuevas posibilidades para descubrir patrones y tendencias en la investigación.

No obstante, el uso de herramientas de IA generativa no está exento de riesgos. Estas tecnologías, al basarse en patrones más que en la verificación de hechos, pueden generar errores, referencias falsas o incluso artículos fraudulentos. Además, su accesibilidad podría fomentar prácticas poco éticas, como la proliferación de “fábricas de artículos”, donde se crean y venden manuscritos o posiciones de autoría. Por otro lado, las herramientas actuales para detectar textos generados por IA no son lo suficientemente fiables, lo que dificulta la identificación de fraudes y plantea un desafío significativo para los editores y revisores.

En el ámbito ético, el desarrollo de estas tecnologías también genera preocupaciones sobre plagio y derechos de autor. Muchos modelos de IA se entrenan con datos recopilados de Internet sin garantizar el consentimiento ni respetar restricciones de uso, lo que ha llevado a críticas que describen a la IA generativa como “plagio automatizado”. Además, las preocupaciones sobre la confidencialidad en la revisión por pares han llevado a algunas instituciones a prohibir el uso de estas herramientas en procesos sensibles como la evaluación de becas.

La equidad es otro aspecto clave. Mientras que herramientas como ChatGPT podrían nivelar el campo de juego para investigadores que no hablan inglés como lengua nativa, la posible monetización de estas tecnologías podría limitar su acceso a científicos de instituciones con menos recursos. Esto podría agravar las desigualdades ya existentes en la academia, especialmente si las herramientas avanzadas se vuelven prohibitivamente caras.

Para abordar estos desafíos, es esencial equilibrar la innovación con la integridad. Las revistas científicas deben establecer directrices claras sobre el uso de la IA, mientras que los gobiernos y las instituciones deben regular su implementación para garantizar una adopción ética y equitativa. Por su parte, los investigadores deben mantener habilidades críticas en redacción y análisis para no depender exclusivamente de estas herramientas en un entorno académico en rápida evolución.

Los editores están vendiendo artículos para entrenar IA y generando millones de dólares

Kwon, Diana. «Publishers Are Selling Papers to Train AIs — and Making Millions of Dollars.» Nature, December 9, 2024. https://www.nature.com/articles/d41586-024-04018-5.

Con el aumento de la popularidad de la inteligencia artificial generativa (IA), varios editores académicos han establecido acuerdos con empresas tecnológicas que buscan utilizar contenido académico para entrenar los grandes modelos de lenguaje (LLMs) que sustentan sus herramientas de IA. Estos acuerdos han resultado altamente lucrativos, generando millones de dólares para los editores involucrados.

Roger Schonfeld, co-creador de un nuevo rastreador de acuerdos y vicepresidente de bibliotecas, comunicación académica y museos en Ithaka S+R, una firma de consultoría en educación superior con sede en Nueva York, comenta: “Estábamos observando anuncios de estos acuerdos y comenzamos a pensar que esto está empezando a convertirse en un patrón”. Schonfeld y su equipo lanzaron en octubre Generative AI Licensing Agreement Tracker, una herramienta destinada a recoger los acuerdos que se están realizando entre editores y compañías de tecnología.

El rastreador tiene como objetivo no solo documentar cada acuerdo individual, sino también identificar y analizar las tendencias generales que emergen de estos acuerdos. Al proporcionar una fuente centralizada de información, el tracker facilita que la comunidad académica y tecnológica comprendan mejor cómo se está utilizando el contenido académico para el desarrollo de IA generativa.

Este fenómeno refleja una creciente intersección entre la publicación académica y el desarrollo de tecnologías avanzadas de IA. Los editores, al vender derechos de uso de sus artículos para entrenar modelos de lenguaje, están aprovechando nuevas oportunidades de ingresos, mientras que las empresas de tecnología aseguran el acceso a vastas cantidades de datos necesarios para mejorar la precisión y capacidad de sus sistemas de IA.

El seguimiento de estos acuerdos es crucial para mantener la transparencia en cómo se utiliza el contenido académico y para asegurar que se respeten los derechos de los autores y las instituciones educativas. Además, este rastreador puede ayudar a identificar posibles implicaciones éticas y legales relacionadas con el uso de investigaciones académicas en el entrenamiento de inteligencias artificiales.

Principales acuerdos:

Taylor & Francis firmó un acuerdo de 10 millones de dólares con Microsoft

Wiley generó 23 millones de dólares en un acuerdo con una empresa no revelada y espera otros 21 millones este año.

Otros grandes editores, como Elsevier y Springer Nature, no han comentado sobre acuerdos similares.

También los editores están creando nuevas posiciones y programas, como el «Wiley AI Partnerships», para formalizar colaboraciones con empresas de tecnología. Esto refleja que estos acuerdos no son excepcionales, sino parte de una estrategia a largo plazo.

Los acuerdos entre editores académicos y empresas de IA están transformando la publicación científica, generando ingresos sustanciales y redefiniendo la relación entre autores, editores y tecnología. Sin embargo, el debate sobre la transparencia y las implicaciones éticas de estas prácticas sigue abierto.

Algunos académicos han mostrado preocupación por el uso de su contenido sin su conocimiento.

De Gruyter Brill creó una página informativa para explicar los acuerdos y abordar las inquietudes de los autores.
Cambridge University Press & Assessment adoptó un enfoque de participación voluntaria, contactando a 20.000 autores para obtener su consentimiento explícito.

Cómo identificar texto generado por IA: 7 maneras de saber si el contenido fue creado por un bot

Townsend, C. (2024, noviembre 26). How to identify AI-generated text: 7 ways to tell if content was made by a bot. Mashable. https://mashable.com/article/how-to-identify-ai-generated-text

A medida que el contenido generado por IA se vuelve más común en nuestra vida cotidiana, surgen preguntas como «¿Cómo identificar texto creado por IA?». Aunque la tecnología avanza, todavía hay formas de reconocerlo, principalmente con observación atenta.

A diferencia de las imágenes o los videos, el texto sintético es casi imposible de detectar a simple vista.

“Estos son algunos consejos para identificar posibles textos generados por IA:

Uso frecuente de palabras como “the”, “it” y “its”. («el», “ello” y “su”)
Ausencia de errores tipográficos: los textos generados por IA suelen ser demasiado perfectos.
Declaraciones conclusivas que resumen párrafos de manera impecable.
Escritura excesivamente prolija o con contenido inflado.
Información y fuentes falsas o fabricadas.
Un tono más avanzado que el habitual en los textos del escritor.
Frases repetitivas o gramática inusualmente pulida.

También existen detectores de texto generado por IA en el mercado, pero, según mi experiencia, es probable que sean menos fiables que tus propios ojos.”

Existen herramientas como GPTZero y Copyleaks que prometen detectar textos generados por IA. Sin embargo, su precisión es limitada, especialmente con modelos avanzados como GPT-4, que imitan el estilo humano con gran fluidez. Aunque las herramientas pueden ser útiles, la observación crítica sigue siendo la mejor forma de detectar textos generados por IA, especialmente a medida que los modelos se vuelven más sofisticados.

La revolución de la generación de imágenes con IA: tecnología que transforma la creación visual

Karr, Douglas. “The Revolution of AI Image Generation: Understanding the Technology Reshaping Visual Creation.” MarTech Zone, December 3, 2024. https://martech.zone/ai-image-generation-explanation-prompts-examples/

En los últimos años, la creación visual ha sido revolucionada por la inteligencia artificial (IA), que se ha consolidado como una herramienta poderosa para artistas. Lo que comenzó como proyectos experimentales ahora permite a plataformas avanzadas generar imágenes de alta calidad a partir de simples descripciones textuales. Esta democratización ha abierto nuevas posibilidades para la creatividad visual.

Esta tecnología combina ciencia computacional, arte y creatividad humana. Se basa principalmente en modelos de difusión, redes neuronales avanzadas entrenadas con millones de imágenes. Durante el entrenamiento, los modelos aprenden a descomponer imágenes claras en ruido aleatorio, entendiendo así las relaciones entre el ruido y los elementos visuales. Luego, generan nuevas imágenes al revés: partiendo del ruido, refinan los detalles hasta formar imágenes coherentes, guiados por descripciones textuales.

Principales plataformas de generación de imágenes con IA:

Midjourney: Destacada por su estética artística e imaginativa.
DALL-E: De OpenAI, ofrece versatilidad y capacidad para interpretar solicitudes complejas, ideal para usos comerciales.
Stable Diffusion: Plataforma de código abierto que permite personalización y uso local, favorita entre usuarios técnicos.

El arte de crear prompts

El éxito en la generación de imágenes radica en diseñar prompts efectivos. A diferencia del texto, los prompts visuales requieren precisión y detalle. Los ajustes en el lenguaje pueden producir resultados radicalmente diferentes, ya que cada generación es un proceso nuevo. Conceptos como la composición, la iluminación, el estilo artístico y las especificaciones técnicas son claves para obtener imágenes consistentes y de calidad.

Ejemplo de prompt y evolución paso a paso sería describir una «claro del bosque mágico de noche» e ir añadiendo detalles como iluminación, perspectiva, texturas, paleta de colores y estilo artístico. Esto permite al sistema interpretar mejor la intención del creador.

Futuro y consideraciones éticas

La generación de imágenes con IA plantea desafíos éticos, como el impacto en artistas humanos, derechos de autor y atribución artística. A medida que la tecnología avanza, es crucial establecer marcos responsables para su uso. En el futuro, se espera un control más fino de las imágenes, una comprensión mejorada de las escenas complejas y más herramientas para integrar esta tecnología en procesos creativos.

La generación de imágenes con IA no busca reemplazar la creatividad humana, sino ampliarla. Su evolución seguirá transformando cómo creamos, experimentamos y entendemos el arte visual.

Inteligencia Artificial: conceptos clave y tendencias para la Iinnovación educativa

Gómez-Zermeño, M. G. (2023). Inteligencia Artificial. Conceptos clave y tendencias para la innovación educativa. Editorial Transdigital.

Texto completo

En la era actual, marcada por una transformación digital vertiginosa en todos los ámbitos de la sociedad, la Inteligencia Artificial (IA) emerge como un agente disruptivo que se posiciona como elemento clave de innovación. En el sector educativo su influencia no solo es evidente, sino que también está haciendo que redefinamos la forma en que se concibe la enseñanza y el aprendizaje.

Cada vez más, organismos internacionales, autoridades educativas, investigadores, directivos y docentes tienen el reto de incorporar herramientas y de extraer el máximo provecho para potenciar los aprendizajes de sus estudiantes, especialmente en un entorno que evoluciona constantemente hacia la complejidad.

Inteligencia artificial e investigación universitaria: retos y desafíos

Martha Elena Cuevas Gómez, Doris Laury Beatriz (eds) Inteligencia artificial e investigación universitaria: retos y desafíos. México: Editorial Transdigital, 2024.