OpenAI lanza GPT-4o, su nuevo modelo de IA Gratuito con respuestas en tiempo real y capacidades de entendimiento de audio y video capaz de detectar emociones

Wiggers, Kyle. «OpenAI Debuts GPT-4o “omni” Model Now Powering ChatGPT». TechCrunch, 13 de mayo de 2024. https://techcrunch.com/2024/05/13/openais-newest-model-is-gpt-4o/.


OpenAI recientemente presentó su última novedad de inteligencia artificial, GPT-4o, e introdujo una versión de escritorio de ChatGPT, brindando un conjunto de funciones mejoradas al alcance de todos los usuarios de forma gratuita. GPT-4o («o» de «omni») es un paso adelante hacia una interacción mucho más natural entre el ser humano y el ordenador: acepta como entrada cualquier combinación de texto, audio e imagen y genera cualquier combinación de texto, audio e imagen como salida.

OpenAI lanzó el lunes un nuevo modelo de IA y una versión de escritorio de ChatGPT, junto con una nueva interfaz de usuario. La actualización pone GPT-4 a disposición de todo el mundo, incluidos los usuarios gratuitos de OpenAI, según explicó la directora técnica Mira Murati en un evento retransmitido en directo. Añadió que el nuevo modelo, GPT-4o, es «mucho más rápido», con capacidades mejoradas en texto, vídeo y audio.

Los miembros del equipo de OpenAI también demostraron las capacidades de audio del nuevo modelo, pidiendo ayuda para calmarse antes de un discurso público. Mark Chen, investigador de OpenAI, afirmó que el modelo es capaz de «percibir tus emociones», y añadió que también puede hacer frente a las interrupciones de los usuarios.

Durante la retransmisión en directo, OpenAI demostró las capacidades de conversación de audio en tiempo real de GPT-4o, mostrando su capacidad para entablar un diálogo natural y receptivo sin el típico retraso de 2-3 segundos experimentado con modelos anteriores. El asistente de IA parecía captar fácilmente las emociones, adaptaba su tono y estilo a las peticiones del usuario e incluso incorporaba efectos de sonido, risas y canciones a sus respuestas.

Cuando esté disponible, nos encontraremos con un asistente con el que podremos comunicarnos de manera completamente natural, como lo haríamos con otro ser humano. Podremos interrumpirlo mientras responde, características que hasta ahora no se habían visto en ninguna otra IA. El modelo no solo ofrece respuestas instantáneas, sino que también proporciona respuestas en una variedad de tonos de voz, e incluso puede reír, cantar, expresar diferentes estados de ánimo y resolver problemas matemáticos. Una de las características destacadas que llegará a ChatGPT gracias al nuevo modelo es la traducción instantánea. OpenAI busca que simplemente le pidamos lo que queramos al chatbot para que comience a hacer su trabajo, todo en lenguaje natural, sin necesidad de pensar en comandos específicos.

Además, se destacó la comprensión visual mejorada de GPT-4o. Al cargar capturas de pantalla, documentos que contienen texto e imágenes o gráficos, los usuarios pueden mantener conversaciones sobre el contenido visual y recibir análisis de datos de GPT-4o. En la demostración, el modelo demostró su capacidad para analizar selfies, detectar emociones y participar en bromas animadas sobre las imágenes.

Las características disponibles para los usuarios gratuitos de ChatGPT incluirán inteligencia de nivel GPT-4, respuestas tanto del modelo como de la web, análisis de datos y creación de gráficos, conversaciones sobre fotos tomadas, asistencia para resumir, escribir o analizar archivos cargados, y la posibilidad de descubrir y utilizar GPTs y la tienda GPT para construir una experiencia más útil con la función de Memoria.

Entre las funciones disponibles para los usuarios gratuitos de ChatGPT a partir de ahora se incluyen las siguientes, según OpenAI:

  • Experiencia de inteligencia de nivel GPT-4
  • Obtener respuestas tanto del modelo como de la web
  • Analizar datos y crear gráficos
  • Conversa sobre las fotos que haces
  • Sube archivos para que te ayuden a resumir, escribir o analizar
  • Descubrir y utilizar GPTs y el GPT Store
  • Construye una experiencia más útil con la Memoria

3 comentarios en “OpenAI lanza GPT-4o, su nuevo modelo de IA Gratuito con respuestas en tiempo real y capacidades de entendimiento de audio y video capaz de detectar emociones

  1. Pingback: Astra es la respuesta «multimodal» de Google al nuevo ChatGPT que se integrará en unas gafas de realidad aumentada | Universo Abierto

  2. Pingback: Nuevo IA CHAT GPT-4o detecta emociones | ramonmaynou

  3. Pingback: Las 100 principales aplicaciones de IA generativa en 2025: Tendencias, crecimiento y competencia | Universo Abierto

Los comentarios están cerrados.