OpenAI presenta GPT-4o: un Sorprendente Modelo de IA Gratuito que Trabaja con voz, Texto e Imagen al Mismo Tiempo
POR REDACCIÓN
un nuevo modelo de inteligencia artificial (IA). Estamos hablando de GPT-4o, que se presenta como el producto más “inteligente y rápido” de la historia de la compañía dirigida por Sam Altman.
GPT-4o es multimodal de forma nativa, característica que aborda el problema de la latencia y permite una interacción «en tiempo real». Una buena noticia es que este prometedor modelo estará disponible para todos los usuarios de ChatGPT, incluso para aquellos que utilizan la versión gratuita.
El modelo más avanzado de OpenAI
La CTO de OpenAI, Muri Murati, dijo durante la transmisión que el nuevo modelo de IA tiene una «inteligencia al nivel de GPT-4», pero mejora en sus capacidades de texto, audio y visión. Este avance tecnológico ha permitido, entre otras cosas, desarrollar un nuevo modo de voz.
El modo de voz original de ChatGPT ofrecía respuestas con una latencia promedio de 2,8 segundos en GPT-3.5 y 5,4 segundos en GPT-4. El nuevo modo de voz rebaja el tiempo de respuesta hasta los 320 milisegundos y, gracias a GPT-4o, llega con un sistema de interacción mucho más natural.
Cuando esté disponible nos encontraremos con un asistente al que podremos hablarle en lenguaje completamente natural, como lo haríamos con otra persona. Por ejemplo, podremos interrumpirle mientras responde. Se trata de características que no habíamos visto en ninguna IA hasta el momento.