OpenAI continúa liderando la carrera en inteligencia artificial con el lanzamiento de GPT-4o, un modelo revolucionario capaz de razonar en tiempo real a través de audio, visión y texto. Lo más emocionante es que se integrará de manera gratuita a ChatGPT, comenzando con soporte para texto e imágenes y, más adelante, también para voz y video para los usuarios Premium. Conoce cómo activar GPT-4o.
- También podrías leer: Convertir texto a video: ahora será posible con Sora AI
Características y mejoras de GPT-4o
En mayo, OpenAI presentó GPT-4o («o» por «omni»), destacando su avance hacia una interacción más natural entre humanos y computadoras. Este nuevo modelo permite que las instrucciones se den en una combinación de texto, audio e imagen, generando respuestas en los mismos formatos. GPT-4o puede procesar entradas de audio en tan solo 232 milisegundos, acercándose al tiempo de respuesta humano en una conversación.
Antes de este lanzamiento, los modos de voz en ChatGPT presentaban latencias significativas: 2,8 segundos con GPT-3.5 y 5,4 segundos con GPT-4. Sin embargo, GPT-4o utiliza un único modelo para texto, visión y audio, integrando todas las entradas y salidas en la misma red neuronal. Esto permite una comprensión más precisa del tono, múltiples hablantes y ruidos de fondo, así como la capacidad de expresar emociones, reír o incluso cantar.
Rendimiento y aplicaciones de GPT-4o
GPT-4o iguala el rendimiento de GPT-4 Turbo en texto en inglés y código, y ofrece mejoras significativas en otros idiomas. Además, es más rápido y económico, siendo un 50% más eficiente en la API. Este modelo se destaca especialmente en la visión y comprensión de audio.
Por ejemplo, GPT-4o puede distinguir y transcribir con precisión las voces en una conversación con múltiples personas. En cuanto a elementos gráficos, permite combinar texto e imágenes para crear gráficos en 2D, 3D y otros formatos según las instrucciones del usuario.
OpenAI asegura que GPT-4o ha sido rigurosamente evaluado en términos de ciberseguridad y privacidad, contando con la revisión de un equipo externo de 70 expertos en diversas áreas.
¿Cómo activar GPT-4o en ChatGPT?
Para habilitar GPT-4o en ChatGPT, simplemente inicia sesión en la plataforma y selecciona GPT-4o en el menú del modelo de IA en la parte superior izquierda. Los usuarios gratuitos tendrán acceso predeterminado a GPT-4o, aunque con límites en la cantidad de mensajes que pueden enviar, basados en la demanda y el uso actual.
Los usuarios de ChatGPT Plus podrán disfrutar de hasta cinco veces más mensajes que los usuarios gratuitos y tendrán acceso al soporte de audio en GPT-4o en las próximas semanas. Desde el 13 de mayo de 2024, los usuarios Plus pueden enviar hasta 80 mensajes cada 3 horas en GPT-4o y hasta 40 mensajes cada 3 horas en GPT-4.
GPT-4o también ofrece capacidades avanzadas de visión, mejorando la precisión en la interpretación de imágenes. Si aún no ves disponible esta función en tu país, como Perú, no te preocupes, estará disponible muy pronto.
OpenAI promete seguir explorando y expandiendo las capacidades de GPT-4o, ofreciendo a los usuarios una herramienta de inteligencia artificial cada vez más poderosa y versátil.