¡La espera ha terminado! El esperado modo de voz de ChatGPT, anunciado en 2023, finalmente está disponible para algunos usuarios selectos de ChatGPT Plus. Este avance promete transformar la manera en que interactúas con el chatbot de inteligencia artificial, permitiendo conversaciones más naturales y dinámicas. A continuación, te explicamos cómo activar el modo voz en ChatGPT y qué mejoras trae consigo.
- También podrías leer: SearchGPT: cómo funcionará el buscador con inteligencia artificial de OpenAI
¿Cómo saber si tienes acceso al modo voz en ChatGPT?
Si eres usuario de ChatGPT Plus, podrías ser uno de los afortunados en probar el modo de voz. OpenAI está notificando a los usuarios seleccionados a través de correo electrónico y notificaciones en la aplicación móvil. Este modo de voz «alpha» está limitado a un pequeño grupo de usuarios inicialmente, pero la compañía planea expandir el acceso a todos los miembros de Plus en otoño (estadounidense).
Características del modo de voz avanzado
El nuevo modo de voz ofrece una experiencia de conversación más fluida y realista. Entre sus características destacadas se encuentran la capacidad de interrumpir en cualquier momento y la detección de emociones, lo que permite respuestas más empáticas y contextuales. OpenAI ha probado esta función con más de 100 equipos externos en 45 idiomas para garantizar la calidad y seguridad.
Mejoras en GPT-4o
El modelo GPT-4o, el cual incluye el modo de voz, representa un avance significativo respecto a GPT-4. A diferencia de versiones anteriores, GPT-4o integra texto, audio e imagen en una sola red neuronal, permitiendo respuestas en audio en tan solo 232 milisegundos, similar al tiempo de respuesta humano. Esto reduce la latencia notablemente en comparación con los tiempos anteriores de 2,8 segundos (GPT-3.5) y 5,4 segundos (GPT-4).
¿Qué esperar a futuro?
Además de las mejoras en el modo de voz, OpenAI planea introducir otras funciones como el envío de videos con instrucciones en ChatGPT. La compañía está trabajando para reforzar la seguridad y calidad de las conversaciones, y se espera que los resultados de las pruebas se compartan a principios de agosto antes de la expansión general.