Durante la conferencia Google I/O 2025, la compañía tecnológica presentó oficialmente Gemini 2.5, su modelo de inteligencia artificial más avanzado hasta la fecha. Entre sus novedades destaca Deep Think, un modo de razonamiento mejorado que incrementa el rendimiento en matemáticas, programación y razonamiento multimodal, superando los modelos actuales de la competencia.
- Te podría interesar: Meta utilizará inteligencia artificial para detectar cuentas de menores de edad en Instagram
Deep Think utiliza nuevas técnicas de investigación que le permiten generar múltiples hipótesis antes de emitir una respuesta. Según las métricas presentadas, Gemini 2.5 Pro Deep Think obtuvo resultados sobresalientes: una puntuación elevada en el benchmark matemático USAMO 2025, el primer lugar en LiveCodeBench, y un 84.0% en el benchmark MMMU, que evalúa el razonamiento multimodal. Estos resultados lo posicionan por encima de modelos como GPT-4o-mini de OpenAI.
Además, se presentó un gráfico comparativo que demuestra las capacidades superiores del modelo de Google frente a otros sistemas de inteligencia artificial actuales.
Funciones mejoradas: desde emociones en tiempo real hasta programación autónoma
Una de las innovaciones presentadas es la LIVE API, que habilita funciones como:
- Diálogo afectivo, que detecta emociones en la voz del usuario y responde de forma contextual.
- Audio proactivo, que ignora el ruido ambiental para responder solo cuando corresponde.
- Pensamiento en vivo, que permite al modelo ejecutar tareas complejas gracias a sus capacidades de razonamiento en tiempo real.
Durante el evento también se anunció el lanzamiento de Google AI Ultra, un plan premium que brinda acceso exclusivo a los modelos más avanzados, con límites de uso ampliados y características especiales. El costo es de $249.99 mensuales en Estados Unidos, con disponibilidad global próxima.
Por otro lado, Jules fue presentado como un asistente de programación autónomo que trabaja de forma asincrónica. Aunque aún no está disponible al público general, promete integrarse con repositorios existentes y gestionar tareas sin intervención directa del usuario.
Gemini en productos de Google y expansión de capacidades
El buscador de Google también evoluciona con la implementación del AI Mode en Estados Unidos, ofreciendo una experiencia más interactiva impulsada por los modelos Gemini. A su vez, la funcionalidad Visión general generada por IA ya está activa en más de 200 países y en más de 40 idiomas.
Gemini también se integra con productos como:
- Workspace, con nuevas funciones como respuestas inteligentes personalizadas en Gmail, traducción de voz en tiempo real en Google Meet y soporte extendido en Documentos, Vids y Presentaciones.
- Gemini Live y Search Live, que adoptan capacidades del Proyecto Astra, incluyendo comprensión de video, uso compartido de pantalla y memoria contextual.
Además, Google presentó sus modelos generativos de nueva generación: Imagen 4 para imágenes, Veo 3 para videos y Lyria 2 para generación de música. También se anunció Google Beam, evolución de Project Starline, con enfoque en la comunicación 3D basada en inteligencia artificial.
Por último, la herramienta Flow permitirá a los creadores producir contenido audiovisual a través de IA, mientras que Speech Translation ofrecerá traducción de voz en tiempo real con conservación del tono y matiz original, mejorando la comunicación multilingüe.