TLDR : Google ha anunciado en el Google I/O 2025 actualizaciones de sus modelos de IA Gemini 2.5, Veo 3 e Imagen 4, así como la integración de un nuevo modo AI en el motor de búsqueda. Entre las mejoras, se destaca un modo de razonamiento mejorado para Gemini 2.5, un despliegue de AI Mode en Estados Unidos para búsquedas más profundas, y la evolución del Project Starline en Google Beam para conversaciones en 3D más realistas.
Sin gran sorpresa, la IA dominó los anuncios de Google I/O 2025: actualizaciones de los modelos Gemini 2.5, Veo 3 e Imagen 4, AI Mode para el motor de búsqueda... Google coloca la IA y Gemini en el corazón de sus productos.
La familia Gemini 2.5
Gemini 2.5 Pro, lanzado en marzo pasado, ahora cuenta con un modo de razonamiento mejorado llamado
Deep Think. Este modo permite al modelo dedicar más ciclos de cálculo a tareas complejas, especialmente en matemáticas o programación, y explorar varias hipótesis antes de formular una respuesta.
Gemini 2.5 Flash, presentado en abril pasado, es un modelo de razonamiento híbrido, que permite a los desarrolladores activar o desactivar la reflexión, diseñado para ofrecer un equilibrio óptimo entre costo, rendimiento y latencia.
Google ha anunciado mejoras en razonamiento, gestión de código, procesamiento multimodal y comprensión de contextos extendidos, así como una reducción del consumo de tokens del 20 al 30 %, según sus evaluaciones internas.
Los 2 modelos se benefician de nuevas funcionalidades: una salida de audio nativa a través de una
API para una experiencia conversacional más natural, medidas de seguridad avanzadas y las capacidades de uso del ordenador del agente IA Project Mariner.
Despliegue de AI Mode
Mientras que los AI Overviews, presentados en la edición I/O 2024, han recibido recientemente una actualización,
Google anuncia el despliegue en Estados Unidos de AI Mode, para preguntas que requieren una exploración profunda, comparaciones y un razonamiento matizado.
Alimentado por un modelo Gemini 2.5 optimizado, con acceso a fuentes e información en tiempo real, AI Mode se basa en una técnica de "query fan-out" o distribución de consultas. La IA lanza varias búsquedas simultáneas sobre diferentes temas relacionados con la pregunta planteada, utilizando diversas fuentes de datos, y luego recopila los resultados de estas búsquedas para proporcionar una respuesta estructurada con enlaces a las páginas web citadas. Los internautas pueden, si lo desean, refinar sus búsquedas con consultas de seguimiento.
El Project Starline evoluciona y se convierte en Google Beam
Google Beam utiliza tecnologías avanzadas, como la visualización de campo luminoso, la captura volumétrica a través de seis cámaras, el audio espacial y el procesamiento en tiempo real por IA, para crear una representación en 3D del interlocutor. Este enfoque permite conversaciones más realistas, con un rendimiento a 60 fotogramas por segundo y una precisión aumentada de los movimientos de cabeza, sin necesidad de dispositivos portátiles como cascos o gafas. Inicialmente, esta tecnología estaba confinada a prototipos voluminosos, pero ha sido miniaturizada para integrarse en sistemas más compactos, desarrollados en colaboración con HP.
La funcionalidad de traducción de voz en tiempo real, que
Google también ha integrado en Meet, permite conversaciones multilingües fluidas, conservando la voz, el tono y las expresiones del usuario.
Para entender mejor
¿Qué es la pantalla de campo de luz utilizada en Google Beam y qué implicaciones podría tener para la realidad virtual y aumentada?
La pantalla de campo de luz es una tecnología que captura y muestra la luz en todas sus direcciones, permitiendo una imagen 3D realista sin necesidad de gafas especiales. Esto podría revolucionar las aplicaciones de realidad virtual y aumentada al proporcionar una experiencia más inmersiva y natural.
¿Cómo impacta la técnica de 'query fan-out' del AI Mode de Google en la privacidad de los datos de usuario?
La técnica de 'query fan-out' implica enviar múltiples consultas a diferentes fuentes, lo que podría plantear desafíos de privacidad de los datos debido al aumento de puntos de contacto con datos potencialmente sensibles. Los reguladores podrían requerir auditorías para garantizar el cumplimiento de las normas de privacidad.