Los teléfonos Android están mejorando: ahora pueden describir imágenes usando inteligencia artificial y compartir fotos a través de códigos QR
Google continúa con la implementación de inteligencia artificial (IA) en prácticamente todos los frentes posibles. Ahora, con el respaldo de Gemini, introduce nuevas funciones en Android, como descripciones de imágenes a través del asistente, generación automática de subtítulos en videos, optimización de documentos y más herramientas.
Las mejoras de la mano de Gemini
Entre las funciones más destacadas que aprovechan Google Gemini se encuentra la posibilidad de escuchar descripciones de imágenes en voz alta. Diseñada principalmente para personas ciegas o con visión reducida, esta herramienta utiliza la modalidad “Image Q&A” en Lookout, ahora equipada con Gemini 1.5 Pro.
Esta tecnología permite generar descripciones de imágenes más detalladas y útiles. Para emplearla, basta con tomar, subir o abrir una foto en la aplicación y escuchar la descripción leída en voz alta con un tono natural. Además, es posible hacer preguntas adicionales a Gemini. Esta función ya está disponible a nivel mundial.
via GIPHY
Otra de las novedades de Gemini es la integración con diversas aplicaciones y servicios. Por ejemplo, la IA de Google ahora es compatible con Spotify, permitiendo reproducir contenido directamente desde la plataforma. También es posible realizar llamadas, enviar mensajes, configurar alarmas y controlar aspectos del dispositivo, como la cámara y los ajustes principales.
Próximamente, según la compañía, el asistente podrá controlar dispositivos inteligentes del hogar compatibles con Google y proporcionar información detallada sobre ubicaciones en Mapas.
Otras mejoras en Android
En cuanto a funciones que no involucran IA, destaca la capacidad de compartir fotografías, videos y otros contenidos a través de Quick Share con códigos QR. Para ello, solo es necesario seleccionar el archivo a compartir, generar el código QR y permitir que otros lo escaneen para completar la transferencia, sin necesidad de agregar contactos, verificar dispositivos o modificar configuraciones.
via GIPHY
Además, llegan los nuevos “subtítulos expresivos”, que reflejan automáticamente la intensidad y emoción de los diálogos, e incluyen detalles sobre el tono, volumen e incluso características como susurros, aplausos o risas.
Estos subtítulos estarán disponibles en todas las aplicaciones del teléfono, ya sea contenido en vivo, redes sociales o mensajes de video, aunque únicamente para dispositivos Android.
via GIPHY
Por otra parte, Gboard incorpora nuevas opciones en Emoji Kitchen, con lo que se pueden crear combinaciones de calcomanías a partir de emojis.
También se han mejorado las herramientas de escaneo de archivos en Google Drive, con lo que se logra optimizar documentos con mayor contraste, balance de blancos y eliminar de sombras y desenfoques, sin necesidad de ediciones manuales.
Implementación gradual
De acuerdo con Google, los subtítulos estarán presentes únicamente en idioma inglés, específciamente en aquellos equipos que soporten la función de Live Caption y que manejen Android 10 o superior.
Las herramientas de escuch de descripciones de imágenes con Gemini, el compartir fotos, videos y documentos a través de códigos QR y el escanear y compartir documentos de alta calidad llegarán de forma global para los equipós con al menos Android 5 o superior, en todos los idiomas disponibles.