HomeTECNOLOGÍALa promesa de la nueva IA de Google de dar voz a tus fotos

La promesa de la nueva IA de Google de dar voz a tus fotos

La promesa de la nueva IA de Google de dar voz a tus fotos

En los últimos años, Google ha centrado su atención en la inteligencia artificial y está decidida a competir con gigantes como OpenAI o Microsoft. Desde el lanzamiento de su modelo multimodal Gemini y su chatbot Bard, la empresa se ha convertido en una de las apuestas más prometedoras en el campo de la IA.

VLOGGER, el próximo proyecto de IA de Google. Con esta herramienta, se puede capturar una imagen y convertirla en un video que permite que las personas gesticulen y hablen de manera realista.

VLOGGER facilitará la creación de deepfakes al estilo de otras aplicaciones con funciones de IA avanzadas como DALL-E o Sora, ambos sistemas desarrollados por OpenAI.

Google busca redefinir la forma en que las personas interactúan en el mundo virtual.

Aunque la aplicación aún está en proceso de desarrollo, las primeras pruebas muestran un futuro prometedor. VLOGGER tiene una interfaz sencilla que utiliza modelos de difusión, una técnica de aprendizaje automático que ha resultado en la creación de imágenes realistas a partir de instrucciones (descripciones de texto), recoge 20bits.

El equipo de desarrollo de Google ha señalado que VLOGGER podría cambiar las plataformas de chat como Teams y Slack. La aplicación crea una animación mientras los usuarios crean avatares animados con imágenes fijas. La herramienta será útil para la creación de presentaciones, la educación o la narración de historias.

Google ha afirmado que la herramienta tiene la capacidad de doblar videos a diferentes idiomas y crear avatares con características y movimientos humanos más realistas. Los usuarios también podrán usar VLOGGER para editar videos actuales o cambiar elementos utilizando IA.

Las posibilidades de VLOGGER son casi infinitas, ya que la herramienta tiene una interfaz simple donde los usuarios pueden ajustar hasta obtener el resultado deseado.

Aunque la aplicación brindará nuevas formas de interactuar en espacios virtuales, no significa que no sea peligrosa si llega a manos equivocadas. Dado que los usuarios no necesitan entrenar el modelo para cada persona, esta herramienta podría aumentar la creación de deepfakes destinados a desinformar.

VLOGGER aún está en proceso de desarrollo.
Google quiere desarrollar un chatbot que sea universal, y VLOGGER podría ayudarlo poco a poco. La empresa espera que pronto la IA pueda comunicarse con los humanos a través de gestos o voz.

La herramienta ha sido entrenada con más de 2.000 horas de video y ha recopilado los rasgos faciales y gestos de más de 800.000 personas. El equipo de investigación de la empresa ha demostrado que puede reproducir rasgos humanos de una amplia gama de expresiones y etnias.

Por el momento, VLOGGER es solo un proyecto en proceso de desarrollo que tiene cierta potencial. Aún se necesita esperar para que esta tecnología se convierta en algo real y pueda competir con DALL-E o Sora.

Compartir con
Valora esta nota
Author

editor@kripton.mx

Sin comentarios

Dejar un comentario