Una visión optimista sobre la potencialmente peligrosa tecnología de vídeo Deepfake


Los Deepfakes están de moda. Sus peligros son cada vez más conocidos y comprendidos. Los medios de comunicación están llenos de artículos que detallan la velocidad a la que la tecnología ha crecido en sofisticación y se ha vuelto más accesible, así como los riesgos involucrados.

Leer Los videos Deepfake ya son vistos como una amenaza a la seguridad nacional de USA

Todavía nos cuesta llegar a un acuerdo sobre una definición de los Deepfakes. Lo considero como cualquier mimetismo, manipulación o síntesis de vídeo o audio que se habilita mediante el aprendizaje automático. El intercambio de rostros, los títeres del cuerpo, la copia de la voz de alguien y la creación de voces o imágenes completamente nuevas entran en esta categoría.

La síntesis y manipulación de imágenes puede ser una herramienta poderosa para los creadores.

La narración visual es un negocio costoso. Los estudios de Hollywood gastan miles de millones en crear espectáculos que cautivan a su audiencia o los transportan a otro mundo. Las herramientas que usan para hacerlo, las herramientas que estos grandes jugadores usan para cerrar la brecha entre lo que pueden imaginar y lo que pueden crear, siguen siendo prohibitivamente caras para la mayoría de los creadores, aunque menos que hace una década. La tecnología Deepfake incorpora la capacidad de sintetizar imágenes, lo que podría dar a los creadores de menor escala una capacidad similar para dar vida a la creatividad imaginativa.

Synthesia es una empresa con un producto comercial que utiliza tecnología deepfake para realizar doblajes automatizados y convincentes a través de la re-animación facial automatizada. Se dispararon a la fama con un video que mostraba a David Beckham hablando sobre la malaria en nueve idiomas, pero su producto también podía usarse para ampliar el alcance de los creadores en todo el mundo. Si eres un artista talentoso que no está trabajando en uno de los idiomas dominantes del mundo, es potencialmente un cambio de carrera tener acceso a un producto como este, que podría hacer que tu trabajo sea viable en otros idiomas y países.

Adobe VoCo es un software, aunque todavía se encuentra en una etapa de investigación y creación de prototipos, lo que facilita a los creadores producir discursos a partir de texto y editarlos de la forma en que editarían las imágenes en Photoshop. Entonces, si quieres que tu película corta sea narrada por Morgan Freeman, podrías lograr que eso suceda.

Tinghui Zhou, el fundador y CEO de Humen, una compañía que crea obras de arte para bailar, resume los objetivos de la industria: “El futuro que estamos imaginando es uno en el que todos puedan crear contenido a nivel de Hollywood”.

De la misma manera que YouTube e Instagram redujeron la ventaja de distribución y creación que las empresas de entretenimiento y fotógrafos famosos disfrutaron sobre los talentosos aficionados y entusiastas, este conjunto de tecnologías podría disminuir la ventaja de producción que actualmente poseen las grandes empresas de presupuestos y efectos visuales.

La mímica y la manipulación de la vida real siempre han sido parte del arte.

Las aplicaciones mencionadas anteriormente tienen que ver con cerrar la brecha entre los creadores con diferentes recursos, pero la tecnología deepfake también podría habilitar formas de contenido completamente nuevas que se basan en la capacidad de imitar y manipular material. Cada medio de entretenimiento ha incorporado el estiramiento, la reflexión, la contorsión y la apropiación de material de fuente real para los fines del entretenimiento.

Ya podemos ver la evidencia de estas nuevas aplicaciones en el uso todavía incipiente de la tecnología Deepfake en la actualidad, por ejemplo el cambio de rostros en vídeos pornográficos.

Leer Pornhub prohíbe los vídeos porno falsos (deepfakes) creados con inteligencia artificial

Esta forma de creación de contenido que, aunque antes era técnicamente posible, era inviable antes de las aplicaciones Deepfake.

No es difícil imaginar que la próxima locura por el contenido de Deepfakes será impulsada por la sincronización automática de los labios, la imitación de la danza o las impresiones de voces de celebridades.

Deepfakes nos acerca a seres humanos virtuales creíbles

La capacidad de imitar caras, voces y expresiones emocionales es uno de los pasos más importantes hacia la creación de un humano virtual creíble con el que podamos interactuar. Ya estamos dando pasos tentativos por el camino a los seres humanos virtuales. Asistentes personales como Alexa, Siri y Cortana han existido por varios años, han alcanzado un punto de inflexión en el uso del consumidor y están mejorando rápidamente. Una vez dicho esto en 2019 todavía se sienten más como una nueva interfaz de usuario a la que debe pasar instrucciones precisas en lugar de un ser virtual con el que puede interactuar. Piensa en una línea de comando operada por voz.

Los Deepfakes tienen el potencial de tapar los agujeros tecnológicos en asistentes inteligentes y personas influyentes digitales. Llevar a Alexa o Lil Miquela al nivel de humanos virtuales como Samantha de Her o Joi de Bladerunner 2049 requiere la capacidad de abarcar y expresar el lenguaje del cuerpo humano, el habla y las emociones. Si contamos el número de combinaciones únicas de postura, matices vocales y expresiones faciales que ha realizado en su vida, es probable que se contabilicen en los miles de millones. Para que los humanos virtuales sean creíbles, sus acciones no pueden ser preprogramadas en un sentido tradicional, pero deben ser extremadamente flexibles.

La tecnología Deepfake normalmente toma toneladas de ejemplos de comportamiento humano como entradas y luego produce resultados que se aproximan o elaboran sobre ese comportamiento. Podría otorgar a los asistentes inteligentes la capacidad de comprender y originar una conversación con mucha más sofisticación.

Traer a Mickey Mouse a la vida más allá de una caricatura de Disney o un tipo con un traje en Disneyland es hacia donde nos dirigimos. Proyecciones de hologramas en 3D de personajes animados (y personas reales) que pueden hablar con una voz que suena realista, moviéndose como lo haría su contraparte del mundo real.

La creatividad comienza con la copia. La elaboración sigue a la duplicación. No es diferente con Deepfakes, que democratizará el acceso a las herramientas de creatividad en el entretenimiento, permitirá formas de contenido completamente nuevas y nos acercará a seres humanos digitales creíbles. Por eso creo que hay tantas razones para estar entusiasmados con las virtudes de la tecnología como para preocuparse por sus vicios.

Techcrunch – Una visión optimista sobre la potencialmente peligrosa tecnología Deepfake

Fuente

(Visited 377 times, 1 visits today)