Como trocar a cara de pessoas em vídeos com Inteligência Artificial?

Data: 17/04/2024

O mundo dos vídeos online está evoluindo rapidamente com a ajuda de tecnologia de Inteligência Artificial (IA), desvendando novas fronteiras de como o conteúdo é criado e percebido.

Por mais que possa parecer que estamos diante de uma realidade onde os vídeos são completamente fabricados por IA, a verdade contém nuances importantes.

Desmistificando Vídeos com Intervenção de IA

Diferenças entre Vídeos Gerados e Modificados por IA

Criar vídeos com a assistência de inteligência artificial envolve tanto a geração quanto a alteração de conteúdo.

Apesar de existirem afirmações de que certos vídeos são 100% criados por IA, frequentemente, esse não é o caso.

A manipulação por IA, muito comum atualmente, envolve substituir rostos e vozes em gravações pré-existentes. Isso difere significativamente da geração completa de vídeos, onde todos os elementos são sintetizados sem bases reais prévias.

Origem dos Vídeos Utilizando IA

Os vídeos trabalhados com IA muitas vezes partem de conteúdos autênticos, contratados de plataformas como Fiverr.

Após a aquisição desses vídeos, softwares de substituição facial e de voz entram em ação.

Por exemplo, utiliza-se a ferramenta Vidzos para trocar o rosto do indivíduo original pelo de um personagem AI criado, e a ferramenta Eleven Labs para gerar a voz e o diálogo do personagem sintético.

A combinação de vídeos reais com elementos gerados por IA cria a ilusão de realidade e amplia as possibilidades na criação publicitária e de conteúdo.

Formatos de Edição Utilizados:

  • Vidnoz: Ferramenta de substituição facial por IA.
  • Eleven Labs: Gera vozes realistas para sobreposição de áudio.
  • Mid Journey: Usado para geração de rostos realistas de personagens IA.
  • Sieve: (ferramenta de sincronização labial): Sincroniza o áudio gerado com o vídeo.
  • Runway: Editor de vídeo online para refinamentos finais.

Produção de Vídeos Utilizando Inteligência Artificial de Forma Gratuita

Ao criar vídeos com uso de Inteligência Artificial, é importante esclarecer que, embora as modificações sejam feitas por IA, o conteúdo inicial nem sempre é gerado por ela.

A verdade é que os vídeos são muitas vezes originados de gravações reais e modificados digitalmente para substituir faces e vozes.

Recurso Primário: Rostos Artificiais

  • Utilizo o MidJourney ou o Flux para gerar rostos realistas, embora haja diversas alternativas gratuitas de geradores de imagens IA.
  • Para obter um resultado mais fidedigno, possuo uma conta paga e realizo ajustes específicos na iluminação e no enquadramento do rosto a ser gerado.

Quanto a essa parte primária, recomendo muito que vejam o vídeo abaixo:

Criação de Voz Sintética:

  • Elevenlabs é a ferramenta que utilizo para produzir a voz do personagem AI.
  • Prefiro escolher vozes da biblioteca profissional para uma maior autenticidade no produto final.

Processo de Fusão de Rostos:

  • Utilizo a ferramenta Vidnoz que dispõe de uma função gratuita de troca de rostos em vídeos.
  • Escolho a imagem do rosto IA mais adequada e aplico a substituição no vídeo de minha autoria.

Sincronização de Lábios e Voz:

  • A sincronização labial é feita através da ferramenta Sieve (utilizo a versão gratuita, mas existe a paga Sync Labs para quem busca rapidez).
  • Após o envio do vídeo com o rosto trocado e do áudio gerado, a ferramenta sincroniza o movimento labial com a nova voz.

Edição Final:

  • Para editar o vídeo e adicionar os toques finais, opto pelo editor de vídeos online Runway.

Exemplo Prático:

  • A exemplificação do método apresentado inclui um vídeo em que o rosto e a voz são inteiramente modificados por IA, resultando em uma aparência bastante convincente.

Ferramentas Essenciais

Criação de Imagens por Inteligência Artificial

Para criar o rosto do influenciador digital com IA, é necessário um software capaz de gerar imagens autênticas.

Produção de Voz por Inteligência Artificial

A geração de voz artificial também é uma etapa crucial.

Recomenda-se o uso de uma biblioteca de vozes profissionais para alcançar um tom mais realista.

Com o texto definido, é possível criar uma narração convincente que complemente a imagem do influenciador digital implantada.

Aplicativos de Troca de Rosto

Com o rosto e a voz do influenciador IA prontos, o próximo passo é a substituição da face em um vídeo existente.

Existem ferramentas de IA para troca de rosto de vídeo acessíveis gratuitamente que permitem fazer o upload do vídeo e da imagem gerada para executar a substituição facial.

Vidnoz

Editor Online

Com o Vidnoz é possível trocar a cara das pessoas em vídeos e em fotos.

Acessar

Sincronização de Movimentos Labiais

Para que a voz sintetizada pareça natural no vídeo, é fundamental sincronizar o movimento labial com o áudio.

Ferramentas online podem realizar esse processo tanto em opções gratuitas quanto pagas, com a versão paga oferecendo resultados mais rápidos.

Imagem Redimensionada

Vidnoz

Editor Online

Use o Sieve para fazer a sincronização labial.

Acessar

Editores de Vídeo na Internet

O toque final é dado na edição do vídeo para garantir a aparência de um anúncio genuíno gravado com um smartphone.

Editores de vídeo baseados na web permitem carregar e editar o vídeo sincronizado para criar produtos finais polidos, prontos para serem compartilhados online.

Runway

Editor e Criador de Vídeos

Use o Runway para remover o fundo dos vídeos e “diluir” os possíveis erros do Sieve e Vidnoz.

Acessar

Processo de Criação

Escolha do Rosto pelo IA

  • Seleção de Imagens: Utiliza-se um serviço avançado para criar rostos realísticos com IA.
  • Por exemplo, configurando parâmetros específicos em uma plataforma de geração de imagens, buscando um aspecto de equilíbrio e naturalidade na iluminação.
  • Aprimoramento da Imagem: Após gerar diversas opções, escolhe-se a mais adequada e realiza-se um aprimoramento, como o aumento de resolução, para realçar detalhes e obter maior realismo.

Midjourney

Criação de Imagens

Utilize o Midjourney para gerar imagens hyperealísticas de pessoas

Acessar

Criação e Escolha da Voz pelo IA

  1. Geração de Áudio: Emprega-se uma ferramenta de conversão de texto em fala, optando por vozes de uma biblioteca profissional para alcançar um tom mais natural e convincente.
  2. Sincronia com o Rosto: Escolhe-se a voz que melhor se alinha às características visuais do rosto selecionado para criar uma congruência entre a aparência e o som.

Elevenlabs

Criação de Vozes

Com o Elevenlabs é possível criar vozes do jeito que você quiser.

Acessar

Preparo do Vídeo Base

  • Direitos Autorais: Importante usar vídeos com direitos de uso apropriados, podendo ser feitos pelo próprio criador ou obtidos por meio de fontes legítimas.
  • Aplicação do Rosto IA: Com o uso de programas específicos, substitui-se o rosto do vídeo original pelo rosto IA criado anteriormente, mantendo os movimentos e expressões naturais do corpo do vídeo base.

Ajuste de Sincronia Labial

  • Ferramentas de Sincronização: Usa-se programas que permitem sincronizar a fala gerada pela IA com os movimentos labiais do vídeo, fazendo com que o rosto AI pareça falar de forma coerente e natural.
  • Edição Final: A sincronização labial é otimizada para que, no produto final, o rosto AI pareça pronunciar de maneira precisa o áudio inteligível criado.

Resultado e Composição Final

Após a seleção e melhoria de uma imagem AI para representar nosso influenciador digital, avançamos para a produção do vídeo.

Um rosto extremamente realista foi escolhido, com olhos azuis vivos.

A seguir, realizou-se um aumento de escala da imagem para garantir a melhor qualidade.

  • Imagem AI Escolhida: Rosto com olhos azuis
    • Processo de Escala: Realizado para aprimoramento visual

Uma voz foi gerada para corresponder à aparência autêntica do rosto, procurando ser coerente com o visual.

Textos para a narração foram cuidadosamente escritos e transformados em áudio, mantendo um tom natural.

  • Seleção Vocal: Voz masculina realista
  • Geração do Áudio: Texto narrativo para promoção

Com ambos elementos preparados, partimos para a técnica de ‘Face Swap’.

Aplicamos o rosto AI ao corpo em um vídeo previamente gravado, resultando numa sincronização praticamente perfeita.

  • Substituição Facial: Rosto AI aplicado ao vídeo
    • Resultado: Imagem convincente com movimentos naturais

Para unir voz e movimentos labiais, utilizamos uma ferramenta de sincronização labial com a voz gerada.

O processo finalizou com um vídeo altamente realista, onde a voz se alinhava com a nova face AI inserida.

  • Sincronização Labial: Áudio e vídeo combinados
    • Ferramenta Utilizada: Sincronizador de voz e imagem grátis

Com o amadurecimento de técnicas de IA na edição de vídeos, obtemos anúncios generados artificialmente com aparência genuína.

Ao finalizar, a videoedição foi realizada em uma plataforma online, adequando o conteúdo ao formato desejado para publicidade móvel.

  • Edição de Vídeo: Aperfeiçoamento do anúncio gerado por IA
    • Plataforma de Edição: Serviço de edição de vídeo online

Resultados de Comparação: Demonstramos um contraponto entre ferramentas gratuitas e pagas para avaliação da qualidade de sincronização labial, oferecendo aos espectadores uma visão clara das possibilidades e limitações de cada opção.

  • Comparação Detalhada:
    • Cenário Gratuito: Resultado satisfatório em tempo razoável
    • Cenário Pago: Resultado aprimorado em menor tempo

Gostou? Compartilhe!

Facebook
Twitter
LinkedIn
Email
WhatsApp

Conteúdos em vídeo:

Você também vai gostar disso: