Portal ChicoSabeTudoPortal ChicoSabeTudoPortal ChicoSabeTudo
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Font ResizerAa
Portal ChicoSabeTudoPortal ChicoSabeTudo
Font ResizerAa
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Procurar
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA

DESTAQUES

Padre de Arapiraca que estava desaparecido é encontrado preso em telhado

Tribunal do crime pune mulher com 40 pauladas por dívida de R$ 3 em Manacapuru

Homem de 35 anos é encontrado morto dentro de casa no povoado Arrasta-pé, em Paulo Afonso

Se conecte com a gente

Encontre nossas redes sociais
1.40MSeguidoresLike
1.5kSeguidoresSeguir
126kSeguidoresSeguir
13.2kSubscribersSubscribe
Todos os direitos reservados Portal ChicoSabeTudo @2024
Curiosidades e Tecnologia

Nova IA do Alibaba transforma fotos em vídeos animados com áudio realista

Nova IA do Alibaba anima fotos com voz, criando vídeos realistas. Tecnologia avança sem modelos 3D.

Última atualização: 02/03/2024 02:23
Compartilhar
Ia
IA
Compartilhar

Imagine uma fotografia adquirindo vida própria, falando ou mesmo cantando, como se a pessoa capturada no momento tivesse sido magicamente animada. Esta é a promessa da mais recente inovação desenvolvida pelo Instituto para Computação Inteligente do Alibaba Group, que parece diretamente saída de um filme de ficção científica. O sistema de inteligência artificial (IA), denominado Emote Portrait Alive (EMO), é capaz de transformar simples fotos do rosto de uma pessoa em vídeos animados. Com uma demonstração impressionante, até a Mona Lisa, obra-prima de Leonardo da Vinci, foi exibida “falando”.

A tecnologia EMO funciona combinando uma imagem estática com gravações de áudio realistas, criando a ilusão de que a imagem está realmente falando ou cantando. Esse processo é realizado sem a necessidade de modelagem 3D ou referências faciais detalhadas. Em vez disso, os desenvolvedores empregaram uma abordagem chamada modelagem de difusão, treinando a IA com uma grande quantidade de dados de áudio e vídeo, totalizando aproximadamente 250 horas de conteúdo.

Este avanço representa uma evolução significativa em relação às técnicas anteriores, que já possibilitavam a animação semianimada de fotos. Contudo, o diferencial do EMO está na adição de som e na dispensa de modelos 3D complexos para a realização do efeito. Segundo os pesquisadores, a conversão de ondas de áudio em quadros de vídeo permite capturar nuances de gestos humanos e particularidades do discurso, conferindo um realismo surpreendente à animação. Os vídeos gerados replicam movimentos da boca e expressões faciais típicas dos sons proferidos, aumentando a autenticidade da experiência.

Além do realismo e expressividade superior, conforme afirmado pelos criadores no GitHub do projeto, a ferramenta EMO garante que a duração do vídeo animado seja condizente com a do arquivo de áudio original. Exemplos disponíveis na plataforma demonstram a eficácia da tecnologia em capturar a essência dos movimentos labiais e expressões associadas, lado a lado com a imagem original.

Contudo, apesar das possibilidades empolgantes, os desenvolvedores advertem sobre a necessidade de monitoramento e restrições no uso do EMO para prevenir aplicações antiéticas. O compromisso com a ética na aplicação dessa inovação é fundamental para garantir que sua utilização contribua positivamente para o desenvolvimento tecnológico e criativo.

Mais detalhes sobre a ferramenta EMO e o estudo por trás dessa inovação podem ser encontrados no servidor de pré-impressão arXiv, onde os resultados da pesquisa foram publicados, disponibilizando uma nova dimensão de interação com imagens estáticas, abrindo portas para inúmeras aplicações criativas e comunicativas no mundo digital.

RELACIONADAS

Foto: Reprodução / Arquivo Pessoal
Pescadores de Malhada capturam pirarucu de 92 kg e 2,15 m no Rio São Francisco
Estudo de tráfego: duas ruas terão sentido único em Paulo Afonso a partir desta quarta (28); saiba mais
Rog Ally (Imagem: Divulgação/Asus)
Economize bateria nos consoles portáteis com estas 5 dicas essenciais
Fique Atento Ao Ruído! (Imagem: Blackday/Shutterstock)
Entenda de onde vêm os zumbidos em aparelhos elétricos e quando procurar ajuda
Todos Os Lotes Das Marcas Afetadas Devem Ser Apreendidos Pelas Autoridades Locais (Imagem: Hleb Usovich/Istock)
Anvisa proíbe duas marcas de azeite por origem desconhecida
Destruição De Sodoma E Gomorra Realmente Existiu? (Imagem: Romolotavani/Istock)
Retratação do Estudo sobre Tall el-Hammam questiona sua credibilidade

MAIS NOTÍCIAS

(Imagem: Jackpress / Shutterstock.com)
Curiosidades e Tecnologia

OpenAI abre escritório na Coreia do Sul para fortalecer parcerias com IA

(Imagem: Miss.cabul/Shutterstock)
Curiosidades e Tecnologia

Putin defende restrição a serviços estrangeiros na Rússia

Representação Artística Elaborada Com Inteligência Artificial De Um Pinguim Expelindo Guano, Uma Mistura De Excrementos E Urina Liberada Pela Cloaca Que É Rica Em Amônia. Crédito: Flavia Correia Via Dall-E/Olhar Digital
Curiosidades e Tecnologia

Pinguins e cocô ajudam a formar nuvens na Antártida, revela estudo

Curiosidades e Tecnologia

Nutricionista, motorista e mais: veja as vagas de emprego abertas pelo SineBahia em Paulo Afonso nesta segunda-feira (26)

Gigante Dos Chips Gráficos Expandiu Suas Possibilidades De Negócio (Imagem: Chung-Hao Lee/Shutterstock)
Curiosidades e Tecnologia

Nvidia desenvolve chip de IA mais acessível para o mercado chinês

Imagem: Postmodern Studio/Shutterstock
Curiosidades e Tecnologia

Pesquisa da UFMG analisa bilhões de mensagens do Discord e gera debate sobre privacidade

Crédito: Leenha11 (Shutterstock/Reprodução)
Curiosidades e Tecnologia

Entenda a importância da clorofila na coloração verde das plantas

As Seis Primeiras Letras Da Primeira Linha Identificam O Tipo De Teclado Qwerty. / Crédito: Michaelmaggs, Cc By-Sa 3.0, Wikimedia Commons
Curiosidades e Tecnologia

Por que os teclados não seguem a ordem alfabética? Descubra a história do layout QWERTY

Mostrar mais
Portal ChicoSabeTudo

ACESSE

  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Que bom que voltou!!!

Acesse sua conta

Username or Email Address
Password

Lost your password?