Portal ChicoSabeTudoPortal ChicoSabeTudoPortal ChicoSabeTudo
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Font ResizerAa
Portal ChicoSabeTudoPortal ChicoSabeTudo
Font ResizerAa
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Procurar
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA

DESTAQUES

Garota de programa morre após ser contratada para realizar “fetiche doido”

Secretaria de Saúde de Paulo Afonso nega denúncia de negligência após morte de bebê em maternidade

Homem com mandado de prisão em aberto é capturado no Conjunto Habitacional Josefino, em Paulo Afonso

Se conecte com a gente

Encontre nossas redes sociais
1.40MSeguidoresLike
1.5kSeguidoresSeguir
126kSeguidoresSeguir
13.2kSubscribersSubscribe
Todos os direitos reservados Portal ChicoSabeTudo @2024
- Publicidade -
Campanha Vacina da Gripe - Governo da Bahia
Curiosidades e Tecnologia

Nova IA do Alibaba transforma fotos em vídeos animados com áudio realista

Nova IA do Alibaba anima fotos com voz, criando vídeos realistas. Tecnologia avança sem modelos 3D.

Última atualização: 02/03/2024 02:23
Compartilhar
Ia
IA
Compartilhar

Imagine uma fotografia adquirindo vida própria, falando ou mesmo cantando, como se a pessoa capturada no momento tivesse sido magicamente animada. Esta é a promessa da mais recente inovação desenvolvida pelo Instituto para Computação Inteligente do Alibaba Group, que parece diretamente saída de um filme de ficção científica. O sistema de inteligência artificial (IA), denominado Emote Portrait Alive (EMO), é capaz de transformar simples fotos do rosto de uma pessoa em vídeos animados. Com uma demonstração impressionante, até a Mona Lisa, obra-prima de Leonardo da Vinci, foi exibida “falando”.

- Anúncio-

A tecnologia EMO funciona combinando uma imagem estática com gravações de áudio realistas, criando a ilusão de que a imagem está realmente falando ou cantando. Esse processo é realizado sem a necessidade de modelagem 3D ou referências faciais detalhadas. Em vez disso, os desenvolvedores empregaram uma abordagem chamada modelagem de difusão, treinando a IA com uma grande quantidade de dados de áudio e vídeo, totalizando aproximadamente 250 horas de conteúdo.

Este avanço representa uma evolução significativa em relação às técnicas anteriores, que já possibilitavam a animação semianimada de fotos. Contudo, o diferencial do EMO está na adição de som e na dispensa de modelos 3D complexos para a realização do efeito. Segundo os pesquisadores, a conversão de ondas de áudio em quadros de vídeo permite capturar nuances de gestos humanos e particularidades do discurso, conferindo um realismo surpreendente à animação. Os vídeos gerados replicam movimentos da boca e expressões faciais típicas dos sons proferidos, aumentando a autenticidade da experiência.

Além do realismo e expressividade superior, conforme afirmado pelos criadores no GitHub do projeto, a ferramenta EMO garante que a duração do vídeo animado seja condizente com a do arquivo de áudio original. Exemplos disponíveis na plataforma demonstram a eficácia da tecnologia em capturar a essência dos movimentos labiais e expressões associadas, lado a lado com a imagem original.

- Anúncio-

Contudo, apesar das possibilidades empolgantes, os desenvolvedores advertem sobre a necessidade de monitoramento e restrições no uso do EMO para prevenir aplicações antiéticas. O compromisso com a ética na aplicação dessa inovação é fundamental para garantir que sua utilização contribua positivamente para o desenvolvimento tecnológico e criativo.

Mais detalhes sobre a ferramenta EMO e o estudo por trás dessa inovação podem ser encontrados no servidor de pré-impressão arXiv, onde os resultados da pesquisa foram publicados, disponibilizando uma nova dimensão de interação com imagens estáticas, abrindo portas para inúmeras aplicações criativas e comunicativas no mundo digital.

- Advertisement -

MAIS LIDAS

Garota de programa morre após ser contratada para realizar “fetiche doido”
Polícia e investigação
Após 17 anos, nova denúncia pode reabrir caso Isabella Nardoni
Polícia e investigação
Caso Raíssa Suellen: humorista que confessou assassinato da pauloafonsina tem audiência marcada
Polícia e investigação
- Publicidade -

MAIS NOTÍCIAS

(Imagem: Wanan Yossingkum/Istock)
Curiosidades e Tecnologia

Avaliadores do Google Gemini relatam exposição a conteúdo sensível

Sistema Operacional Linux - Imagem: Spectral-Design/Shutterstock
Curiosidades e Tecnologia

Linux fica atrás de Windows e macOS na Bahia

Mouse Gamer (Reprodução: Rebekah Yip/Unsplash)
Curiosidades e Tecnologia

Mouse e teclado funcionam em celulares Android e iPhone por USB

Novos Airpods Pro 3, Da Maçã, Contarão Com Tradução Em Tempo Real (Imagem: Reprodução/Apple)
Curiosidades e Tecnologia

Apple, Google e Meta apresentam tradução em tempo real

Especialist Consideram Importante Reconhecimento De Novo Tipo Da Enfermidade (Imagem: Me Dia/Shutterstock)
Curiosidades e Tecnologia

Diabetes tipo 5: IDF reconhece forma ligada à desnutrição infantil

(Imagem: Miss.cabul/Shutterstock)
Curiosidades e Tecnologia

XAI demite cerca de 500 anotadores e contrata tutores especializados

Curiosidades e Tecnologia

Governo detecta três novas drogas em circulação no Brasil

Um Pequeno Buraco Negro A 26 Mil Anos-Luz Da Terra Está Devorando Sua Estrela Companheira E Liberando Matéria A 32 Milhões De Km/H. (Imagem: Observatório Europeu Do Sul (Eso))
Curiosidades e Tecnologia

Buraco negro a 26 mil anos-luz expulsa matéria a 3% da luz

Mostrar mais
Portal ChicoSabeTudo

ACESSE

  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Que bom que voltou!!!

Acesse sua conta

Username or Email Address
Password

Lost your password?