Portal ChicoSabeTudoPortal ChicoSabeTudoPortal ChicoSabeTudo
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Font ResizerAa
Portal ChicoSabeTudoPortal ChicoSabeTudo
Font ResizerAa
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Procurar
  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA

DESTAQUES

Paulo Afonso: grave acidente na rotatória que dá acesso ao centro da cidade deixa dois feridos

Chatgpt Image 25 De Jul. De 2025, 10_36_48.Jpg

Homem de 42 anos é assassinado a tiros na zona rural de Santa Brígida; polícia busca por suspeito

Filho confessa ter matado a mãe enforcada após briga por dívidas de jogos de aposta

Se conecte com a gente

Encontre nossas redes sociais
1.40MSeguidoresLike
1.5kSeguidoresSeguir
126kSeguidoresSeguir
13.2kSubscribersSubscribe
Todos os direitos reservados Portal ChicoSabeTudo @2024
- Publicidade -
Curiosidades e Tecnologia

Dados sensíveis na IA: CPF e currículos em treinamento

Uma nova pesquisa revela que milhões de dados pessoais, incluindo documentos e currículos, estão presentes em vastos bancos de dados usados para treinar sistemas de inteligência artificial.

Última atualização: 27/07/2025 04:57
Compartilhar
Privacidade Em Risco: Documentos Pessoais Alimentam Ia Sem Autorização (Imagem: Tippapatt/Shutterstock)
Privacidade em risco: documentos pessoais alimentam IA sem autorização (Imagem: TippaPatt/Shutterstock)
Compartilhar

Uma recente pesquisa revelou a presença de milhões de imagens contendo dados altamente sensíveis, como documentos de identidade, cartões de crédito e certidões de nascimento, em um dos maiores acervos digitais utilizados para o treinamento de inteligências artificiais (IAs) capazes de gerar conteúdo visual realista. Este material integra o DataComp CommonPool, um vasto repositório com bilhões de imagens coletadas automaticamente da internet.

A iniciativa visava fornecer um volume massivo de conteúdo visual para os algoritmos. No entanto, entre imagens diversas, foram identificados arquivos delicados, incluindo passaportes e carteiras de motorista digitalizados, além de fotografias de indivíduos identificáveis. Em casos mais graves, a pesquisa detectou mais de 800 currículos e cartas de apresentação vinculados a perfis reais em redes sociais, como o LinkedIn.

Implicações e Escala da Exposição

Os pesquisadores responsáveis pelo estudo alertam que a quantidade de dados sensíveis descoberta representa apenas uma fração do total presente, levantando sérias preocupações sobre o material que compõe o aprendizado das máquinas.

Lançado em 2023, o CommonPool rapidamente se estabeleceu como o maior conjunto público de pares imagem-texto, acumulando impressionantes 12,8 bilhões de amostras extraídas da web. Apesar de seus criadores afirmarem um propósito acadêmico, a licença do projeto não restringe o uso comercial, permitindo que empresas utilizem esses dados sem grandes impedimentos.

O CommonPool é o sucessor do LAION-5B, um banco de dados similar que serviu de base para ferramentas de IA populares como o Stable Diffusion e o Midjourney. Ambos os repositórios utilizam dados coletados entre 2014 e 2022 pelo projeto Common Crawl. Isso sugere que as vulnerabilidades de privacidade agora identificadas podem estar presentes em modelos de IA desenvolvidos anteriormente e em diversas aplicações já em uso.

Privacidade e Legislação Atual

De acordo com os pesquisadores, o DataComp CommonPool já foi baixado mais de dois milhões de vezes. Rachel Hong, doutoranda em ciência da computação pela Universidade de Washington, nos Estados Unidos, e principal autora do estudo, destaca que este número indica uma vasta proliferação de modelos derivados que potencialmente carregam os mesmos riscos de privacidade.

O estudo faz um apelo à comunidade de inteligência artificial para que reavalie a prática de coleta automática e indiscriminada de informações da internet. Os autores argumentam que a utilização massiva de dados pessoais em conjuntos como o CommonPool pode infringir leis de privacidade existentes, mesmo com as lacunas regulatórias.

Embora a Europa e alguns estados nos Estados Unidos possuam normativas de proteção de dados pessoais, ainda não há uma legislação federal unificada nos EUA, resultando em variações nos direitos de privacidade. Frequentemente, as regulamentações não se aplicam a projetos acadêmicos ou não abrangem dados considerados “publicamente disponíveis”.

Este conceito de “informação pública” pode ser enganoso. Conforme apontado pelos autores do estudo, conteúdos como currículos, fotos pessoais, números de documentos e até registros de blogs familiares são frequentemente tratados como dados livres, mesmo quando revelam informações privadas. Para os pesquisadores, o caso do CommonPool serve como um alerta crucial: o que está acessível na internet não deveria, automaticamente, tornar-se insumo para máquinas.

TAGS:inteligência artificialPrivacidadeprivacidade de dados
Nenhum comentário

Deixe um comentário Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

MAIS LIDAS

Paulo Afonso: grave acidente na rotatória que dá acesso ao centro da cidade deixa dois feridos
Polícia e investigação
Filho confessa ter matado a mãe enforcada após briga por dívidas de jogos de aposta
Polícia e investigação
Jovem-Internacional-Mantendo-As-Maos-Atras-Das-Costas-Enquanto-E-Algemado-No-Protesto_317809-1899.Jpeg
Justiça condena homem a 22 anos por tentar matar ex-companheira em Glória (BA)
Polícia e investigação
- Publicidade -

MAIS NOTÍCIAS

Crédito: Ilustração De Stablecoins (K7Yz3/Wikimedia)
Curiosidades e Tecnologia

Stablecoin: O que é, como funciona e por que é importante?

Celuluar Android / Crédito: Sem Autor (Shutterstock/Reprodução)
Curiosidades e Tecnologia

Android atualizado: 5 dicas essenciais para seu celular

Morango-Do-Amor-1-1.Jpg
Curiosidades e Tecnologia

Febre do Morango do Amor aumenta preços da fruta em Salvador em uma semana

Baianos Se Atrapalharam Ao Tentar Fazer Doce E O Apelidou De &Quot;Morango Do Ódio&Quot;
Curiosidades e Tecnologia

Preço do morango dispara em Salvador após ‘morango do amor’ viralizar

Inteligência Artificial Pode Desumanizar Processo Seletivo (Créditos: Jovanmandic / Istock)
Curiosidades e Tecnologia

USP: IA em processos seletivos gera alertas de viés e discriminação

Curiosidades e Tecnologia

Aneel aciona bandeira vermelha nível 2 em agosto e conta de luz terá novo aumento

Ilustração Do Câncer Se Desenvolvendo No Corpo (Reprodução: Ebrahim Lotfi/Shutterstock)
Curiosidades e Tecnologia

Novo método para prever câncer no Brasil supera dados do INCA

Curiosidades e Tecnologia

Inovação: Plástico biodegradável e descoberta de super-Terra

Mostrar mais
Portal ChicoSabeTudo

ACESSE

  • CENÁRIO POLÍTICO
  • POLÍCIA
  • ESPORTES
  • ENTRETENIMENTO
  • CURIOSIDADES E TECNOLOGIA
Que bom que voltou!!!

Acesse sua conta

Username or Email Address
Password

Lost your password?