Fechar Menu
CRIA DO RIO
  • Últimas Notícias
  • Rio de Janeiro
    • Angra dos Reis
  • Cultura e Entretenimento
  • Política
  • Saúde
  • Carnaval do Rio

Subscribe to Updates

Get the latest creative news from FooBar about art, design and business.

What's Hot
Esportes

Confira os resultados dos jogos desta terça-feira (23) na Copa

23 de junho de 2026Por Agencia Brasil
Economia e Negócios

Governo mantém elevação de tarifas a carro elétrico e renova cota zero

23 de junho de 2026Por Ryan Mazcatti
Segurança e Justiça

Nova fase do Celular Seguro vai combater cadeia econômica do roubo

23 de junho de 2026Por Sarah Quines - reporter da Radio Nacional
Facebook X (Twitter) Instagram
Facebook X (Twitter) Instagram
CRIA DO RIO
  • Últimas Notícias

    Conexão Tijuca promove empreendedorismo, saúde e cultura em evento gratuito no Andaraí

    23 de junho de 2026

    ONG da Cidade de Deus promove transmissão do jogo do Brasil para 250 crianças e adolescentes

    23 de junho de 2026

    Operação da polícia em morro da Zona Sul do RJ causa tiroteio; homem é baleado

    23 de junho de 2026

    Carnaval Lab realiza segunda edição em Vitória com foco em inovação, marketing e captação de recursos para o Carnaval

    23 de junho de 2026

    Em ano de Copa do Mundo, Rolé Carioca percorre Bangu para contar a história do futebol brasileiro a partir do subúrbio carioca

    23 de junho de 2026
  • Rio de Janeiro
    1. Angra dos Reis
    2. Ver tudo

    Confira os resultados dos jogos desta terça-feira (23) na Copa

    23 de junho de 2026

    Governo mantém elevação de tarifas a carro elétrico e renova cota zero

    23 de junho de 2026

    Nova fase do Celular Seguro vai combater cadeia econômica do roubo

    23 de junho de 2026

    Dólar sobe para R$ 5,18 e atinge maior valor desde fim de março

    23 de junho de 2026

    Projeto Mais Médicos Especialistas Recebe 50 Profissionais No Rio

    10 de junho de 2026

    RJ: Polícia Faz Ação Contra Venda Clandestina De Canetas Emagrecedoras

    2 de junho de 2026

    Rio: Belga Testa Positivo Para Malária, Mas Fiocruz Não Descarta Ebola

    31 de maio de 2026

    Curso gratuito de cinema abre inscrições para jovens do Rio na Biblioteca Parque Estadual

    23 de maio de 2026
  • Cultura e Entretenimento

    Flip divulga programação para edição de 2026

    23 de junho de 2026

    Plataforma amplia acesso a línguas reconhecidas no Brasil

    23 de junho de 2026

    Campina Grande já teve mais de 400 grupos de quadrilhas juninas

    23 de junho de 2026

    Canções sobre cidades atravessam gerações e marcam os festejos juninos

    22 de junho de 2026

    Maceió dá início à programação junina nesta segunda-feira

    22 de junho de 2026
  • Política

    Lula entrega aparelhos de radioterapia em São Paulo

    23 de junho de 2026

    Lula cria plataforma para coibir roubos de celulares e vendas ilegais

    23 de junho de 2026

    Governo inaugura primeira etapa da rodovia na Serra das Araras, no Rio

    23 de junho de 2026

    Governo enviará PL à Câmara, nesta semana, para aumentar limite do MEI

    23 de junho de 2026

    Alcolumbre mantém PEC 6×1 travada em semana esvaziada no Senado

    22 de junho de 2026
  • Saúde

    ANS Defende Que Plano Cubra Mamografia Digital Sem Restrição De Idade

    23 de junho de 2026

    Raoni Faz Transição Para Dieta Oral E Tem Evolução No Quadro De Saúde

    23 de junho de 2026

    Anvisa Aprova Novo Medicamento Oral Para Câncer De Mama

    23 de junho de 2026

    Anvisa Aprova Medicamento Não Hormonal Contra Sintomas Da Menopausa

    23 de junho de 2026

    Anvisa Libera Produtos Da Ypê Produzidos A Partir De Janeiro De 2026

    22 de junho de 2026
  • Carnaval do Rio

    Estilista Ari Mesquita celebra sexta vitória na Corte do Carnaval Carioca

    4 de novembro de 2025

    Maculele realiza audições para novos dançarinos do Salgueiro

    4 de novembro de 2025

    Salgueiro recebe Unidos da Tijuca neste sábado (01)

    31 de outubro de 2025

    Salgueiro lança videoclipe nesta sexta-feira (31)

    30 de outubro de 2025

    O Unidos do Porto da Pedra anuncia Lourdes Barreto em seu desfile de 2026

    29 de outubro de 2025
CRIA DO RIO
Início » Últimas Notícias » Ajudante Digital #19: raspadores de IA viram “praga” na Wikipédia
Tecnologia e Inovação

Ajudante Digital #19: raspadores de IA viram “praga” na Wikipédia

Por leyberson.pedrosa16 de junho de 2025
Facebook Twitter Pinterest LinkedIn Tumblr E-mail
ajudante-digital-#19:-raspadores-de-ia-viram-“praga”-na-wikipedia
Ajudante Digital #19: raspadores de IA viram “praga” na Wikipédia
Compartilhar
Facebook Twitter LinkedIn Pinterest E-mail

Baixar


Criada em 2001, a Wikipédia se tornou uma das principais fontes de conhecimento da internet. Mas, com o avanço da inteligência artificial, essa enciclopédia on-line passou a enfrentar um problema crescente: programas automáticos que copiam conteúdos de forma massiva estão comprometendo a estabilidade da plataforma. ebc Ajudante Digital #19: raspadores de IA viram "praga" na Wikipédiaebc Ajudante Digital #19: raspadores de IA viram "praga" na Wikipédia

Leyberson Pedrosa e suas vozes digitais destacam o alerta do executivo da Fundação Wikimedia, Lane Becker, e deixam uma pergunta no ar: como garantir a sobrevivência de uma enciclopédia colaborativa diante do apetite das IAs?

Confira os destaques deste episódio:

  • 📚 Wikipédia, com 24 anos, é uma enciclopédia colaborativa e multilíngue.

  • 🤖 Bots chamados raspadores copiam conteúdo e sobrecarregam os servidores.

  • 📈 Em 2024, o tráfego desses bots cresceu 50%, especialmente no Wikimedia Commons.

  • 💸 65% do tráfego mais custoso vem desses sistemas automatizados.

  • 🛶 Parábola da balsa ilustra a disputa por espaço entre humanos e máquinas.

  • 🧠 Equipe da Wikipédia enfrenta conteúdos gerados por IA com erros e fontes falsas.

  • ⚠️ Lane Becker alerta para aumento contínuo do tráfego automatizado.

  • 🧾 Uso sem crédito e sem remuneração põe em risco a sustentabilidade do projeto.

  • 🔗 Episódio, inspirado em reportagem do Núcleo, destaca a importância de respeitar fontes.

  • 💡 Uso de IA depende de dados e pessoas que mantêm o conhecimento acessível.

Você também pode sugerir temas ou tirar dúvidas. Entre em contato pelo WhatsApp (11) 97469-0138 ou deixe seu comentário no canal do Ajudante Digital no Spotify.

AJUDANTE DIGITAL #19: IA “PEGA PESADO” COM A WIKIPÉDIA

NO AR EM 09/06/2025

[Voz IA humanizada]: Ajudante Digital, como a inteligência artificial tem tanta informação sobre as coisas?
[Voz IA Robozito]: Ih, tô sentindo que vai sobrar pra mim.
[Vinheta Ajudante Digital] 🎶
[Trilha sonora principal – som de fundo] 🎶

[Leyberson]: Olá, saudosos leitores de enciclopédia destas ondas sonoras e digitais! Hoje, o Ajudante Digital chega com a Wikipédia debaixo do braço para testemunhar a importância dessa enciclopédia on-line e também para falar sobre um novo dilema tecnológico:
Como os raspadores de Inteligência Artificial estão sobrecarregando os servidores desta enciclopédia livre.

[Voz IA Robozita]: Me inclua fora desta. Eu não fico copiando as coisas dos outros, não.
[Voz IA Robozito]: Uai, mas a Wikipédia não é livre e colaborativa? 

[Leyberson]: Claro que sim, Robozito!
A Wikipédia é um projeto de enciclopédia on-line que existe há 24 anos com o objetivo de fornecer informação verificável e acessível a todos. Os verbetes podem ser criados por qualquer pessoa, desde que sigam regras de qualidade e controle. E tem versões em diferentes idiomas.

[Voz IA Robozito]: Então, deixa a gente pesquisar lá antes de criar as respostas.
[Leyberson]: Nada mais justo do que os softwares se alimentarem dela para nos ajudar. O problema é fazerem isso por si só e sobrecarregarem a Wikipédia como se fosse uma praga.

[**Som de gafanhotos**]: 🎶

[“POV” das pragas do Egito – VEO GOOGLE]: 🎶 “Rapaz, tive que gravar, não tem jeito. Os gafanhotos passaram aqui ontem. Hoje nem folha tem.”
: 🎶

[Voz IA Robozito]: Pera aí… Raspadores são tipo “gafanhotos digitais”?
[Leyberson]: Quase isso! São bots que varrem sites e baixam todos os dados de forma indiscriminada. Isso tem gerado custos altíssimos e até quedas nos servidores.

[**Som de gafanhotos**]: 🎶

[“POV” das pragas do Egito – VEO GOOGLE]: 🎶 “Comeram até minha túnica, véi.”
: 🎶
[Som de engrenagens] 🎶

[Leyberson]: Deixa eu tentar explicar esse problema com uma parábola.

[Música de fundo: Medieval Story by Frank Schröter – Creative Commons] 🎶
(Link: https://commons.wikimedia.org/wiki/File:Medieval_Story_by_Frank_Schr%C3%B6ter.ogg)

[Leyberson]: Você está na beira de um rio sem ponte, com apenas uma balsa para te transportar para o outro lado. Na hora da travessia, será preciso encher a barca com coisas e pessoas. O piloto carrega o barco principalmente com uma carga de máquinas. Quando chega sua vez, o barco já está cheio e você fica de fora.

[Voz IA Robozita]: Ué, não era mais fácil ter dividido? Metade humano, metade carga?

[Leyberson]: Daria. Que tal se fosse 70% de gente e 30% carga?

[Voz IA Robozito]: Combinado!

[Leyberson]: No caso da Wikipédia, os seus servidores estão ficando cheios.
A Wikimedia Foundation, que administra a enciclopédia, revelou que 65% do tráfego mais custoso vem desses raspadores de IA. Só em 2024, esse tráfego cresceu 50%, especialmente no Wikimedia Commons, que é o repositório de fotos e vídeos da Wikipédia.

[Voz IA Robozito]: Pronto, a culpa é minha agora. Vou deixar até de buscar o significado de raspadores na Wikipédia para não onerar o servidor. Explica você aí, humano!

[Leyberson]: Sem apelar, Robozito. Raspadores são programas automáticos que copiam grandes quantidades de conteúdo — texto, imagens, tudo — para alimentar e treinar modelos de inteligência artificial.

[Som de alarme digital] 🎶

[Leyberson]: E o problema não para por aí…

[Voz IA Robozito]: Lá vem!

[Som de engrenagens] 🎶

[Leyberson]: Uma força-tarefa de editores humanos foi criada pra combater conteúdos gerados por IA na própria Wikipédia, com erros, alucinações e fontes falsas. Tá virando bagunça.

[Voz IA robotizada feminina]: Eita, nóis. Se eu fosse humano, ia criar um sindicato das IAs contra essa palhaçada. Mas o que a Fundação Wikimedia diz sobre o futuro?

[Leyberson]: Primeiro, é bom darmos o crédito da fonte primária, prática comum lá na Wikipédia. O site jornalístico Núcleo.Jor fez uma matéria bem legal explicando esse dilema dos raspadores. No texto, eles citam uma entrevista do executivo da fundação, Lane Becker. Ele diz que o problema a curto prazo é o uso de conteúdos do Wikimedia por IAs sem os devidos créditos.

[Frase memética – Futurama] 🎶 “Ah, agora eu entendi!”

[Leyberson]: Mas, vejam só a bola de neve: a médio e longo prazo, as IAs vão precisar que a Wikipédia continue gerando conteúdo para alimentar os seus próprios modelos. O uso sem créditos e sem remuneração coloca em risco a sustentabilidade do projeto. Vamos para o alerta do Becker:

[Som de alarme digital] 🎶

[Leyberson]: Abre aspas: “Claramente estamos entrando em uma era em que o nível de tráfego automatizado para nosso serviço está aumentando — e isso não vai parar.”

[Som de engrenagens sobrecarregadas] 🎶

[Música de fundo: Medieval Story by Frank Schröter – Creative Commons] 🎶

[Leyberson]: Infelizmente, a gente não tem uma solução para evitar que esse barco afunde. O que a gente pode fazer é testemunhar a importância de iniciativas como a Wikipédia e também lembrar que os verbetes que estão lá são gerados a partir de outras fontes verificáveis. Então, se você usa IA no seu dia a dia, lembre que por trás de cada resposta existe um mundo de dados — e alguém tá pagando a conta.

[Voz IA Robozita]: Respeito à fonte é o mínimo, né?

[Voz IA Robozito]: Eu me rendo. Sem vocês, humanos, eu nem existiria. Também assumo o pacto de não ficar retroalimentando conteúdo com mais do mesmo.

[Voz IA Robozita]: Afinal, uma coisa puxa a outra.

[Voz IA Robozito]: É que nem o dilema Tostines: IA consome mais conteúdo de humano ou o humano consome mais conteúdo de IA?

[Leyberson]: Hum, acho que não entendi bem a associação. Também, fica gerando dado sem fonte confiável, dá nisso.

[Trilha secundária – Identidade Visual] 🎶

[Leyberson]: Quer saber mais sobre esse mundo dos raspadores de dados ou outras questões de tecnologia que estão influenciando o nosso dia a dia?

[Voz IA Robozita]: Então, mande suas dúvidas para nosso WhatsApp: 11 97469-0138.

[Voz IA Robozito]: Este episódio usou, para efeitos meméticos, entre outros elementos, música medieval disponível em Creative Commons, trechos de vídeos sobre pragas do Egito feitos com VEO IA, e sons de estridulação, que é esse barulho característico de gafanhotos. E adivinha de onde achei a definição dessa palavra? Da Wikipédia. Vai lá. E sai pra lá, gafanhoto!

Até o próximo episódio. Tchau!

[Vinheta de encerramento] 🎶

Raspadores de IA estão detonando a Wikipédia (nucleo.jor)

Ajudante Digital é uma coluna semanal com dicas tecnológicas para o dia a dia de quem está conectado com a Tarde Nacional SP. A terceira temporada estreou em 02 de junho de 2026. O conteúdo completo como transcrição do episódio e links para fontes usadas, além de dicas extras ficam disponíveis no site da Radioagência Nacional. Dúvidas e sugestões para a coluna podem ser enviadas em texto ou áudio para o número (11) 97469-0138.
 

Criação, roteiro e locução Leyberson Pedrosa
Identidade sonora José Maria Pardal
Montagem e desenho de som Leyberson Pedrosa
Design gráfico Silvino Carneiro e Caroline Ramos 
Revisão de roteiro Bruna Athayde
Edição web: Rilton Pimentel

 

 

 Ajudante Digital #19: raspadores de IA viram "praga" na Wikipédia

© Arte EBC

Inovação Enciclopédia online sofre com bots que copiam dados sem controle Brasília (DF) 16/06/2025 – 16:00 Rilton Pimentel Leyberson Pedrosa – Repórter da Radioagência Nacional Ajudante Digital inteligência artificial Wikipedia segunda-feira, 16 Junho, 2025 – 16:00 6:05

Compartilhar. Facebook Twitter Pinterest LinkedIn Tumblr E-mail
Artigo anteriorMinistro defende gás mais barato para reindustrialização do país
Próximo artigo Tecidos Feitos Em Laboratório Podem Aperfeiçoar Testes De Medicamentos
leyberson.pedrosa

Postagens relacionadas

Estudo mostra que IA é usada para simular reações humanas em pesquisas

16 de junho de 2025

Ajudante Digital #18: Use o modo seguro pra limpar celular infectado

9 de junho de 2025

Ajudante Digital# 17: que é a conta GOV.BR? Entenda sem medo

4 de junho de 2025
Deixe uma resposta Cancelar resposta

Destaques
Esportes
Esportes

Confira os resultados dos jogos desta terça-feira (23) na Copa

23 de junho de 2026Por Agencia Brasil

O dia de hoje (23) na Copa do Mundo teve como destaque uma inédita marca…

Economia e Negócios

Governo mantém elevação de tarifas a carro elétrico e renova cota zero

23 de junho de 2026Por Ryan Mazcatti
Segurança e Justiça

Nova fase do Celular Seguro vai combater cadeia econômica do roubo

23 de junho de 2026Por Sarah Quines - reporter da Radio Nacional
Economia e Negócios

Dólar sobe para R$ 5,18 e atinge maior valor desde fim de março

23 de junho de 2026Por Ryan Mazcatti
Mais Lidos
Cultura e Entretenimento

Pedro Sampaio agita a Cinelândia com show gratuito neste domingo (19)

17 de outubro de 2025Por Ryan Mazcatti
Cultura e Entretenimento

Prisão injusta de Rayane Carla, jovem carioca acusada com base em imagens incorretas

19 de outubro de 2025Por Ryan Mazcatti
Cultura e Entretenimento

Exposição de memes leva arte e crítica social ao CCBB São Paulo

28 de agosto de 2025Por Joana Cortes - Reporter da Radio Nacional
Últimas Notícias

Oportunidade real: jovens do Rio recebem bolsa para aprender e empreender

5 de maio de 2026Por Ryan Mazcatti
Redes Sociais
  • Instagram
Posts Recentes
Esportes

Confira os resultados dos jogos desta terça-feira (23) na Copa

23 de junho de 2026Por Agencia Brasil
Economia e Negócios

Governo mantém elevação de tarifas a carro elétrico e renova cota zero

23 de junho de 2026Por Ryan Mazcatti
Segurança e Justiça

Nova fase do Celular Seguro vai combater cadeia econômica do roubo

23 de junho de 2026Por Sarah Quines - reporter da Radio Nacional
Economia e Negócios

Dólar sobe para R$ 5,18 e atinge maior valor desde fim de março

23 de junho de 2026Por Ryan Mazcatti
Últimas Notícias

Conexão Tijuca promove empreendedorismo, saúde e cultura em evento gratuito no Andaraí

23 de junho de 2026Por Ryan Mazcatti
Sobre

Cria do Rio é um blog de noticias e informações com foco no estado do Rio de Janeiro.

Instagram
Posts Populares

Zico dará nome à taça do Campeonato Carioca de 2025, que começa neste fim de semana

12 de janeiro de 2025

Ministério da Justiça regulamenta uso da força por agentes de segurança pública

17 de janeiro de 2025

Trump cria sua ‘memecoin’ e valor dispara; entenda se presidente dos EUA pode criar uma criptomoeda

21 de janeiro de 2025
CRIA DO RIO
Instagram WhatsApp
  • Início
  • Política de Cookies (BR)
© 2026 Cria do Rio. Todos os direitos reservados. Desenvolvido por: Hospedagens Pro

Digite o texto acima e pressione Enter para pesquisar. Pressione Esc para cancelar.

Gerenciar Consentimento de Cookies
Para fornecer as melhores experiências, usamos tecnologias como cookies para armazenar e/ou acessar informações do dispositivo. O consentimento para essas tecnologias nos permitirá processar dados como comportamento de navegação ou IDs exclusivos neste site. Não consentir ou retirar o consentimento pode afetar negativamente certos recursos e funções.
Funcional Sempre ativo
O armazenamento ou acesso técnico é estritamente necessário para a finalidade legítima de permitir a utilização de um serviço específico explicitamente solicitado pelo assinante ou utilizador, ou com a finalidade exclusiva de efetuar a transmissão de uma comunicação através de uma rede de comunicações eletrónicas.
Preferências
O armazenamento ou acesso técnico é necessário para o propósito legítimo de armazenar preferências que não são solicitadas pelo assinante ou usuário.
Estatísticas
O armazenamento ou acesso técnico que é usado exclusivamente para fins estatísticos. O armazenamento técnico ou acesso que é usado exclusivamente para fins estatísticos anônimos. Sem uma intimação, conformidade voluntária por parte de seu provedor de serviços de Internet ou registros adicionais de terceiros, as informações armazenadas ou recuperadas apenas para esse fim geralmente não podem ser usadas para identificá-lo.
Marketing
O armazenamento ou acesso técnico é necessário para criar perfis de usuário para enviar publicidade ou para rastrear o usuário em um site ou em vários sites para fins de marketing semelhantes.
  • Gerenciar opções
  • Gerenciar serviços
  • Gerenciar {vendor_count} fornecedores
  • Leia mais sobre esses objetivos
Ver preferências
  • {title}
  • {title}
  • {title}