O Captcha está mudando e a culpa é da IA

CAPTCHA refere-se a vários métodos de autenticação que validam usuários como humanos

1 de março de 2024 16:23

por: Rodrigo Fragola

Formado em Ciência da Computação pela Universidade de Brasília, com foco em Segurança de Rede e Inteligência Artificial. Com mais de 26 ano...

CAPTCHA, um acrônimo para “Completely Automated Public Turing Test to Tell Humans Apart”, refere-se a vários métodos de autenticação que validam usuários como humanos, e não robôs, apresentando testes aos usuários com um desafio que é simples para humanos, mas difícil para máquinas.

O teste CAPTCHA é uma experiência comum para muitos de nós. Ele é usado em várias situações, como fazer login em aplicativos, assinar documentos ou validar consultas de pesquisa. O objetivo é garantir que o usuário seja humano e não um robô automatizado.

Inicialmente, os CAPTCHAs consistiam em imagens simples com letras e números que os usuários precisavam interpretar e digitar em uma caixa de texto. No entanto, com o avanço das técnicas de avaliação de imagens, especialmente relacionadas a contornos e contraste, esses modelos foram gradualmente superados.

CAPTCHA: Meaning, Types & How They Work | Okta UK

Soluções antigas com letras e números

Para enfrentar esse desafio, soluções mais complexas foram adotadas como os quebra-cabeças abaixo. Elas se concentram em imagens de objetos ou partes de objetos, muitas vezes com fotos tiradas de longe ou sem foco ou baixas resoluções. Essas abordagens buscam dificultar a tarefa para bots automatizados que já conseguiam com algum sucesso ler os modelos anteriores e passar no teste.

Why captchas are getting harder - Vox

Soluções com quebra-cabeças

Essas soluções tinham a vantagem de explorar uma infinidade de formas, aproveitando a capacidade subjetiva do cérebro humano para fazer associações que muitas vezes não são tão óbvias para as máquinas. Por exemplo, distinguir entre faixas de pedestres e faixas de zebras era uma tarefa desafiadora para um algoritmo generalizado. Até nós, humanos, às vezes enfrentamos dificuldades com esses desafios, o que resulta em memes divertidos na Internet.

Memebase - captcha - All Your Memes In Our Base - Funny ...

Meme: Marque a bicicleta

Os hackers rapidamente desenvolveram ferramentas para resolver CAPTCHAs que, na verdade, envolviam outra pessoa em algum lugar remoto resolvendo o CAPTCHA em nome de um robô. Embora essa abordagem funcionasse, não era particularmente inteligente, pois prejudicava a principal vantagem dos robôs: a capacidade de processar dados em grande volume.

Parecia que a solução definitiva estava consolidada, até que as inteligências artificiais (IAs) decidiram entrar na disputa.

Um artigo(*) publicado no segundo semestre de 2023 revela que os ataques automatizados por inteligência artificial (IA) a vários esquemas CAPTCHA obtiveram sucesso. Os pesquisadores recrutaram 1.400 participantes para testar sites que utilizavam quebra-cabeças CAPTCHA, representando 120 dos 200 sites mais populares do mundo. A precisão dos bots varia entre 85% e 100%, com a maioria superando os 96%. Isso ultrapassa significativamente a faixa de precisão observada em seres humanos (que varia de 50% a 85%).

O tempo de resolução dos bots é significativamente menor em todos os casos, exceto no caso do reCAPTCHA, onde o tempo de resolução humano de 18 segundos é quase igual ao tempo dos bots, que é de 17,5 segundos. O estudo foi conduzido na plataforma de crowdsourcing MTurk da Amazon e envolveu vários tipos de CAPTCHAs, incluindo identificação de chaminés, barcos, rotação de imagens, marcação de caixas de seleção e digitação de texto distorcido.

Curiosamente, em um ambiente contextualizado, o tempo de resolução humano diminui para 22 segundos, indicando que, nesse ambiente mais natural, os bots de IA são mais rápidos do que os humanos na resolução desses quebra-cabeças.

Apesar de ser um estudo inicial, já podemos observar em 2024 mudanças no CAPTCHA na tentativa de dificultar esta detecção. Vejam o exemplo abaixo:

Escolha o diferente

Observamos três mudanças principais adicionadas a esse modelo de quebra-cabeças:

a) Ausência de limites nas imagens internas: Diferentemente dos quebra-cabeças tradicionais, não há restrições quanto à quantidade de elementos na imagem. Isso dificulta a localização, separação e identificação do objeto pela IA.

b) Fundo com padrão colorido e em relevo: O fundo com padrões complexos cria dificuldades para a IA identificar o objeto e o contexto que o objeto está inserido. Geralmente a informação do contexto é retirada do que esta fora do objeto analisado.

c) Introdução de contexto subjetivo: Por exemplo, a instrução “escolha o que é diferente” não está explicitamente representada na imagem. Nesse caso, a IA precisa identificar vários objetos em tamanhos e ângulos diferentes e concluir se são iguais ou diferentes. Por exemplo, ela deve reconhecer que o sanduíche é diferente dos coelhos, mesmo considerando várias versões possíveis de coelhos.

Seguindo essa linha de raciocínio, poderíamos tornar o desafio ainda mais complexo, inserindo um contexto não explícito na imagem. Por exemplo: Marque o objeto que é uma “comida”. A maioria das pessoas provavelmente marcaria o sanduíche, embora o coelho também possa ser considerado uma “comida”.

Do ponto de vista da segurança, esse é um exemplo bastante explícito de como podemos explorar as falhas de segurança da IA para aprimorar nossa proteção contra as novas habilidades desenvolvidas por esses sistemas de IA.

Explorar as fraquezas da IA para melhorar os sistemas de segurança é um dos novos desafios da tecnologia.

Para saber mais:
(*) chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://arxiv.org/pdf/2307.12108.pdf

Cookie	Duração	Descrição
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Publicidade

Tecnologia e necessidades básicas: equilibrando prioridades na gestão pública

Transformação Digital e Inovação: Softex e seu Impacto no Brasil

A nova era da IA será a da eficiência energética

Identidade digital interoperável como pilar das cidades inteligentes