9/11/2013

Uma Palavra muda o mundo

O nome é esquisito e talvez nunca tenha escutado, mas muito provavelmente se você é aquele obcecado por computador e passa horas navegando na Internet já deve ter esbarrado com ele por ai. Estou falando do CAPTCHA, aquela figurinha que aparece quando quer baixar algum arquivo ou finalizar um formulário digital. Venhamos e convenhamos, quem nunca ficou “P” da vida ao errar a letrinha que você jurava estar correta. CAPTCHA pode ser um pé no saco para nós humanos, mas para o mundo das máquinas é essencial para garantir a qualidade do serviço de sistemas. Como assim? Como é que aquelas letrinhas vão fazer isso? As letrinhas simplesmente vão identificar você como um usuário humano(gente mesmo) e não um bot, um programa que simula ações humanas repetidas vezes de maneira padrão. Encasquetou? Vou deixar mais claro. Imagine que você queira consultar a restituição do imposto de renda, você entra no site da Receita Federal inclui seu CPF e obrigatoriamente digita as letrinhas chatas do CAPTCHA para saber se aquela grana toda já esta liberada. Agora imagine se aquelas letrinhas não estivessem ali. Um nerdzinho a fim de dar uma sacaneada, criaria um programinha que repetidamente vai gerar um CPF qualquer e entupir o site da receita com solicitação e consequentemente paralisando o serviço. 


Até que um jovem guatemalteco geniosinho da informática viu que a utilização do CAPTCHA poderia ser tão boa para nós seres humanos como já é para as máquinas. Luis von Ahn para alegria de bilhões de leitores no mundo inventou o reCAPTCHA. Um CAPTCHA que quando você digita as letrinhas esta ajudando na criação de um livro digital. Como assim? Para arquivar o conhecimento humano e para tornar a informação mais acessível para o mundo, vários projetos estão digitalizando livros, jornais e revistas que foram escritos antes da era do computador. As páginas do livro estão sendo digitalizadas fotograficamente e depois transformadas em textos usando o “Optical Character Recognition” (OCR). 

Quem conhece o OCR sabe que é um excelente aplicativo para transformar suas digitalizações em textos, mas sabem que nem sempre o sistema identifica corretamente o caracter e acaba trocando letras de algumas palavras. Ai que entra o reCAPTCHA para essas palavras não identificadas pelo OCR. Mas qual a mágica para que o sistema ao identifica já que ele não tem ideia da palavra lida pelo OCR? Não tem mágica, quem vai passar para o sistema é justamente nós meros mortais quando utilizamos o CAPTCHA. O sistema disponibiliza um par de imagens sendo que uma delas o sistema conhece e a outra não. Quando você acerta a imagem com a palavra conhecida pelo sistema ele assume que a outra imagem também esta correta e então, dá a nova imagem a um número de outros usuários para determinar com maior confiança se a resposta original é correta. Após esse procedimento a palavra volta correta ao contexto original do livro digitalizado. 

Hoje a reCAPTHA não pertence mais ao seu criador, foi adquirida pela gigante Google em setembro de 2009 e é responsável pelas digitalizações de arquivos do New York Times e livros do Google Books.

Agora que você já sabe o que são e o que fazem essas imagens quando encontrar uma CAPTCHA no meio do caminho não hesite você esta contribuindo para um mundo com mais livros e mais conhecimentos. 

Texto: Alex Wölbert

Nenhum comentário:

Postar um comentário

Obs: Caso não tenha as contas para postagem utilize a opção anônima se identificando (nome) ou não.