El sistema ReCaptcha – Crowdsourcing

Seguro que se encontraron en algunas páginas que tienen este sistema de seguridad de ReCaptcha, que básicamente es para saber que la entidad que está atrás de una computadora es una persona o una máquina que hace spam.

Entonces este sistema, te pide que vos escribas la palabra que lees en la pantalla, para que pases al siguiente paso.  Así se corrobora que es una persona que está identificando y entendiendo cuál es la palabra.

Hay un magia atrás de esto.

¿Qué pasa con la otra palabra?

Les cuento, generalmente vienen dos palabras en la imagen. De las cuales, una es conocida en la base de datos que contiene la imagen y la otra se desconoce. Si vos acertás en esa palabra conocida, pasás a lo que sigue.

Les dije que la otra palabra es desconocida para la computadora, y entonces cuando recibe la información que vos le ponés, asocia esa palabra con la imagen. Y después se lo envía a otros usuarios, para que tambien reconozcan esa palabra.

Cuando son varios los usuarios que corroboran que lo se muestra en la imagen se traduce con ciertas letras escritas, se aprueba.

Esto es lo interesante. Una Persona o varias en este caso, leen una palabra confusa, que una máquina no puede leer. Entonces, se utiliza este “servicio”.

Resulta que los que se dedican a digitalizar libros o publicaciones, tienen el problema que la máquina no puede leer ciertas palabras. Por ejemplo, la imagen siguiente:

Y ahí se juntan las dos cosas.

Este fenómeno se llama “Crowdsourcing”, millones de personas “trabajan” con muy poquito esfuerzo para una gran causa, incluso sin saberlo. Son aproximadamente unos 10 segundos que cada persona dedica a escribir esta palabra.

Se resuelven unos 200 millones de CAPTCHAS por día, si bien no todos son con este sistema, es una buena idea para aprovechar ese trabajo. Ya que serían unas 150,000 horas de trabajo por día.  Es como tener una empresa con 18,000 personas trabajando 8 hrs, para transcribir las palabras que no se entienden.

Por ahora esto se está usando para digitalizar los libros en Google Books y ediciones viejas de New York Times.

Estamos contribuyendo al objetivo de Google, ” … organizar la información mundial y hacerla accesible y útil de manera universal… “

One thought on “El sistema ReCaptcha – Crowdsourcing

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s