Categories: Cloud

El CAPTCHA también sirve para digitalizar libros antiguos

Para muchos el CAPTCHA no es sino un engorroso sistema que utilizan los sitios web para filtrar spam (en nuestro blog tuvimos que quitarlo). Al parecer, se usan unos 200 millones de veces al día, con lo que, según los informáticos que trabajan en este proyecto, “la humanidad gasta unas 500.000 horas al día en escribir estas letras vailables”.

Luis von Ahn, de la Universidad Carnegie Mellon de Pittsburg, y su equipo de científicos, dicen que es un tiempo demasiado valioso como para perderlo de esa manera. Por eso han desarrollado un nuevo programa, el reCAPTCHA, que recoge las palabras que resultan ilegibles para los escáneres ópticos cuando están digitalizando los textos antiguos. Estas palabras, se envían después a los sitios Web que quieran cooperar con el proyecto para que las coloquen como CAPTCHAs aleatorios. Para las palabras más difíciles, se utilizan múltiples usuarios y se elige la que haya tenido mayor consenso. De esta forma se obtiene una precisión del 99 por ciento, según aseguran los responsables.

Este sistema reCAPTCHA recoge ya automáticamente unos 4 millones de respuestas cada día de 40.000 páginas web adheridas al proyecto, lo que equivale a 1.500 personas trabajando a tiempo completo para transcribir 60 palabras por minuto, explicó von Ahn.

El servicio está disponible en www.recaptcha.net, es gratuito para cualquier web que lo solicite. Después de un año de funcionamiento, ha ayudado a resolver unos 440 millones de palabras. Por ejemplo, el equipo de von Ahn ha digitalizado el archivo completo de periódicos de 1908 del New York Times ayudándose de este sistema.

vINQulos
Science

ddelgado TI

Recent Posts

Los envíos de tabletas vuelven a crecer

Durante el primer trimestre del año aumentaron un 0,5 % hasta los 30,8 millones de…

16 horas ago

AWS re/Start se expande a nuevas regiones en España

Su programa formativo permite a personas desempleadas o subempleadas ganar habilidades en tecnología cloud y…

18 horas ago

El ‘phishing’ se dispara un 60 % en un año

Los nuevos ataques se apoyan en esquemas impulsados por la inteligencia artificial, como el 'vhishing'…

19 horas ago

HUAWEI presenta su nueva serie de smartphones: Pura 70

Los primeros integrantes de la familia HUAWEI Pura son los modelos Pura 70, Pura 70…

19 horas ago

Proofpoint lanza prevención para la pérdida de datos multicanal

Proofpoint DLP Transform funciona en los principales canales: correo electrónico, nube, endpoint y web.

20 horas ago

Los ingresos de Cyberark se disparan un 37 %

Además, la compañía dejó atrás las pérdidas durante el primer trimestre de 2024.

21 horas ago