InicioInfoReCaptcha (O cómo evitar bots y ayudar a digitalizar libros

ReCaptcha (O cómo evitar bots y ayudar a digitalizar libros

Info1/19/2009
dijo:Día a día, los que navegamos por internet, en muchas ocasiones tendremos que descrifrar los captchas para abrirnos una cuenta en algún servicio o dejar algún comentario en otros. Por otro lado, cuando usamos un escaner mediante OCR, siempre tendremos que revisar las palabras del texto ya que el sistema OCR no es capaz de traducirlo correctamente. ¿Qué tiene que ver una cosa con la otra? Pues muy sencillo, ya que se trata de reCaptcha, un proyecto para la digitalización de libros y documentos escaneados del Internet Archive de la escuela de Ciencias de la computación de la Universidad de Carnegie Mellon que pretende la revisión distribuida de los términos que no ha podido convertir a texto mediante el escaneo con el sistema OCR, por el que se nos ofrece la palabra a descifrar como captcha y otro término para su comprensión. De esta manera, se pretenden digitalizar los contenidos de los libros a textos, y de manera distribuida mediante captchas los usuarios ayudarán a descifrar los términos que el sistema OCR no ha sido capaz de averiguar, permitiendo validar la fiabilidad de los términos introducidos por los usuarios, y que actualmente reCaptcha está colaborando de esta manera en la digitalización de libros y documentos del Internet Archive. Actualmente podemos encontrar plugins para WordPress, MediaWiki, phpBB, y PHP.reCAPTCHA es un sistema que los webmasters pueden implementar en sus webs por medio del cual harán aparecer a sus usuarios un captcha en el que se verán dos palabras. Dos palabras que no se elegirán al azar, sino que procederán de libros que se han intentado digitalizar, pero que se han quedado a medias porque el OCR no ha sido 100% efectivo. Las palabras que se muestran en reCAPTCHA son precisamente esas que los OCR no han podido reconocer. A medida que los usuarios vayan introduciendo las palabras que aparecen para validar el CAPTCHA, estaran ayudando a terminar el proceso de digitalización de libros.Si se cruzan con este bicho XD, se vería algo así:Está buena la idea ---------------FuenteWiki de reCaptcha
Datos archivados del Taringa! original
0puntos
436visitas
0comentarios
Actividad nueva en Posteamelo
0puntos
1visitas
0comentarios
Dar puntos:

Dejá tu comentario

0/2000

Autor del Post

T
Tammuz🇦🇷
Usuario
Puntos0
Posts4
Ver perfil →
PosteameloArchivo Histórico de Taringa! (2004-2017). Preservando la inteligencia colectiva de la internet hispanohablante.

CONTACTO

18 de Septiembre 455, Casilla 52

Chillán, Región de Ñuble, Chile

Solo correo postal

© 2026 Posteamelo.com. No afiliado con Taringa! ni sus sucesores.

Contenido preservado con fines históricos y culturales.