Diferencia entre revisiones de «ReCAPTCHA»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
Destruir: no enciclopédico, usando Fastbuttons
m Revertidos los cambios de Lex.mercurio (disc.) a la última edición de 189.181.114.218
Línea 1: Línea 1:
{{destruir|No enciclopédico}}
reCAPTCHA es una extensión de la prueba CAPTCHA que se utiliza para reconocer texto presente en imágenes.
reCAPTCHA es una extensión de la prueba CAPTCHA que se utiliza para reconocer texto presente en imágenes.



Revisión del 00:10 18 sep 2009

reCAPTCHA es una extensión de la prueba CAPTCHA que se utiliza para reconocer texto presente en imágenes.

reCAPTCHA se basa en el hecho de que para un ser humano puede ser simple determinar el texto presente en una imagen cuando para una máquina esta tarea resulta en ocasiones demasiado compleja.

Al digitalizar un documento impreso se toman fotografías del mismo y esas fotografías se convierten a texto empleando sistemas OCR. Sin embargo, hay palabras que presentan dificultades para ser reconocidas automáticamente; como aquellas que contienen letras deformes, manchas producto de defectos en la impresión del papel, páginas con polvo, entre otras. Estas palabras pueden ser identificadas por personas de manera mucho más confiable que por un sistema OCR comptuarizado. reCAPTCHA emplea esta facilidad del ser humano, para así lograr un método de reconocimiento de texto mucho más confiable.

El uso de reCAPTCHA consiste en sustituir al sistema CAPTCHA, colocando dos palabras a reconocer (en lugar de una que emplea típicamente la prueba CAPTCHA). Una de las palabras es conocida y la otra es desconocida. La palabra desconocida es una que no pudo ser obtenida de una imagen mediante un sistema OCR automatizado. El sistema pide al usuario (quien desconoce cuál palabra es conocida y cuál no lo es) que introduzca ambas palabras como texto, y si la palabra conocida se introduce correctamente, el sistema reCAPTCHA asume que hay probabilidades altas de que el usuario haya introducido también la palabra desconocida correctamente. Si la palabra desconocida recibe en múltiples ocasiones la misma traducción (traducción de imagen a texto) se considera que esa traducción es correcta.

Las palabras que fueron traducidas en muchas ocasiones de la misma manera, se pueden reutilizar como palabras conocidas dentro del propio sistema.

Actualmente reCAPTCHA es utilizado para digitalizar ediciones impresas del New York Times. La compañía dueña del sistema reCAPTCHA fue adquirida por Google que podrá usar el sistema como apoyo para su proyecto Google Books.