Hola T!aringeros, mas de alguna vez nos ha pasado que hemos escaneado algún documento o libro y deseamos editar su contenido, pero lamentablemente tenemos el texto del libro en formato imagen (Jpg,Gif, etc …) o simplemente con nuestra cámara de fotos le sacamos fotos a texto y lo terminamos copiando letra x letra y no terminabamos Más! acá la solucion:
Cómo extraer texto de una imagen
Utilizaremos el método conocido como OCR que sus siglas corresponden a Optical Charater Recognition, o en su traducción, reconocimiento óptico de caracteres.
Para lograr esto utilizaremos el software FreeOCR V3 el cual puedes descargar desde el siguiente ENLACE
Si bien, el programa es gratis, este no es tan bueno ni exacto como los programas de pagados como el ABBYY FineReader (el cual trae una versión trial por 15 días o 20 impresiones).
Una vez descargado, procederemos a instalar la aplicación, lo cual no nos traerá ningún inconveniente.
Ahora ejecutaremos nuestra aplicación y tendremos una interfaz,
Luego de abrir el programa instalaremos el idioma ESPAÑOL, ya que por defecto viene en Ingles. Para esto descargaremos el siguiente archivo , luego descomprimiremos el archivo y pegaremos su contenido en la carpeta C:WINDOWStessdata y reiniciamos nuestro programa.
Seguido a esto haremos click en OPEN y elegimos la imagen a la cual deseemos extraer el texto.
Ahora solo nos resta marcar la opción OCR y esperaremos a ver los resultados.
Es simple asi de fácil.
Sino otra es por esta web, al cual podemos ingresar por la dirección: http://www.free-ocr.com/, ahí suben su imagen y listo.
Espero que les sirva, Saludos