InicioLinuxPdf a texto en linux (ubuntu).

Pdf a texto en linux (ubuntu).

Linux7/22/2010
Pdf a texto en linux (ubuntu). En linux es muy fácil manipular archivos pdf, hay una serie de programas que desde la consola nos permiten "abrir" un pdf y extraer tanto texto como imágenes: Todos ellos están en los "poppler-utils". Si al entrar a la consola y escribir el nombre del programa te dice que no existe lo tenés que instalar desde el gestor de paquetes synaptic (systema, administración) o con cualquier método alternativo de instalación de progrmas. Estos son: pdftotext convierte pdf a texto plano. pdftohtml convierte el pdf en un archivo html (para ser leído por un navegador como firefox) pdfinfo entrega toda la info sobre el pdf pdffonts nos dice las fuentes (letras) que vienen con el pdf y ademas pdftoabw pdftops y pdftoppm convierten a otros formatos. Uso de pdftotext pdftotext kamasutra.pdf kamasutra.txt El ejemplo que sigue muestra como indicarle entre qué páginas convertir (f=first, l=last): pdftotext -f 5 -l 17 kamasutra.pdf kamasutra.txt pdftotext -layout kamasutra.pdf kamasutra.txt Esta opción mantiene, tanto como sea posible, el aspecto original de la hoja de texto. Esto puede traer problemas ya que si el texto tiene más de una columna el programa ubicará los textos tal como están en la página con lo cual la información quedará mezclada. La opción -raw en cambio, deja el texto en el orden de lectura. La opción -htmlmeta genera un archivo html simple, con el contenido del pdf. En otro post más sobre pdf, cómo hacer cuando el pdf sólo contiene scans de texto. pablo
Datos archivados del Taringa! original
0puntos
0visitas
0comentarios
Actividad nueva en Posteamelo
0puntos
2visitas
0comentarios
Dar puntos:

Dejá tu comentario

0/2000

Autor del Post

p
pablogu🇦🇷
Usuario
Puntos0
Posts3
Ver perfil →
PosteameloArchivo Histórico de Taringa! (2004-2017). Preservando la inteligencia colectiva de la internet hispanohablante.

CONTACTO

18 de Septiembre 455, Casilla 52

Chillán, Región de Ñuble, Chile

Solo correo postal

© 2026 Posteamelo.com. No afiliado con Taringa! ni sus sucesores.

Contenido preservado con fines históricos y culturales.