Pregunta

¿Cómo podría buscar y reemplazar un poco de texto en una gran cantidad de archivos PDF mediante programación? Me gustaría eliminar una URL que se ha agregado a un conjunto de archivos. He podido eliminar el enlace usando javascript en Batch Processing en Adobe Pro, pero el texto del enlace permanece. He visto recomendaciones para usar el retoque de texto, que funciona manualmente, pero no quiero modificar los archivos 1300 manualmente.

¿Fue útil?

Solución

Encontrar texto en un PDF puede ser inherentemente difícil debido a la naturaleza gráfica del formato del documento; las letras que está buscando pueden no ser contiguas en el archivo. Dicho esto, CAM :: PDF tiene algunas capacidades y heurísticas de reemplazo de búsqueda. Pruebe changepagestring.pl y vea si funciona en su PDFs.

Otros consejos

También me he vuelto desesperado. Después de 10 instalaciones de PDF Editor que cuestan dinero y no tienen éxito:

pdftk + editor suficiente:

Reemplazar texto en archivos PDF

  • Usa pdftk para descomprimir la página PDF corrientes

    pdftk original.pdf salida original.clear.pdf descomprimir

  • Reemplaza el texto (a veces esto funciona, a veces no es así.

  • Repare el modificado (y ahora roto) PDF

    pdftk original.clear.pdf output original.clear.fixed.pdf

  

(de Joel Dare)

No estoy seguro de que me gustaría hacer todo el trabajo para escribir el código para modificar sus archivos 1300 cuando hay un programa que puede hacerlo por usted. El otro día, usé la versión profesional de Infix para modificar por lotes casi 100 archivos usando su "Buscar y reemplazar en archivos" característica. Funciona muy bien He evaluado otros programas con la esperanza de encontrar una funcionalidad de búsqueda y reemplazo similar a Microsoft Word. Infix fue el único que encontré que puede hacerlo. Echa un vistazo: http://www.iceni.com/infix-pro.htm

Puede usar la función 'redacción' en Adobe Acrobat Pro para buscar & amp; Reemplace todas las referencias en un solo documento en un solo paso ... no estoy seguro de que pueda ser automatizado a múltiples pasos.

http: / /help.adobe.com/en_US/Acrobat/9.0/Professional/WS5E28D332-9FF7-4569-AFAD-79AD60092D4D.w.html

Acabo de terminar de probar infijo para un texto que se compone de texto cargado con signos diacríticos con la esperanza de generar otro texto donde los caracteres con signos diacríticos dobles y compuestos sean reemplazados por alternativos con signos diacríticos simples. Infix es definitivamente una buena solución para alguien que no se preocupa por el problema de entender el funcionamiento de las soluciones programáticas. Todos los cambios de solicitud fueron efectuados. Aún es necesario comprender cómo hacer que las palabras cambien el diseño del texto.

Esta es solo la mitad de una solución, pero utilicé Touch up combinado con el soporte de AppleScript para enviar pulsaciones de teclas para reemplazar una cadena en miles de celdas de tabla. Dependiendo de cómo estén distribuidas sus páginas, podría funcionar para usted. En mi caso, tuve que insertar manualmente el cursor al comienzo de cada tabla (decenas de tablas, bastante manejable para un proceso manual), pero luego reemplacé miles de celdas automáticamente.

La pregunta es para una solución programática, pero seguiré compartiendo esta herramienta en línea gratuita que me ayudó a reemplazar el texto en algunos archivos PDF:

http://www.pdfdu.com/pdf-replace-text.aspx

No noté ningún anuncio ni ninguna otra modificación en los archivos PDF resultantes después de reemplazar el texto.

No pude realizar los cambios localmente con el software que probé. Creo que el principal problema fue que faltaba la fuente utilizada en el PDF y no funcionó correctamente, incluso con Acrobat Pro. La herramienta en línea no se quejó y produjo un gran resultado.

Le sugiero que use el software VeryPDF PDF Text Replacer Command Line para reemplazar por lotes el texto en páginas PDF, puede ejecutar pdftr.exe para reemplazar texto en páginas PDF fácilmente, por ejemplo,

pdftr.exe -contentreplace " My Name = > Your Name " D: \ in.pdf D: \ out.pdf

pdftr.exe -searchandoverlaytext " My Name = > Your Name " D: \ in.pdf D: \ out.pdf

pdftr.exe -searchandoverlaytext " Mi Nombre = > D: \ temp \ myname.png * 20 * 20 " D: \ in.pdf D: \ out.pdf

pdftr.exe -página 1-3 -remplazar contenido '' Texto antiguo = > Texto nuevo || VeryPDF = > VeryDOC || Mi nombre = > Su nombre " D: \ in.pdf D: \ out.pdf

pdftr.exe -searchtext " cadena " C: \ in.pdf

pdftr.exe -pagerange 1 -searchtext " cadena " C: \ in.pdf

pdftr.exe -pagerange 1 -searchandoverlaytext " Old Text = > New Text || VeryPDF = > VeryDOC || My Name = > Your Name " D: \ in.pdf D: \ out.pdf

pdftr.exe -overlaytextfontname " Arial " -overlaytextcolor FF0000 -overlaybgcolor 00FF00 -searchandoverlaytext " Texto antiguo = > Texto nuevo || VeryPDF = > VeryDOC || Mi nombre = > Tu nombre " D: \ in.pdf D: \ out.pdf

pdftr.exe -opw 123 -upw 456 -contentreplace " Texto antiguo = > Texto nuevo || VeryPDF = > VeryDOC || Mi nombre = > Su nombre " D: \ in.pdf D: \ out.pdf

pdftr.exe -searchandoverlaytext " PDFcamp Printer = > Impresora VeryPDF " -overlaytextfontsize 8 D: \ in.pdf D: \ out.pdf

pdftr.exe -searchandoverlaytext " PDFcamp Printer = > Impresora VeryPDF " -overlaytextfontsize 80% D: \ in.pdf D: \ out.pdf

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top