Linux的CLI PDF查看器[封闭
-
01-10-2019 - |
题
嘿,已经有一段时间了,我正在寻找命令行的PDF查看器。
由于我喜欢在Linux上没有X的情况下工作,而且经常在远程计算机上工作,因此我想拥有一个读取PDF的工具。有很多非常好的图形程序(evince,okular,actroread,...)可以完成这项工作,因此我认为至少应该有一个不错的文本模式工具。但是我什至不知道一个糟糕的人!
当前,我要么启动X仅用于读取PDF,要么使用PDFTOHTML+LYNX。但是,后者不会产生非常好的输出,并且大多数文档都是不可读的,尤其是在包含数学公式的情况下。
Google充满了人们说这是不可能的,要么建议使用PDFTOHTML版本。
我意识到,这并不是一个编程问题,但是我目前正在考虑启动一个实施此类程序的项目,除非已经有一个好的程序。
感谢您的建议。
解决方案
嗨,我认为您不需要为您的目的编写程序,我的意思是在控制台模式下读取PDF文件,因为“少”命令已经为您完成。因此,请使用它并享受它。
少少“ pdf文件的名称”
其他提示
好的,您要求甚至知道“糟糕”的人。这是两个(决定他们各自的脆弱):
第一的: Ghostscript的 txtwrite
输出设备
gs \
-dBATCH \
-dNOPAUSE \
-sDEVICE=txtwrite \
-sOutputFile=- \
/path/to/your/pdf
第二: XPDF pdftotext
CLI实用程序(比Ghostscript更好):
pdftotext \
-f 13 \
-l 17 \
-layout \
-opw supersecret \
-upw secret \
-eol unix \
-nopgbrk \
/path/to/your/pdf
- |less
这将显示页面范围13(F第一页)至17(lAST页面),保留一个名为PDF文件的双通词保护的布局(使用用户和所有者密码 秘密 和 超额分泌),带有UNIX EOL约定,但没有插入PDF页面之间的页面breaws,少了...
pdftotext -h
显示所有可用的命令行选项。
当然,这两个工具仅适用于PDF的文本部分(如果有)。哦,数学公式也不会很好地工作... ;-)
编辑: 我误认为上面的命令(最初使用 pdftops
代替 pdftotext
).
顺便说一句,我总是处于相同的情况,我使用MC(午夜指挥官),该(午夜指挥官)处理文本PDF的很好...只需在MC中查看文件(F3)
这只有在您的PDF文档结构化时才能起作用,即这是一个 标记的PDF 文档。
要获得文档中文本对象的正确阅读顺序。
标记的PDF文档还允许您重新流动文档,尽管我不知道使用命令行输出执行此操作的任何工具。