嘿,已经有一段时间了,我正在寻找命令行的PDF查看器。

由于我喜欢在Linux上没有X的情况下工作,而且经常在远程计算机上工作,因此我想拥有一个读取PDF的工具。有很多非常好的图形程序(evince,okular,actroread,...)可以完成这项工作,因此我认为至少应该有一个不错的文本模式工具。但是我什至不知道一个糟糕的人!

当前,我要么启动X仅用于读取PDF,要么使用PDFTOHTML+LYNX。但是,后者不会产生非常好的输出,并且大多数文档都是不可读的,尤其是在包含数学公式的情况下。

Google充满了人们说这是不可能的,要么建议使用PDFTOHTML版本。

我意识到,这并不是一个编程问题,但是我目前正在考虑启动一个实施此类程序的项目,除非已经有一个好的程序。

感谢您的建议。

有帮助吗?

解决方案

嗨,我认为您不需要为您的目的编写程序,我的意思是在控制台模式下读取PDF文件,因为“少”命令已经为您完成。因此,请使用它并享受它。

少少“ pdf文件的名称”

其他提示

好的,您要求甚至知道“糟糕”的人。这是两个(决定他们各自的脆弱):

第一的: Ghostscript的 txtwrite 输出设备

 gs \
   -dBATCH \
   -dNOPAUSE \
   -sDEVICE=txtwrite \
   -sOutputFile=- \
   /path/to/your/pdf

第二: XPDF pdftotext CLI实用程序(比Ghostscript更好):

 pdftotext \
   -f 13 \
   -l 17 \
   -layout \
   -opw supersecret \
   -upw secret \
   -eol unix \
   -nopgbrk \
   /path/to/your/pdf
   - |less

这将显示页面范围13(F第一页)至17(lAST页面),保留一个名为PDF文件的双通词保护的布局(使用用户和所有者密码 秘密超额分泌),带有UNIX EOL约定,但没有插入PDF页面之间的页面breaws,少了...

pdftotext -h 显示所有可用的命令行选项。

当然,这两个工具仅适用于PDF的文本部分(如果有)。哦,数学公式也不会很好地工作... ;-)


编辑: 我误认为上面的命令(最初使用 pdftops 代替 pdftotext).

顺便说一句,我总是处于相同的情况,我使用MC(午夜指挥官),该(午夜指挥官)处理文本PDF的很好...只需在MC中查看文件(F3)

还有 绿色 PDF查看器。有一个演示 YouTube.

FBPDF 是framebuffer PDF查看器。

还有一个叉子, JFBPDF, ,但是目前我无法使它起作用。

这只有在您的PDF文档结构化时才能起作用,即这是一个 标记的PDF 文档。

要获得文档中文本对象的正确阅读顺序。

标记的PDF文档还允许您重新流动文档,尽管我不知道使用命令行输出执行此操作的任何工具。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top