LinuxのCLI PDFビューアー[閉じた
-
01-10-2019 - |
質問
ねえ、かなり長い間、私はコマンドラインのPDFビューアーを探しています。
LinuxでXなしで作業するのが好きで、多くの場合、リモートマシンで作業しているので、PDFSを読むツールが欲しいです。仕事をするためには、非常に優れたグラフィカルプログラム(Evince、Okular、AcroRoread、...)がたくさんあります。そのため、少なくとも1つのまともなテキストモードツールがあるはずだと思いました。しかし、私はくだらないものさえ知りません!
現在、PDFSのみを読むためにXを開始するか、PDFTOHTML+LYNXを使用しています。ただし、後者は非常に良好な出力を生成しません。ほとんどのドキュメントは、特に数学的な式が含まれている場合は、読めないものです。
Googleは、それが不可能であるか、PDFTOHTMLバージョンを提案していると言っている人々でいっぱいです。
これはまさにプログラミングの質問ではありませんが、現在、そのプログラムを実装するプロジェクトを開始することを検討しています。
提案をありがとう。
解決
こんにちは私はあなたがあなたの目的のためにプログラムを書く必要はないと思います。私は「より少ない」コマンドがすでにあなたのためにそれをしているので、コンソールモードでPDFファイルを読むことを意味します。だからそれを使って、ただ楽しんでください。
少ない「PDFファイルの名前」
他のヒント
わかりました、あなたは「くだらない」ものでさえ知るように頼みました。ここに2つがあります(それぞれのくだらないことについて自分自身を決めます):
初め: GhostScript's txtwrite
出力機器
gs \
-dBATCH \
-dNOPAUSE \
-sDEVICE=txtwrite \
-sOutputFile=- \
/path/to/your/pdf
2番: XPDF pdftotext
CLIユーティリティ(GhostScriptよりも優れています):
pdftotext \
-f 13 \
-l 17 \
-layout \
-opw supersecret \
-upw secret \
-eol unix \
-nopgbrk \
/path/to/your/pdf
- |less
これにより、ページ範囲13が表示されます(f最初のページ)17(lASTページ)、PDFファイルの名前が保護されているダブルパスワードのレイアウトを保持します(ユーザーと所有者のパスワードを使用して 秘密の と supersecret)、UNIX EOLコンベンションを使用しますが、PDFページ間にページブレイクを挿入することはありません。
pdftotext -h
利用可能なすべてのコマンドラインオプションを表示します。
もちろん、両方のツールは、PDFのテキスト部分に対してのみ機能します(ある場合)。ああ、数学的な式もうまく機能しません... ;-)
編集: 上記のコマンドを誤って進めていました(元々使用しています pdftops
それ以外の pdftotext
).
ちなみに、私は常に同じ状況にあります。私はテキストPDFを非常にうまく処理するMC(ミッドナイトコマンダー)を使用しています... MCでファイル(F3)を表示するだけです
これは、PDFドキュメントが構造化されている場合にのみ機能します。つまり、 タグ付きPDF 資料。
これは、ドキュメント内のテキストオブジェクトの正しい読み取り命令を取得するために必要です。
タグ付きPDFドキュメントは、コマンドライン出力でそれを行っているツールについては知りませんが、ドキュメントを再浸すこともできます。