質問

ねえ、かなり長い間、私はコマンドラインのPDFビューアーを探しています。

LinuxでXなしで作業するのが好きで、多くの場合、リモートマシンで作業しているので、PDFSを読むツールが欲しいです。仕事をするためには、非常に優れたグラフィカルプログラム(Evince、Okular、AcroRoread、...)がたくさんあります。そのため、少なくとも1つのまともなテキストモードツールがあるはずだと思いました。しかし、私はくだらないものさえ知りません!

現在、PDFSのみを読むためにXを開始するか、PDFTOHTML+LYNXを使用しています。ただし、後者は非常に良好な出力を生成しません。ほとんどのドキュメントは、特に数学的な式が含まれている場合は、読めないものです。

Googleは、それが不可能であるか、PDFTOHTMLバージョンを提案していると言っている人々でいっぱいです。

これはまさにプログラミングの質問ではありませんが、現在、そのプログラムを実装するプロジェクトを開始することを検討しています。

提案をありがとう。

役に立ちましたか?

解決

こんにちは私はあなたがあなたの目的のためにプログラムを書く必要はないと思います。私は「より少ない」コマンドがすでにあなたのためにそれをしているので、コンソールモードでPDFファイルを読むことを意味します。だからそれを使って、ただ楽しんでください。

少ない「PDFファイルの名前」

他のヒント

わかりました、あなたは「くだらない」ものでさえ知るように頼みました。ここに2つがあります(それぞれのくだらないことについて自分自身を決めます):

初め: GhostScript's txtwrite 出力機器

 gs \
   -dBATCH \
   -dNOPAUSE \
   -sDEVICE=txtwrite \
   -sOutputFile=- \
   /path/to/your/pdf

2番: XPDF pdftotext CLIユーティリティ(GhostScriptよりも優れています):

 pdftotext \
   -f 13 \
   -l 17 \
   -layout \
   -opw supersecret \
   -upw secret \
   -eol unix \
   -nopgbrk \
   /path/to/your/pdf
   - |less

これにより、ページ範囲13が表示されます(f最初のページ)17(lASTページ)、PDFファイルの名前が保護されているダブルパスワードのレイアウトを保持します(ユーザーと所有者のパスワードを使用して 秘密のsupersecret)、UNIX EOLコンベンションを使用しますが、PDFページ間にページブレイクを挿入することはありません。

pdftotext -h 利用可能なすべてのコマンドラインオプションを表示します。

もちろん、両方のツールは、PDFのテキスト部分に対してのみ機能します(ある場合)。ああ、数学的な式もうまく機能しません... ;-)


編集: 上記のコマンドを誤って進めていました(元々使用しています pdftops それ以外の pdftotext).

ちなみに、私は常に同じ状況にあります。私はテキストPDFを非常にうまく処理するMC(ミッドナイトコマンダー)を使用しています... MCでファイル(F3)を表示するだけです

あります PDFビューアー。デモがあります YouTube.

FBPDF FrameBuffer PDF Viewerです。

フォークもあります、 jfbpdf, 、しかし、現時点では私はそれを機能させることができません。

これは、PDFドキュメントが構造化されている場合にのみ機能します。つまり、 タグ付きPDF 資料。

これは、ドキュメント内のテキストオブジェクトの正しい読み取り命令を取得するために必要です。

タグ付きPDFドキュメントは、コマンドライン出力でそれを行っているツールについては知りませんが、ドキュメントを再浸すこともできます。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top