MS WordをインストールせずにHTMLをWordにエクスポートする最良の方法は何ですか?
質問
Microsoft Word をインストールせずに、単純な HTML ページを Word (.docx ではなく .doc 形式) にエクスポートする方法はありますか?
解決
おっしゃるとおり単純な HTML ページしかない場合は、Word で開くことができます。
それ以外の場合、これを行うことができるライブラリがいくつかありますが、私はそれらを使用した経験がありません。
私の最後のアイデアは、ASP.NET を使用している場合は、次のことを追加してみてください。 application/msword
ヘッダーに追加すると、それを Word ドキュメントとして保存できます (実際の Word ドキュメントではなく、開くことができるのは doc に名前が変更された HTML のみです)。
他のヒント
ファイル形式コンバーターを公開するためにオープン オフィスに接続する JODConverter と呼ばれるツールがあり、投稿先の Web アプリ (Tomcat 内にある) とコマンド ライン ツールとして利用できるバージョンがあります。私はこれで HTML を起動し、.doc と PDF に正常に変換しました。これはかなり大きなプロジェクトに含まれており、まだ公開されていませんが、使用するつもりだと思います。http://sourceforge.net/projects/jodconverter/
というオープンソースプロジェクトがあります HTMLからWordへ これにより、ユーザーは整形式 HTML (XHTML) の断片を書式設定されたテキストとして Word 文書に挿入できるようになります。
Microsoft Word ファイル「.doc」を作成することも可能ですが、おそらく「.rtf」ファイルを作成する方が簡単で移植性が高いでしょう。
Java で作業している場合は、私がリリースしたコードを使用して HTML を実際の docx コンテンツに変換できます。 docx4j 2.8.0. 。「本物」と言ったのは、代わりに HTML を作成することだからです。 altチャンク, 、実際の変換 (文書が最初に開かれたとき) を Word に依存します。
いろいろ見てください ConvertInXHTML というプレフィックスが付いたサンプル. 。インポート プロセスでは整形式の XML が必要となるため、最初に XML を整理する必要がある場合があります。
そうですね、これを行うためのサードパーティ製ツールがたくさんあります。それよりも簡単になるかどうかはわかりません。
例:
- http://htmltortf.com/
- http://www.brothersoft.com/windows-html-to-word-2008-56150.html
- http://www.eprintdriver.com/to_word/HTML_to_Word_Doc.html
また、 vbscribt, しかし、それにはワードがインストールされている必要があると思います。
「C#」タグから、これをプログラムで実現したいと思われます。
単なる HTML の場合は、拡張子を .doc に変更するだけで、Word は Word 文書であるかのように開きます。ただし、含める画像や実行する JavaScript がある場合は、少し複雑になる可能性があります。
私は信じている オープンオフィス .html ファイルを開くことも、.doc ファイルを作成することもできます
HTMLファイルは次のように開くことができます リブレオフィス 作家。次に、[ファイル]メニューからPDFとしてエクスポートできます。また、ブラウザは HTML を PDF ファイルとしてエクスポートできます。
このリンクを使用して Word にエクスポートしますが、ここでは画像は機能しません。