質問

ドキュメントを処理するサーバー側アプリケーションの開発を検討しています。ソース文書はほとんどが MS-Word 2003、2007 です。Docx の MS バージョン。サーバー アプリケーションを Linux と Windows の両方で実行できるようにしたい。Linux で MS-Word ファイルを読み書きするための最適なツールまたはライブラリは何か知りたい。互換性は最も重要な考慮事項です。表を含むソース文書の書式設定を保持する必要があります。

似たような投稿を見たことがある ここ しかし、それはPythonに固有のものでした。Windows と Linux で利用できる限り、どのような言語やライブラリが使用されていても構いません。
してはなりません Word ファイルを読み取るには MS-Word が必要です。
Open Office については知っていますが、MS-Word ファイルとの高い互換性を持つソリューションを探しています。また、有望に見えるこのソリューションに出会ったばかりです。 aspose.comAspose.Words for Java または同様のサードパーティ パッケージを使用した経験のある人はいますか?有望に見えますが、OEM サブスクリプションの場合は 2,000 ドル以上と高価です。とはいえ、宣伝どおりに機能するのであれば、それが依然として最良のソリューションである可能性があります。

おかげで、いくつかの提案がありましたが、これまでのところ、法案(または予算)に適合するものはありません。

役に立ちましたか?

解決

b2xtranslator を使用してバイナリ .doc を .docx に変換することを検討しましたか。(Linux では、Mono で実行する必要があります)

その後、POI または docx4j を使用して docx を操作できます。ただし、.doc として保存する必要がある場合は解決策ではありません (そのビットに OO を使用しない限り)

他のヒント

わかりました、もう一度答えてみます ;-)

使ってみてはどうでしょうか unconv

OpenOffice が読み取ることができるあらゆるドキュメントを、OpenOffice が書き込むことができるあらゆるドキュメントに変換できます。これを使用して、MS-Word ドキュメントとの間で両方の変換を行うことができるはずです (オープン オフィスではうまく処理できないほど複雑でないことが条件です)。

唯一の注意点は、unoconv が対話するには Linux サーバー上で OpenOffice のインスタンスが実行されている必要があることです。

Mono は最近、docx ファイルのある程度の操作を可能にする system.io.packaging .net クラスのサポートを取得しました。リソースを追加/削除し、テキストを再帰的に実行したい場合は、おそらくそれが正しいことでしょう。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top