LuceneプロジェクトにTikaを統合するにはどうすればよいですか?
-
26-10-2019 - |
質問
JavaプロジェクトにApache Tikaを統合したいと思います。さまざまなファイル形式(Excel、doc、pptなど)からテキストを取得する必要があります。読書の後、Tikaを構築する唯一の方法はSRCファイルをダウンロードしてMavenで構築することであることを理解しています。 Tika SRC(Apache-Tika-0.9-SRC)のルートディレクトリで「MVNインストール」を実行しますが、このエラーが発生します。
[INFO] Scanning for projects...
Downloading: http://repo1.maven.org/maven2/org/apache/apache/6/apache-6.pom
[ERROR] The build could not read 1 project -> [Help 1]
[ERROR]
[ERROR] The project org.apache.tika:tika:0.9 (C:\Users\vexler\Documents\Instal
ls\apache-tika-0.9-src\apache-tika-0.9\pom.xml) has 1 error
[ERROR] Non-resolvable parent POM for org.apache.tika:tika-parent:0.9: Could
not transfer artifact org.apache:apache:pom:6 from/to central (http://repo1.mav
en.org/maven2): Error transferring file: Connection timed out: connect and 'pare
nt.relativePath' points at no local POM @ org.apache.tika:tika-parent:0.9, C:\Us
ers\vexler\Documents\Installs\apache-tika-0.9-src\apache-tika-0.9\tika-parent\po
m.xml, line 25, column 11 -> [Help 2]
私はこのエラーに関する助けを本当に評価しています。ありがとう:-) reuth
解決
プロジェクトでMavenを使用していると仮定すると、人生ははるかに簡単です
ようなものを追加するだけです
<dependency>
<groupId>org.apache.tika</groupId>
<artifactId>tika-parsers</artifactId>
<version>0.9</version>
<scope>provided</scope>
</dependency>
そして、MavenはTikaをダウンロードし、それはあなたの依存関係です
代わりに、最新をダウンロードする場合 Tika Osgi Bundle Jar (例えば 0.9)そしてそれを解き、それからあなたはその中でティカの依存関係とコードを取得する
所属していません StackOverflow