質問

TalendのtJavaRowコンポーネントでJSOUPを使用している問題があります。

これは私の仕事です:

ジョブレイアウト

からtLibraryLoad i JSOUPとjava.io.fileライブラリの.jarファイルをロードしてから、それらをtJavaRow_2コンポーネントにインポートします。

import java.io.File;
import java.io.File;
import org.jsoup.Jsoup;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

import org.jsoup.select.Elements;
.

tJavaRow_2の主要部分に次のコードを実行してください。

Document document = Jsoup.parse(new File("C:/Talend/workspace/WEBCRAWLER/output/keywords_" + context.keywordname +".txt", "utf-8");
Document document = Jsoup.parse(new File("C:/Talend/workspace/WEBCRAWLER/output/keywords_" + context.keywordname +".txt", "utf-8");
        Elements el = document.select(".gutter10");
        Elements el = document.select(".gutter10");
        String result = el.text();
        String result = el.text();


        if(result.length() > 20)
        if(result.length() > 20)
            {context.lastpage = true;};
.

これまでのところ私に論理的なようです。 しかし、私はこのエラーを得る:

Talend Error

この問題を解決するのに役立ちますか?私はこの点から何をすべきか理解していません。

付録:Eclipseで動作するJavaコード:

import java.io.File;
import java.io.File;
//import java.util.regex.*;
import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

public class regextest  {

    public static boolean regExChecker() throws IOException 
    {
        boolean x = false;
        Document document = Jsoup.parse(new File("C:/Talend/workspace/WEBCRAWLER/output/absolventa_testquery.txt"), "utf-8");
        Elements el = document.select(".gutter10");
        String result = el.text();

        if(result.length() > 20)
            {x = true;};

        //System.out.println(x);
        return x;
    }

    public static void main(String[] args) throws IOException{
        System.out.println(regExChecker()); 
    }
}
.

役に立ちましたか?

解決

コードブロックに閉じたブラケットがありません。あなたの最初の行は次のとおりです。

Document document = Jsoup.parse(new File("C:/Talend/workspace/WEBCRAWLER/output/keywords_" + context.keywordname +".txt"), "utf-8");
.

そのまま、Path "C:/Talend/workspace/WEBCRAWLER/output/keywords_" + context.keywordname +".txt"), "utf-8"からファイルを構築してから、そのファイルオブジェクトを渡すだけです(適切なファイルオブジェクトにはなりませんが、コンパイラがこのスポットしていない理由では、これがこのようにスポットしていない)。JSOUPの。

JSOUPのドキュメントシングルである解析の唯一のメソッド呼び出し値は、HTML文書を文字列に渡すときです。そのため、文字列を期待しており、代わりに(壊れた)ファイルを取得します。

2番目のエラーは、VidifulationInitializerの閉鎖ブラケットが欠落していると言って、本当にこれを指摘するものです。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top