どのように私はWebViewのからWebページの内容を取得できますか?
-
24-09-2019 - |
質問
Androidでは、私はページを表示しているWebView
を持っています。
私はページを再度要求することなく、ページのソースを取得する方法を教えてください。
これはWebView
がgetPageSource()
文字列を返すメソッドが、それはない残念ながらいくつかの種類を持っている必要がありそうです。
は、コンテンツを取得するには、このコールに置くために、適切なJavaScriptは何ですか?
webview.loadUrl("javascript:(function() { " +
"document.getElementsByTagName('body')[0].style.color = 'red'; " +
"})()");
解決
私は、これは後半の答えですけど、私は同じ問題を抱えていたので、私はこの質問を見つけました。私はにlexanderaでこのポストに答えを見つけたと思います。コム。以下のコードは、基本的には、サイトからのカットアンドペーストです。トリックを行うようだ。
final Context myApp = this;
/* An instance of this class will be registered as a JavaScript interface */
class MyJavaScriptInterface
{
@JavascriptInterface
@SuppressWarnings("unused")
public void processHTML(String html)
{
// process the html as needed by the app
}
}
final WebView browser = (WebView)findViewById(R.id.browser);
/* JavaScript must be enabled if you want it to work, obviously */
browser.getSettings().setJavaScriptEnabled(true);
/* Register a new JavaScript interface called HTMLOUT */
browser.addJavascriptInterface(new MyJavaScriptInterface(), "HTMLOUT");
/* WebViewClient must be set BEFORE calling loadUrl! */
browser.setWebViewClient(new WebViewClient() {
@Override
public void onPageFinished(WebView view, String url)
{
/* This call inject JavaScript into the page which just finished loading. */
browser.loadUrl("javascript:window.HTMLOUT.processHTML('<head>'+document.getElementsByTagName('html')[0].innerHTML+'</head>');");
}
});
/* load a web page */
browser.loadUrl("http://lexandera.com/files/jsexamples/gethtml.html");
他のヒント
パー問題12987 に、ブランデルの答えがクラッシュ。
:代わりに、私は特別な接頭辞にconsole.logへの呼び出しをインターセプト// intercept calls to console.log
web.setWebChromeClient(new WebChromeClient() {
public boolean onConsoleMessage(ConsoleMessage cmsg)
{
// check secret prefix
if (cmsg.message().startsWith("MAGIC"))
{
String msg = cmsg.message().substring(5); // strip off prefix
/* process HTML */
return true;
}
return false;
}
});
// inject the JavaScript on page load
web.setWebViewClient(new WebViewClient() {
public void onPageFinished(WebView view, String address)
{
// have the page spill its guts, with a secret prefix
view.loadUrl("javascript:console.log('MAGIC'+document.getElementsByTagName('html')[0].innerHTML);");
}
});
web.loadUrl("http://www.google.com");
これは jluckyivのに基づいて回答され、 私はそれが次のようにJavascriptを変更した方が良いと単純だと思います。
browser.loadUrl("javascript:HTMLOUT.processHTML(document.documentElement.outerHTML);");
あなたはWebViewの中にそれをロードし、その後個別にHTMLを取得し、検討している?
String fetchContent(WebView view, String url) throws IOException {
HttpClient httpClient = new DefaultHttpClient();
HttpGet get = new HttpGet(url);
HttpResponse response = httpClient.execute(get);
StatusLine statusLine = response.getStatusLine();
int statusCode = statusLine.getStatusCode();
HttpEntity entity = response.getEntity();
String html = EntityUtils.toString(entity); // assume html for simplicity
view.loadDataWithBaseURL(url, html, "text/html", "utf-8", url); // todo: get mime, charset from entity
if (statusCode != 200) {
// handle fail
}
return html;
}
私は、これは、@ jluckyivの答えからコードを使用して作業を得ることができたが、私はMyJavaScriptInterfaceでprocessHTMLメソッドに@JavascriptInterface注釈に追加する必要がありました。
class MyJavaScriptInterface
{
@SuppressWarnings("unused")
@JavascriptInterface
public void processHTML(String html)
{
// process the html as needed by the app
}
}
また@JavascriptInterfaceとメソッドに注釈を付ける必要がある - SDK 17の新しいセキュリティ要件があるため、すなわち、すべてのjavascriptの方法が@JavascriptInterfaceで注釈を付けなければなりません。キャッチされない例外TypeError:そうでなければ、あなたは次のようなエラーが表示されます1
:オブジェクト[オブジェクトのオブジェクト]はヌルで何のメソッド「processHTML」がありませんあなたはキットカットに取り組んで上記されている場合は、リモートとあなたのWebViewから出ても、ページのHTMLソースコードの閲覧に行くすべての要求と応答を見つけるために、ツールをデバッグクロムを使用することができます。