LXMLエラーでWebページを取得できません "HTTPリソースのロードに失敗しました"

StackOverflow https://stackoverflow.com//questions/25007501

  •  20-12-2019
  •  | 
  •  

質問

こんにちは、私はブラウザの下のリンクを開いたもので、コードでは機能しませんでしたが、リンクは実際にはニュースサイトの組み合わせ、次に別のファイルから呼び出された記事の拡張子がurl.txtです。私は通常のウェブサイト(www.google.com)でコードを試してみました、そしてそれは完全に機能します。

import sys
import MySQLdb
from mechanize import Browser
from bs4 import BeautifulSoup, SoupStrainer
from nltk import word_tokenize
from nltk.tokenize import *
import urllib2
import nltk, re, pprint
import mechanize #html form filling
import lxml.html

with open("url.txt","r") as f:
    first_line = f.readline()
#print first_line
url = "http://channelnewsasia.com/&s" + (first_line)
t = lxml.html.parse(url)
print t.find(".//title").text
.

そしてこれは私が得るエラーです。

画像の説明が入力されています

とこれはurl.txt

の内容です。

/news/asiapacific/australia-to-send-armed/1284790.html

役に立ちましたか?
ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top