ファイルを解析するにはどうすればよいですか?[閉まっている]
-
21-12-2019 - |
質問
次のコードは文字列を解析します。
import lxml.html
doc = lxml.html.document_fromstring("""<html>
<body>
<span class="simple_text">One</span> tehfghhxt</br>
<span class="cyrillic_text">Второй</span> cyrcyrcyr</br>
</body>
</html>
""")
txt1 = doc.xpath('/html/body/span[@class="simple_text"]/text()[1]')
print(txt1)
同じ文字列が含まれるファイルを解析する方法を知りたいです。そしてそれは同じディレクトリにあります。教えてください。
解決
string = open('file_with_string.html', 'r').read()
doc = lxml.html.document_fromstring(string)
所属していません StackOverflow