ファイルを解析するにはどうすればよいですか?[閉まっている]

https://stackoverflow.com//questions/22022183

21-12-2019
|

質問

閉まっている. 。この質問に必要なのは詳細または明確さ. 。現在回答を受け付けておりません。

この質問を改善したいですか? 詳細を追加して問題を明確にするこの投稿を編集する.

閉まっている 5年前.

次のコードは文字列を解析します。

import lxml.html

doc = lxml.html.document_fromstring("""<html>
 <body>
   <span class="simple_text">One</span> tehfghhxt</br>
   <span class="cyrillic_text">Второй</span> cyrcyrcyr</br>
 </body>
</html>
""")

txt1 = doc.xpath('/html/body/span[@class="simple_text"]/text()[1]')
print(txt1)

同じ文字列が含まれるファイルを解析する方法を知りたいです。そしてそれは同じディレクトリにあります。教えてください。

解決

string = open('file_with_string.html', 'r').read()
doc = lxml.html.document_fromstring(string)

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow