如何解析文件？[关闭]

https://stackoverflow.com//questions/22022183

python
lxml
python-3.x
lxml.html

21-12-2019
|

题

下面的代码解析字符串。

import lxml.html

doc = lxml.html.document_fromstring("""<html>
 <body>
   <span class="simple_text">One</span> tehfghhxt</br>
   <span class="cyrillic_text">Второй</span> cyrcyrcyr</br>
 </body>
</html>
""")

txt1 = doc.xpath('/html/body/span[@class="simple_text"]/text()[1]')
print(txt1)

我想知道如何解析包含相同字符串的文件。和哪个在同一个目录中。請告訴我。.

解决方案

string = open('file_with_string.html', 'r').read()
doc = lxml.html.document_fromstring(string)

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow