문제

다음 코드는 문자열을 구문 분석합니다.

import lxml.html

doc = lxml.html.document_fromstring("""<html>
 <body>
   <span class="simple_text">One</span> tehfghhxt</br>
   <span class="cyrillic_text">Второй</span> cyrcyrcyr</br>
 </body>
</html>
""")

txt1 = doc.xpath('/html/body/span[@class="simple_text"]/text()[1]')
print(txt1)

동일한 문자열이 포함된 파일을 구문 분석하는 방법을 알고 싶습니다.그리고 같은 디렉토리에 있습니다.말해주세요.

도움이 되었습니까?

해결책

string = open('file_with_string.html', 'r').read()
doc = lxml.html.document_fromstring(string)
라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top