使用python从HTML获取重音字符
-
21-12-2019 - |
题
在网页源中,我可以看到一个单词,如:浏览器(Chrome)显示为abacà的ABAC%C3%A0。
现在,我已经使用URLLIB2下载了该页面,我正在解析使用Python(2.7上Mac OS X)的页面源以获取一些关键字:我想拥有重音字符而不是%C3%A0,但使用str.decode(“utf8”)没有工作(我尝试过那些似乎是\ xc3 \ xa0 utf8代码)。
我应该尝试在字典中添加重音字吗?
通过HTML页面没有指示源在源中的编码
感谢
解决方案
字符已被URL编码(它们是URL的一部分?),您可以使用 Urllib.unquote
不隶属于 StackOverflow