在网页源中,我可以看到一个单词,如:浏览器(Chrome)显示为abacà的ABAC%C3%A0。
现在,我已经使用URLLIB2下载了该页面,我正在解析使用Python(2.7上Mac OS X)的页面源以获取一些关键字:我想拥有重音字符而不是%C3%A0,但使用str.decode(“utf8”)没有工作(我尝试过那些似乎是\ xc3 \ xa0 utf8代码)。

我应该尝试在字典中添加重音字吗?

通过HTML页面没有指示源在源中的编码

感谢

有帮助吗?

解决方案

字符已被URL编码(它们是URL的一部分?),您可以使用 Urllib.unquote

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top