使用python从HTML获取重音字符

https://stackoverflow.com//questions/24031148

html
python
string-decoding

21-12-2019
|

题

在网页源中，我可以看到一个单词，如：浏览器（Chrome）显示为abacà的ABAC％C3％A0。
现在，我已经使用URLLIB2下载了该页面，我正在解析使用Python（2.7上Mac OS X）的页面源以获取一些关键字：我想拥有重音字符而不是％C3％A0，但使用str.decode（“utf8”）没有工作（我尝试过那些似乎是\ xc3 \ xa0 utf8代码）。

我应该尝试在字典中添加重音字吗？

通过HTML页面没有指示源在源中的编码

感谢

解决方案

字符已被URL编码（它们是URL的一部分？），您可以使用 Urllib.unquote

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow