Быть акцентированными символами из HTML с Python
-
21-12-2019 - |
Вопрос
В источнике веб-страницы Я могу видеть слово, как: ABAC% C3% A0, что браузер (Chrome) показывает как abacà.
Теперь я скачал страницу, используя URLLIB2, и я разбираю источник страницы с Python (2.7 на Mac OS X), чтобы получить несколько ключевых слов: я хотел бы иметь акцентируемый символ вместо% C3% A0, но используя STR.DeCode(«UTF8») не работал (я попробовал, так как те, которые казались кодами \ xc3 \ xa0 utf8).
Что я должен попытаться добавить бываемое слово в словаре?
Кстати, страница HTML не имеет индикации кодирования в источнике
Спасибо
Решение
Персонажи были закодированы URL (являются ли они частью URL?), которые вы можете отменить с помощью Urllib.unquote .
Не связан с StackOverflow