Вопрос

В источнике веб-страницы Я могу видеть слово, как: ABAC% C3% A0, что браузер (Chrome) показывает как abacà.
Теперь я скачал страницу, используя URLLIB2, и я разбираю источник страницы с Python (2.7 на Mac OS X), чтобы получить несколько ключевых слов: я хотел бы иметь акцентируемый символ вместо% C3% A0, но используя STR.DeCode(«UTF8») не работал (я попробовал, так как те, которые казались кодами \ xc3 \ xa0 utf8).

Что я должен попытаться добавить бываемое слово в словаре?

Кстати, страница HTML не имеет индикации кодирования в источнике

Спасибо

Это было полезно?

Решение

Персонажи были закодированы URL (являются ли они частью URL?), которые вы можете отменить с помощью Urllib.unquote .

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top