python codificando json com 'æøå'
Pergunta
Estou tentando recuperar coordenadas de uma API, mas um dos objetos json contém letras dinamarquesas e continuo recebendo um erro.Isto é o que eu tenho:
# -*- coding: utf-8 -*-
import urllib2
import json
import codecs
url='http://geo.oiorest.dk/adresser.json?postnr=1577&vejnavn=bernstorffsgade&husnr=16'
addressline = "%s, %s"
try:
data = urllib2.urlopen(url).read().decode('utf-8')
adresser = json.loads(data, encoding='utf-8')
for adresse in adresser:
print addressline % \
(adresse['etrs89koordinat']['øst'],
adresse['etrs89koordinat']['nord'])
except urllib2.HTTPError, e:
print "HTTP error: %d" % e.code
except urllib2.URLError, e:
print "Network error: %s" % e.reason.args[1]
O erro que recebo:
KeyError: '\xc3\xb8st'
Solução
Seus dados decodificados contêm strings Unicode, então você precisa pesquisar usando strings Unicode:
print addressline % \
(adresse[u'etrs89koordinat'][u'øst'],
adresse[u'etrs89koordinat'][u'nord'])
(Você pode achar que funciona para strings que contêm apenas caracteres não acentuados, quer você use strings Unicode ou não, devido à conversão automática entre Unicode e sua codificação padrão, mas isso não funcionará para caracteres acentuados.)
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow