Pergunta

Estou tentando recuperar coordenadas de uma API, mas um dos objetos json contém letras dinamarquesas e continuo recebendo um erro.Isto é o que eu tenho:

# -*- coding: utf-8 -*-
import urllib2
import json
import codecs

url='http://geo.oiorest.dk/adresser.json?postnr=1577&vejnavn=bernstorffsgade&husnr=16'

addressline = "%s, %s"

try:
    data = urllib2.urlopen(url).read().decode('utf-8')
    adresser = json.loads(data, encoding='utf-8')

    for adresse in adresser:
        print addressline % \
            (adresse['etrs89koordinat']['øst'],
             adresse['etrs89koordinat']['nord'])

except urllib2.HTTPError, e:
    print "HTTP error: %d" % e.code
except urllib2.URLError, e:
    print "Network error: %s" % e.reason.args[1]

O erro que recebo:

KeyError: '\xc3\xb8st'
Foi útil?

Solução

Seus dados decodificados contêm strings Unicode, então você precisa pesquisar usando strings Unicode:

print addressline % \
    (adresse[u'etrs89koordinat'][u'øst'],
     adresse[u'etrs89koordinat'][u'nord'])

(Você pode achar que funciona para strings que contêm apenas caracteres não acentuados, quer você use strings Unicode ou não, devido à conversão automática entre Unicode e sua codificação padrão, mas isso não funcionará para caracteres acentuados.)

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top