Domanda

Ho dati geografici con 14 variabili. I dati sono nel seguente formato:

  

QUADNAME: rockport_colony_SD RISOLUZIONE: 10 ULLAT: 43.625
  ULLON: -97.87527466 LRLAT: 43.5
  LRLON: -97.75027466 HDATUM: 27
  ZMIN: 361.58401489 ZMAX:   413.38400269 ZMEAN: 396.1293335 ZSIGMA: 12.36359215 PMETHOD: 5
  QUADDATE: 20001001

L'intero dato ha molte variabili precedenti nella sequenza.

Come posso estrarre le coordinate ULLAT, ULLON e LRLAT dai dati in tre elenchi, in modo che ciascuna riga corrisponda a una posizione?

Questa domanda è stata sollevata dal problema in il post .

È stato utile?

Soluzione

Qualcosa del genere potrebbe funzionare se i dati sono tutti in un grande file di testo semplice:

import re

data = """
QUADNAME: rockport_colony_SD RESOLUTION: 10 ULLAT: 43.625
ULLON: -97.87527466 LRLAT: 43.5
LRLON: -97.75027466 HDATUM: 27
ZMIN: 361.58401489 ZMAX: 413.38400269 ZMEAN: 396.1293335 ZSIGMA: 12.36359215 PMETHOD: 5
QUADDATE: 20001001
"""

regex = re.compile(
    r"""ULLAT:\ (?P<ullat>-?[\d.]+).*?
    ULLON:\ (?P<ullon>-?[\d.]+).*?
    LRLAT:\ (?P<lrlat>-?[\d.]+)""", re.DOTALL|re.VERBOSE)

print regex.findall(data) # Yields: [('43.625', '-97.87527466', '43.5')]

Altri suggerimenti

Dato un StreamReader , questo dovrebbe darti un elenco di (float, float, float). Suggerisco un elenco di 3 tuple perché probabilmente sarà più conveniente e più efficiente attraversarlo, a meno che per qualche motivo non si desideri ottenere tutti i punti singolarmente.

coords = []
reader
while line=reader.readline():

  index_ullat = line.find("ULLAT")
  if index_ullat >= 0:
    ullat = float(line[ index_ULLAT+7 : ])

    line = reader.readline()

    index_ullon = line.find("ULLON")
    index_lrlat = line.find("LRLAT")
    if index_ullon >= 0 and index_lrlat >= 0:
      ullon = float(line[ index_ullon+7 : index_lrlat-1 ])
      lrlat = float(line[ index_lrlat+7 : ])
    else:
      raise InputError, "ULLON and LRLAT didn't follow ULLAT."

    coords.append(ullat, ullon, lrlat)

Potrebbe funzionare, ma è brutto. Non sono un esperto dell'analisi delle stringhe.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top