Pergunta

Que tipo de trabalho tem sido feito para determinar se uma seqüência específica pertence a uma localização geográfica? Por exemplo:

'troy, ny'
'austin, texas'
'hotels in las vegas, nv'

Eu acho que eu sou uma espécie de espera é uma abordagem estatística que dá um grau de confiança de que os dois primeiros são locais. O último provavelmente exigiria uma heurística que agarra "% s,% s" e, em seguida, usa a mesma técnica. Estou procurando especificamente abordagens que não dependem muito fortemente na proposição 'em', visto que não é um indicador inteiramente inequívoca ou consistentemente disponíveis de localização.

Pode alguém me aponte para abordagens, papéis, ou utilitários existentes? Obrigado!

Foi útil?

Solução

O problema que você descreve é ??muitas vezes chamado análise da consulta geográfica ou recuperação de informação mais geral geográfica.

Não foi uma tarefa recente sobre como fazer isso no CLEF 2007 ( http: //www.uni-hildesheim.de/geoclef/2007/Query-Parsing.htm ). A equipe vencedora usada uma gramática baseada em regras, que é semelhante ao que você provavelmente não quer. Outro papel nas negociações www2009 cerca GeoParser:. http://www2009.eprints.org/239/

Existem também alguns artigos sobre Geographic Information Retrieval em CIKM 2007: http: //www.geo.unizh.ch/~rsp/gir07/accepted.html

Eu não sei de qualquer software de fonte aberta que faz isso, mas pode ser empacotado em um motor de busca como o Lemur.

Outras dicas

Não é uma abordagem muito interessante tomadas por Everyblock.com que está focada em como locais são expressos em Inglês - eles basicamente usar algumas expressões regulares sofisticados e extensos que estão agora open source. A sua aplicação é projetado para digitalizar através de artigos de notícias, comentários e vários feeds de dados pública e relacioná-los para locais específicos, e funciona bem. Expressões como "Um incêndio no prédio na esquina nordeste do 20 e Valencia St. em San Francisco" são geocodificados com muita precisão. Você pode estudar a fonte aqui . A parte especial que você provavelmente quer é ebpub/ebpub/geocoder/base.py, localizado no download ebpub, e tudo em torno dele, por exemplo, começando com a classe SmartGeocoder e para trás de trabalho.

Um link para ajuda: geonames.org procurar :

retorna os nomes encontrados para o searchterm como XML ou documento JSON

Exemplo: http://ws.geonames.org/search? q = troy,% 20ny & maxRows = 10

Estou construindo uma geoparser livre em geocode.xyz

(atualmente suporta cerca de 50 países europeus, que em breve oferecem cobertura global)

A aplicação de exemplo de geoparsing podem ser encontradas no OpenWikiMap

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top