Puxando endereços internacionais / números de telefone a partir de texto de forma livre

StackOverflow https://stackoverflow.com/questions/899842

  •  23-08-2019
  •  | 
  •  

Pergunta

Ei, pessoal. Eu estou procurando algumas expressões regulares para endereços de rua ajuda de apoio e números de telefone de texto de forma livre (a la Gmail).

Dado algum texto: "John, I went to the store today, and it was awesome! Did you hear that they moved to 500 Green St.? ... Give me a call at +14252425424 when you get a chance."

Eu gostaria de ser capaz de puxar para fora:

500 Green St. (reconhecido como um endereço)

+14252425424 (reconhecido como um número de telefone)

O que torna este problema mais fácil é que eu não me importo sobre análise de texto que é puxado para fora. Ou seja, eu não me importo que Green é o nome da estrada ou que 425 é o código de área. Eu só quero cordas garra que "olhar como" endereços ou números de telefone.

Infelizmente, este precisa de trabalho internacionalmente, da melhor forma possível.

Alguém tem alguma pista? Obrigado!

Foi útil?

Solução

Os números de telefone, desde que você tem uma lista de todos os códigos de país e formatos de número é fácil, endereços de rua eu não tenho idéia, o único conselho que posso dar é para validar cada conjunto de palavras @ addressdoctor.com

Outras dicas

Você pode dar RecogniContact (-> address-parser.com ) uma tentativa, ele reconhece ambos os endereços postais e números de telefone.

Dê uma olhada Capítulo 7 do Dive Into Python . Ela toca ambos os números de telefone e endereços. Eu acredito que você pode usar isso como um ponto de partida. A parte internacional parece difícil. Eu sugiro que você construir um primeiro rascunho, experimentá-lo em várias localidades, iterate e melhorar.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top