Pregunta

Tengo un conjunto de nombres y direcciones que se han ingresado y una hoja de cálculo de Excel, pero el problema es que muchas personas que ingresaron las direcciones las ingresaron en muchos formatos diferentes no estándar. Quiero restregar las direcciones antes de transferirlas todas a mi base de datos. Mirando a mi alrededor, todo lo que realmente encontré en el camino de los depuradores de direcciones (analizadores o formateadores) es el que publica Semaphore . Para mis propósitos, realmente no necesito todo eso y no quiero pagar las tarifas de licencia del software. ¿Hay algo por ahí que sea gratuito y / o de código abierto que haga el fregado por mí?

¿Fue útil?

Solución

Como trabajo en el negocio de correo ...

Una dirección de correo no es geocodificación. Uno permite que USPS entregue el correo y el otro le dice dónde demonios está ese punto. El USPS no codifica geográficamente sus direcciones de correo. Es útil para marcar áreas / regiones de personas para la orientación.

No está comprando una licencia para el software, está comprando los datos. La oficina de correos tiene muchas reglas, especialmente si está haciendo esto comercialmente y tratando de obtener una tarifa mejor que la de primera clase. Consulte Manual de correo nacional de USPS para obtener una lista completa de las reglas. El USPS mueve las cremalleras y los hogares entre las cremalleras todo el tiempo. La empresa (para la que trabajo) paga a USPS por su lista de correo actualizada para que podamos mantener nuestras bases de datos actualizadas. Semanal.

Volver a su pregunta. ¿Desea cambiar los datos a un formato común (street - > st) o está buscando duplicados y solo quiere almacenar direcciones reales de correo?

para formato común; puede dividir la dirección en pedazos, limpiar el espacio en blanco y aplicar un diccionario de términos / traducciones. Luego aplique algunos sql para encontrar los duplicados. Tenga en cuenta que los hogares (1 calle principal) son diferentes de las personas (john doe, 1 calle principal).

para las direcciones que se pueden enviar por correo, a algunos de ustedes (los lectores) no les gustará esta respuesta, pero quieren información y eso no es gratis. Alguien gasta tiempo o dinero para adquirir y mantener estas listas. Por lo tanto, busque un modelo de negocio para adquirir fondos para la lista o diríjase a alguien que lo haga por usted. Gestión de datos y correo

Siendo realistas, Semaphore es bastante barato, solo tenga en cuenta que la dirección db deberá actualizarse trimestralmente y $ 19 / trimestre es bastante barato.

Otro producto de limpieza de direcciones. SAP PostalSoft . Sin embargo, no sé cuánto costarán los datos.

Otros consejos

Realmente trabajo en la industria de verificación de direcciones ... La respuesta de Jim es una aceptación inteligente. Desafortunadamente para aquellos de nosotros con presupuestos bajos, los datos oficiales de USPS son caros y los sistemas son complicados. (Lo sé por experiencia, ya que la compañía para la que trabajo, SmartyStreets , proporciona verificación de direcciones a tasas más bajas que la mayoría).

Lo mejor que puedo hacer aquí para ayudar es recomendar una alternativa gratuita / de bajo costo (dependiendo de su volumen) como LiveAddress, donde para una lista de direcciones no hay compra mínima, y ??la API es súper barata y súper -fácil, comparativamente.

La mayoría del software con el que he trabajado para hacer esto es muy costoso (o dicho de otro modo, los departamentos de marketing son ingenuos y tienen presupuestos enormes).

Este tipo de trabajo es un precursor de la codificación geográfica. Este artículo de Wiki vinculado incluye una lista de software de geocodificación, algunos de los cuales son gratuitos. Si tiene suerte, algunos de los gratuitos pueden incluir rutinas de estandarización de direcciones.

Si encuentra uno bueno, avíseme.

Utilizamos Accuzip. Es mucho más barato que la mayoría de las soluciones (~ $ 700 / año) y viene con actualizaciones bimensuales. Utiliza la API de estandarización de direcciones de USPS, para la cual he escrito un contenedor .NET. Esto me permite ejecutarlo en tiempo real (Accuzip, por defecto, solo viene con un modo por lotes).

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top