質問

スプレッドシートに入力されたExcelの名前と住所のセットがありますが、問題はアドレスを入力した多くの人々が多くの異なる非標準形式で入力したことです。すべてのアドレスをデータベースに転送する前に、アドレスをスクラブします。見てみると、アドレススクラバー(パーサーまたはフォーマッター)の方法で実際に見つけたのは、 Semaphore 。私の目的のために、私はそのすべてを本当に必要としません、そして、私はソフトウェアのライセンス料を払いたくありません。私のためにスクラブを行う無料および/またはオープンソースの何かがそこにありますか?

役に立ちましたか?

解決

私は郵便事業に携わっているので...

郵送可能な住所はジオコーディングではありません。 1つはUSPSからのメールの配信を許可し、もう1つはそのポイントが地球上のどこにあるかを通知します。 USPSは、郵送可能な住所をジオコーディングしません。ターゲティングのために人々のエリア/地域をマークするのに役立ちます。

ソフトウェアのライセンスを購入するのではなく、データを購入するのです。郵便局には、特に商業的にこれを行っており、ファーストクラスよりも良いレートを取得しようとしている場合、多くのルールがあります。ルールの完全なリストについては、 USPS国内メールマニュアルをご覧ください。 USPSは、ジップと世帯を常にジップ間で移動します。会社(私が働いています)は、更新されたメーリングリストのUSPSに支払います。これにより、DBを最新の状態に保つことができます。毎週。

質問に戻ります。データを一般的な形式(street-> st)に変更しますか、それとも重複を探して実際のメール可能なアドレスのみを保存しますか?

一般的な形式の場合。アドレスを断片に分割し、空白をクリーンアップして、用語/翻訳の辞書を適用できます。次に、いくつかのSQLを適用して重複を見つけます。世帯(1つのメインストリート)は人(ジョンドゥー、1つのメインストリート)とは異なることに注意してください。

郵送可能なアドレスについては、読者(読者)の中にはこの回答が気に入らない人もいますが、情報が欲しいので無料ではありません。誰かがこれらのリストを取得して維持するために時間またはお金を費やしています。だから、リストのための資金を獲得するビジネスモデルを見つけるか、あなたのためにそれをする誰かに行く。 データとメールの管理

現実的には、セマフォは非常に安価です。アドレスdbは四半期ごとに更新する必要があることに注意してください四半期あたり19ドルはかなり安いです。

別のアドレススクラビング製品。 SAP PostalSoft 。ただし、データにかかる費用はわかりません。

他のヒント

私は実際に住所確認業界で働いています... Jimの答えは賢明な受け入れです。残念ながら、低予算の私たちにとって、公式のUSPSデータは高価であり、システムは複雑です。 (私が経験しているのは、私が働いている会社 SmartyStreets が、ほとんどの場合よりも低いレートで住所確認を提供しているためです。)

ここでできる限りの最善策は、LiveAddressなどの低コスト/無料の代替手段(ボリュームに応じて)を推奨することです。ここでは、アドレスのリストには最小購入はなく、APIは超安価で最高です-簡単、比較的。

これを行うために私が協力したソフトウェアのほとんどは非常に高価です(または、言い換えると、マーケティング部門は素朴で膨大な予算を持っています)。

この種の作業は、ジオコーディングの前兆です。このリンクされたWiki記事には、Geocodingソフトウェアのリストが含まれており、その一部は無料です。運がよければ、無料のものの中にはアドレス標準化ルーチンが含まれている場合があります。

良いものを見つけたら、教えてください。

Accuzipを使用します。ほとんどのソリューションよりもずっと安く(年間700ドル)、隔月の更新が付属しています。 .NETラッパーを作成したUSPSアドレス標準化APIを使用します。これにより、リアルタイムで実行できます(デフォルトでは、Accuzipにはバッチモードのみが付属しています)。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top