Azure Tableストレージで無料のテキスト検索を行うにはどうすればよいですか？

https://stackoverflow.com/questions/3884864

28-09-2019
|

質問

顧客ごとに最大数のTUSANDS「行」を備えたAzureテーブルストレージを備えたソリューションがあります（パーティションキー）。

稲妻の高速無料テキスト検索を最適に行うにはどうすればよいですか？

データの性質上、ホールワード検索を行うことはできません（たとえば、「Zur」の検索は「Azure」に一致するはずです）。

解決

これを見つけただけで、それはあなたを助けるかもしれません：ルーセンのアズールライブラリ

他のヒント

当社のサイトでは、次の生産で以下を使用しています。 http://websolr.com 現在、ベータ版にある新しいAzure分散キャッシュ機能を使用して結果をキャッシュします。これにより、Websolr.comが実行されるAmazon DataCenterとAzure Datacenterの間の最初の検索要求で最悪のケースが200ミリ秒の遅延が得られ、すべてのキャッシュされた検索で平均6〜10ミリ秒が与えられます。また、一般的な検索テキストフラグメントを記録し、キャッシュに新鮮に保つようにします。

現時点では、これについては箱から出していないソリューションはありません。おそらく、全文検索機能がPDC10で発表されるでしょう。

したがって、現時点では、独自のテキストインデックスソリューションをロールする必要があります。私がこれをした方法は、労働者の役割にlucene.netインデックスを構築することです。次に、WCFを使用して検索サービスを提供するワーカーロールでTCPポートを開きます。その後、Webロールはそのサービスを消費できます。これは非常にうまく機能し、非常に高速な検索サービスを提供します。

Steve MarxのPDC09ビデオがあります。 http://www.microsoftpdc.com/2009/SVC16

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow