我有一个带有Azure表存储的解决方案,每个客户最多有一些Tusands“行”(分区密钥)。

我如何最好地进行快速免费文本搜索?

由于数据的性质,我无法进行孔单词搜索(例如,搜索“ Zur”应该匹配“ Azure”)。

有帮助吗?

解决方案

只是发现了可能对您有所帮助的此事: 卢克内的Azure图书馆

其他提示

我们正在为我们的网站使用以下生产:我们运行托管的Solr(基于Lucene)实例 http://websolr.com 并使用当前在beta中的新Azure分布式缓存功能缓存结果。这为我们提供了最糟糕的情况,即在Amazon Datacenter之间的初始搜索请求中,Websolr.com运行和Azure Datacenter之间的初始搜索请求和所有缓存搜索的平均为6-10 ms。我们还记录了常见的搜索文本片段,并尝试将它们保持在缓存中。

目前,没有开箱即用的解决方案。也许将在PDC10宣布全文搜索功能。

因此,目前您需要滚动自己的文本索引解决方案。我这样做的方式是在工人角色上构建Lucene.net索引。然后,我在该工人角色上打开一个TCP端口,该端口使用WCF提供搜索服务。然后,任何网络角色都可以消耗该服务。这确实很好,并提供了非常快速的搜索服务。

史蒂夫·马克思(Steve Marx)有一个PDC09视频,可提供更多信息: http://www.microsoftpdc.com/2009/svc16

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top