如何在Azure表存储中进行免费文本搜索？

https://stackoverflow.com/questions/3884864

28-09-2019
|

题

我有一个带有Azure表存储的解决方案，每个客户最多有一些Tusands“行”（分区密钥）。

我如何最好地进行快速免费文本搜索？

由于数据的性质，我无法进行孔单词搜索（例如，搜索“ Zur”应该匹配“ Azure”）。

解决方案

只是发现了可能对您有所帮助的此事：卢克内的Azure图书馆

其他提示

我们正在为我们的网站使用以下生产：我们运行托管的Solr（基于Lucene）实例 http://websolr.com 并使用当前在beta中的新Azure分布式缓存功能缓存结果。这为我们提供了最糟糕的情况，即在Amazon Datacenter之间的初始搜索请求中，Websolr.com运行和Azure Datacenter之间的初始搜索请求和所有缓存搜索的平均为6-10 ms。我们还记录了常见的搜索文本片段，并尝试将它们保持在缓存中。

目前，没有开箱即用的解决方案。也许将在PDC10宣布全文搜索功能。

因此，目前您需要滚动自己的文本索引解决方案。我这样做的方式是在工人角色上构建Lucene.net索引。然后，我在该工人角色上打开一个TCP端口，该端口使用WCF提供搜索服务。然后，任何网络角色都可以消耗该服务。这确实很好，并提供了非常快速的搜索服务。

史蒂夫·马克思（Steve Marx）有一个PDC09视频，可提供更多信息： http://www.microsoftpdc.com/2009/svc16

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow