是否有任何良好的实例(网站或书)围绕如何建立一个全文搜索引擎在F#?

有帮助吗?

解决方案

你想要写你自己吗?或者你只是需要的功能?

如果你需要的功能、一个嵌入的/内存数据库全文搜索的支持可做的伎俩。由于它的。净,我建议 源码ADO.Net 供应商 作为开放源代码的竞争者。这真的很好(支助皇宫之前的任何其他供应商,设计时的支助,等等), 和FTS支持下的非常积极的发展。我认为是谷歌的工作。还有 VistaDB数据库.我使用的,主要是现在。它应该有FTS支持。完全。净,给它一些一体化的优点。

如果你必须自己做检查-出的书籍 信息检索.我读过一些,但什么都不知道这代表了从人群。亚马逊可能会帮助那里。

其他提示

我用F#编写了一个搜索引擎 代码您可以在我的海报中阅读相关内容 并访问

中的完整实现

Stefan Savev的主页

基本思想如下面的代码所示,但实际上需要比代码本身更多的解释。这些也可以在我的网站上找到。

此代码在磁盘上创建文档集合的索引。 索引在外部存储器中完成。

1.   let create_postings in_name tmp_dir out_name =
2.     let process_doc (doc_id, doc_text) = 
3.         doc_text |> tokenize |> stopword |> stem 
4a.        |> List.count
4b.        |> ListExt.map(fun (word, tf) -> (word, (doc_id, tf)) 
5.     in_name 
6.     |> as_lines
7.     |> Seq.map_concat extract_docs 
8.     |> Seq.map_concat process_doc
9a.    |> External.group_by (fun (w, _) -> w) 
9b.       (fun (_, docid_and_tf) -> docid_and_tf) 
9c.       (fun lst -> (List.length lst, lst)) 
9d.       tmp_dir
9e.       (External.ElemDesc())
10.    |> output out_name
许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top