全文搜索引擎,例如F#?
-
02-07-2019 - |
题
是否有任何良好的实例(网站或书)围绕如何建立一个全文搜索引擎在F#?
解决方案
你想要写你自己吗?或者你只是需要的功能?
如果你需要的功能、一个嵌入的/内存数据库全文搜索的支持可做的伎俩。由于它的。净,我建议 源码ADO.Net 供应商 作为开放源代码的竞争者。这真的很好(支助皇宫之前的任何其他供应商,设计时的支助,等等), 和FTS支持下的非常积极的发展。我认为是谷歌的工作。还有 VistaDB数据库.我使用的,主要是现在。它应该有FTS支持。完全。净,给它一些一体化的优点。
如果你必须自己做检查-出的书籍 信息检索.我读过一些,但什么都不知道这代表了从人群。亚马逊可能会帮助那里。
其他提示
我用F#编写了一个搜索引擎 代码您可以在我的海报中阅读相关内容 并访问
中的完整实现基本思想如下面的代码所示,但实际上需要比代码本身更多的解释。这些也可以在我的网站上找到。
此代码在磁盘上创建文档集合的索引。 索引在外部存储器中完成。
1. let create_postings in_name tmp_dir out_name = 2. let process_doc (doc_id, doc_text) = 3. doc_text |> tokenize |> stopword |> stem 4a. |> List.count 4b. |> ListExt.map(fun (word, tf) -> (word, (doc_id, tf)) 5. in_name 6. |> as_lines 7. |> Seq.map_concat extract_docs 8. |> Seq.map_concat process_doc 9a. |> External.group_by (fun (w, _) -> w) 9b. (fun (_, docid_and_tf) -> docid_and_tf) 9c. (fun lst -> (List.length lst, lst)) 9d. tmp_dir 9e. (External.ElemDesc()) 10. |> output out_name
不隶属于 StackOverflow