鉴于这样的文字:

“朋友是友好友善是友好和分类友好分类的类。如花花流经继花流动”

我需要应用所产生的文本,以实现以下结果:

frequency("following")                = 1
frequency("flow")                     = 2
frequency("classification")           = 1
frequency("class")                    = 1
frequency("flower")                   = 3
frequency("friend")                   = 4
frequency("friendly")                 = 4
frequency("classes")                  = 1

由于我们使用FAST搜索引擎接口。 FAST索引内容,提供相关的搜索结果的查询。索引的一个方面,所产生和我们需要使用C#或红宝石来解决这个问题。

将不胜感激任何人的最佳办法的意见

有帮助吗?

解决方案

    public StemmingProcessorResults ProcessText(string text)
    {
            return new StemmingProcessorResults(
                    new []{
                        new StemmingProcessorResultItem("following", 1),
                        new StemmingProcessorResultItem("flow", 2),
                        new StemmingProcessorResultItem("classification", 1),
                        new StemmingProcessorResultItem("class", 1),
                        new StemmingProcessorResultItem("flower", 3),
                        new StemmingProcessorResultItem("friend", 4),
                        new StemmingProcessorResultItem("friendly", 4),
                        new StemmingProcessorResultItem("classes", 1)
                    }
                );
    }

有你走了,这应该是最适合你的复制粘贴需要

其他提示

您不能“应用词干法”的文本得到这些结果,因为验收标准包含一个错误。即频率(“朋友”)应为5每一个的词干算法通过定义不能产生验收标准。因此任何算法给出的那些值将不得不做 - 按照罗布阿什顿。你也可以使用一个switch语句或字典查找,什么,它只是需要输出这些数字。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top