指数而派生出的工序文在C#或Ruby
题
鉴于这样的文字:
“朋友是友好友善是友好和分类友好分类的类。如花花流经继花流动”
我需要应用所产生的文本,以实现以下结果:
frequency("following") = 1
frequency("flow") = 2
frequency("classification") = 1
frequency("class") = 1
frequency("flower") = 3
frequency("friend") = 4
frequency("friendly") = 4
frequency("classes") = 1
由于我们使用FAST搜索引擎接口。 FAST索引内容,提供相关的搜索结果的查询。索引的一个方面,所产生和我们需要使用C#或红宝石来解决这个问题。
将不胜感激任何人的最佳办法的意见
解决方案
public StemmingProcessorResults ProcessText(string text)
{
return new StemmingProcessorResults(
new []{
new StemmingProcessorResultItem("following", 1),
new StemmingProcessorResultItem("flow", 2),
new StemmingProcessorResultItem("classification", 1),
new StemmingProcessorResultItem("class", 1),
new StemmingProcessorResultItem("flower", 3),
new StemmingProcessorResultItem("friend", 4),
new StemmingProcessorResultItem("friendly", 4),
new StemmingProcessorResultItem("classes", 1)
}
);
}
有你走了,这应该是最适合你的复制粘贴需要
其他提示
您不能“应用词干法”的文本得到这些结果,因为验收标准包含一个错误。即频率(“朋友”)应为5每一个的词干强>算法通过定义不能产生验收标准。因此任何算法给出的那些值将不得不做 - 按照罗布阿什顿。你也可以使用一个switch语句或字典查找,什么,它只是需要输出这些数字。
不隶属于 StackOverflow