你知道匹配两个字符串,任何良好的算法,然后在这两个字符串百分之多少匹配返回一个比例?

以及是否有一些与数据库也工作?

有帮助吗?

解决方案

href="http://en.wikipedia.org/wiki/Levenshtein_distance" rel="noreferrer">编辑距离的

但我知道肯定更加简化的算法名为探测法是在一些数据库支持系统

其他提示

它取决于你的标准相似性。其他人已经提到您编辑距离(编辑距离是一样的东西)。这通常是相当不错的,而且肯定更独立于语言的比类似的同音。但是,要知道,莱文施泰因差异不处理换位很好。因此:

Levenstein("copy", "cpoy") == 2

如果你要处理的人力投入,换位是相当普遍的。这是否是一个问题或不取决于你的指标相似。

这已经有一段时间,但我相信PostgreSQL有levenstein()无论是内置或可作为contrib C模块中。

我认为你正在寻找的问题被称为编辑距离。它是计算一般的贵,但如果你正在寻找其他字符串的小编辑距离中的字符串,它并没有那么糟糕。有维基百科文章中的更多信息。

如何最好地匹配两个字符串?让他们出去喝杯咖啡,如果他们一拍即合,吃饭,看电影。或者他们可以做一些对编程?它依赖于字符串,真的。甚至经常咖啡可以是棘手。

这会有所帮助?我只是跑了进去。 比较两个字符串产生一个数字增量

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top