之类的标题,如何比较文本?对于例如,转到textdiff.com。

有帮助吗?

解决方案

查核 Levenshtein距离。这是用于识别两个字符串之间的差异相当通用算法。

其他提示

您可能想看看梨的Text_Diff

http://pear.php.net/package/Text_Diff/

如果你正在寻找一个终端命令,检查缩小分差,在linux中默认。你也可以有它通过安装cygwin的[与行李超重了很多窗户。 :\]

我建议的Jaccard的相似性系数。处理每个句子作为一个单元。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top