基于编辑距离的javascript文本相似度百分比算法

javascript text similarity algorithm in percentage based on edit distance

本文关键字:相似 百分比 算法 文本 javascript 编辑距离      更新时间:2023-11-07

我已经知道很多javascript中的编辑距离算法实现,但我想根据它来计算文本的百分比相似度。有人知道如何实现吗?

您必须找到长度为n的字符串和长度为m的字符串之间的最大可能距离。例如,如果该最大距离为n + m,则百分比将为

100 - 100 * edit_distance(a, b) / (a.length + b.length)

例如,如果您使用Levenstein距离,其中每次插入、替换和删除都要花费1,那么这个最大可能距离是max(n, m),因此百分比将是

100 - 100 * Levenshtein(a, b) / Math.max(a.length, b.length)