如何使用kd-tree确定字符串相似度?

| 我试图利用k最近邻解决字符串相似性问题,即给定一个字符串和一个知识库,我想输出与给定字符串相似的k个字符串。是否有任何教程可以解释如何利用kd树有效地进行k最近邻查找字符串?字符串长度不能超过20个字符。     
已邀请:
大约一年前我读过的最热门的博客文章之一:Levenstein Automata。看看那篇文章。它不仅提供了算法描述,而且提供了后续代码。从技术上讲,它不是一棵kd树,但它与在现实世界中可能遇到/使用的字符串匹配和字典校正算法非常相关。 他还有另一篇有关BK树的博文,它更擅长于对字符串进行模糊匹配,并在出现拼写错误的地方查找字符串。这是另一个包含BK树源代码的资源(我无法验证其准确性或正确的实现。)     

要回复问题请先登录注册