比较不同语言的短字符串以获得相似的声音-Soundex是答案吗?
|
对于一种用一种语言编写的字符串与另一种用另一种语言编写的字符串,我如何获得声音相似度“评级”:即一种可以识别该字符串的算法
\“ David Letterman \”和\“דודלטרמן\”是听起来相似的字符串。
-哦,是的,上面是希伯来语,您猜对了:“ David Letterman”,它的发音/口语与英语几乎相同。
我唯一拥有的原材料是各自语言的unicode字符串。
也就是说,我没有音素或字符串的音译/译文。
我已经实现了Soundex实现调整类的东西,效果一般。这是要走的路吗?
没有找到相关结果
已邀请:
3 个回复
凄挡
磐剩
量华