有人能指出我的内容相关性算法吗?

我的办公桌上出现了一个有一些有趣要求的新项目。我需要开发一个可搜索的企业目录,重点是根据任意搜索查询提供相关结果。这些企业可以是任何利基市场;没有一个区域比另一个区域更具代表性。 当谷歌搜索“搜索算法”或“内容相关性算法”之类的东西时,我得到的只是谷歌的“旧神的神秘算法”和SEO公司。 MySQL的全文
Match()
函数的相关性值是否具有该任务所需的内容?我从来没有用过它,但我肯定会做一些测试。此外,由于这将主要是人工编辑的目录,我可以假设我们可以添加标记和类别等加权因子。将这些因素与MySQL的
Match()
相关性结合起来的好方法是什么? 我也对这里没有讨论的想法持开放态度。     
已邀请:
对于基于信息检索的技术的示例,查找TF-IDF或BM25。 对于基于机器学习的技术,从MSR中查找RankNet及其变体。     
如果您有手工编辑的数据,请查看Oracle文本搜索。在我之前的一个项目中,我们取得了一些不错的成绩。 我没有直接参与数据库设置,但我知道结果非常受欢迎。 (在此之前他们只有基于关键字的搜索)。     
使用像Solr这样的搜索引擎来索引数据。您仍然可以使用MySql来保存数据,但搜索使用搜索引擎。     

要回复问题请先登录注册