标引引擎

| 我正在开发上下文发现系统-它是搜索和建议的组合。 目前,我正在寻找要建立索引的库。 经过一番调查,我留在了Lucene和Terrier上,发现Indri不舒服。 两者的缺点是什么?使用它们时我可以遇到什么问题? Terrier没有增量索引是真的吗(每次添加新文档时,我都需要重建所有内容并重新编制索引)? 我的要求是:  -轻松添加新文档  -简易评分方法注入  -安静清晰的模型 还有一件事:梗还是活跃吗?自2010年3月10日梗犬变更日志以来,我还没有看到任何更新     
已邀请:
您将使用哪种数据库?根据我的经验,Lucene的记录要比Terrier好得多。 这是比较Lucene和Terrier的文章: http://text-analytics.blogspot.com/2011/05/java-based-retrieval-toolkits.html     

要回复问题请先登录注册