使用Lucene作为反向索引

Lucene具有很强的增量索引功能。从头开始开发IR系统通常是一种痛苦。 我想知道我是否可以使用低级Lucene API仅将其用作反向索引,即反转列表,位置信息,术语频率,idfs,字段存储等的存储... 最重要的是,我想实现自己的权重和文件评分。我知道
Similarity
课,但它没有给我想要的灵活性。     
已邀请:
您当然可以创建自己的查询类,以及您自己的记分员等。您可能遇到的唯一问题是您是否需要全局数据。 (例如,在tf / idf中你需要知道,术语freq和逆doc freq。)如果你的评分算法需要一些其他的跨文档或跨期元数据,你可能会遇到麻烦,因为没有这是我知道存储这个的好方法。 但基本上,只要你的算法模糊tf / idf或仅按文件工作,我认为你应该没问题。     

要回复问题请先登录注册