使用Solr

将带有页码的PDF编入索引 我正在使用ExtractingRequestHandler为Solr索引PDF。我想显示页码以及文档中的匹配,例如“在第2,3和5页的
bar.pdf
中找到了术语
foo
” 是否可以在查询结果中包含页码?     
已邀请:
这需要一些开发工作,但您可以通过将每个文档的每个页面索引为单独的Solr文档来实现此目的,然后使用字段折叠来为每个文档分组不同的页面命中。 请注意,您需要每晚一次,在任何当前发布的Solr版本中都没有实现字段折叠。 另请注意:字段折叠在版本Solr 3.3中实现。预计下一个大版本会有更多更新(Solr 4.0)     

要回复问题请先登录注册