如何获得Lucene Fuzzy Search结果的匹配项？

| 使用Lucene模糊搜索时如何获得匹配的模糊项及其偏移量？

    IndexSearcher mem = ....(some standard code)

    QueryParser parser = new QueryParser(Version.LUCENE_30, CONTENT_FIELD, analyzer);

    TopDocs topDocs = mem.search(parser.parse(\"wuzzy~\"), 1);
    // the ~ triggers the fuzzy search as per \"Lucene In Action\"

模糊搜索工作正常。如果文档包含术语“模糊”或“模糊”，则将其匹配。如何获得匹配的术语以及它们的抵消量？我确保所有CONTENT_FIELDs都添加了带有位置和偏移量的termVectorStored。

已邀请:

1 个回复

闪脖

没有做到这一点的直接方法，但是我重新考虑了Jared的建议，并且能够使解决方案生效。我在这里记录是为了防止其他人遇到相同的问题。创建一个实现ѭ1的类

public class HitPositionCollector implements Formatter
{
    // MatchOffset is a simple DTO
    private List<MatchOffset> matchList;
    public HitPositionCollector(
    {
        matchList = new ArrayList<MatchOffset>();
    }

    // this ie where the term start and end offset as well as the actual term is captured
    @Override
    public String highlightTerm(String originalText, TokenGroup tokenGroup)
    {
        if (tokenGroup.getTotalScore() <= 0)
        {
        }
        else
        {
            MatchOffset mo= new MatchOffset(tokenGroup.getToken(0).toString(), tokenGroup.getStartOffset(),tokenGroup.getEndOffset());
            getMatchList().add(mo);
        }

        return originalText;
    }

    /**
    * @return the matchList
    */
    public List<MatchOffset> getMatchList()
    {
        return matchList;
    }
}

主要代号

public void testHitsWithHitPositionCollector() throws Exception
{
    System.out.println(\" .... testHitsWithHitPositionCollector\");
    String fuzzyStr = \"bro*\";

    QueryParser parser = new QueryParser(Version.LUCENE_30, \"f\", analyzer);
    Query fzyQry = parser.parse(fuzzyStr);
    TopDocs hits = searcher.search(fzyQry, 10);

    QueryScorer scorer = new QueryScorer(fzyQry, \"f\");

    HitPositionCollector myFormatter= new HitPositionCollector();

    //Highlighter(Formatter formatter, Scorer fragmentScorer)
    Highlighter highlighter = new Highlighter(myFormatter,scorer);
    highlighter.setTextFragmenter(
        new SimpleSpanFragmenter(scorer)
    );

    Analyzer analyzer2 = new SimpleAnalyzer();

    int loopIndex=0;
    //for (ScoreDoc sd : hits.scoreDocs) {
        Document doc = searcher.doc( hits.scoreDocs[0].doc);
        String title = doc.get(\"f\");

        TokenStream stream = TokenSources.getAnyTokenStream(searcher.getIndexReader(),
                                    hits.scoreDocs[0].doc,
                                    \"f\",
                                    doc,
                                    analyzer2);

        String fragment = highlighter.getBestFragment(stream, title);

        System.out.println(fragment);
        assertEquals(\"the quick brown fox jumps over the lazy dog\", fragment);
        MatchOffset mo= myFormatter.getMatchList().get(loopIndex++);

        assertTrue(mo.getEndPos()==15);
        assertTrue(mo.getStartPos()==10);
        assertTrue(mo.getToken().equals(\"brown\"));
}

要回复问题请先登录或注册

如何获得Lucene Fuzzy Search结果的匹配项？

1 个回复

发起人

java

lucene

fuzzy_search

问题状态

如何获得Lucene Fuzzy Search结果的匹配项？

与内容相关的链接

1 个回复

发起人

java

lucene

fuzzy_search

问题状态