关于拼写检查器的文献?

| 我想知道是否有很多关于如何实现拼写检查器的文献。我可以找到一个示例,这是Peter Norvig \的“如何编写拼写校正器”-http://norvig.com/spell-correct.html非常不现实。 我感兴趣的几件事是: 无需借助字典即可构建拼写检查器(通过使用现有语料库,N-gram转储,例如Google NGram转储)。 上下文拼写检查。     
已邀请:
        这是经典论文:Church&Gale(1991)。关于上下文敏感的错误校正的工作很少,但是可能值得研究的两篇论文是Golding(1995)和Carlson&Fette(2007)。     
        从下面的链接引用 它是如何工作的? 基本模型 基本技术的工作原理如下:将搜索引擎提供访问权限的文档添加到搜索索引和语言模型中。语言模型存储可见短语并维护有关它们的统计信息。提交查询后,src / QuerySpellCheck.java类将查找可能的字符编辑,即替换,插入,替换,换位和删除,使查询更适合于lanaguage模型。因此,如果您输入\'Gretski \'作为查询,并且基础数据是来自rec.sport.hockey的数据,则语言模型将与经过轻微编辑的\'Gretzky \'更为熟悉,并建议将其作为替代方案。 领域敏感性 与基于字典的拼写检查相比,此方法的最大优势在于更正是由搜索索引中的数据推动的。因此,“ trt”在法律领域将被纠正为“ tort”,在烹饪领域将被纠正为“ tart”,而在生物信息学领域将被纠正为“ TRt”。在Google上,没有建议的更正,大概是因为网域“ trt.com”,色萨利广播电视台以及Turkiye Radyo Televizyon(又名TRT等)。 上下文相关的校正 Yahoo和Google都执行上下文相关的更正。例如,查询frod(来自德语的旧英语术语,意思是“明智”或“经验丰富”)建议对福特(汽车公司等)进行更正,而查询frod baggins具有更正的查询frodo baggins(20世纪英语)虚构人物)。这就是Yahoo的行为。 Google不会纠正欺诈行为,尽管它的点击率约为785,而Frodo Baggins则为82万。另一方面,Google会更正frdo和frdo baggins。亚马逊的行为与此类似,但MSN会将frd baggins纠正为ford baggins,而不是frodo baggins。 LingPipe的模型完全支持这种上下文相关的校正。 阅读这个很棒的教程     

要回复问题请先登录注册