关于拼写检查器的文献？

| 我想知道是否有很多关于如何实现拼写检查器的文献。我可以找到一个示例，这是Peter Norvig \的“如何编写拼写校正器”-http://norvig.com/spell-correct.html非常不现实。我感兴趣的几件事是：无需借助字典即可构建拼写检查器（通过使用现有语料库，N-gram转储，例如Google NGram转储）。上下文拼写检查。

已邀请:

2 个回复

杰黔轿缺

这是经典论文：Church＆Gale（1991）。关于上下文敏感的错误校正的工作很少，但是可能值得研究的两篇论文是Golding（1995）和Carlson＆Fette（2007）。

冕偷淮款

从下面的链接引用它是如何工作的？基本模型基本技术的工作原理如下：将搜索引擎提供访问权限的文档添加到搜索索引和语言模型中。语言模型存储可见短语并维护有关它们的统计信息。提交查询后，src / QuerySpellCheck.java类将查找可能的字符编辑，即替换，插入，替换，换位和删除，使查询更适合于lanaguage模型。因此，如果您输入\'Gretski \'作为查询，并且基础数据是来自rec.sport.hockey的数据，则语言模型将与经过轻微编辑的\'Gretzky \'更为熟悉，并建议将其作为替代方案。领域敏感性与基于字典的拼写检查相比，此方法的最大优势在于更正是由搜索索引中的数据推动的。因此，“ trt”在法律领域将被纠正为“ tort”，在烹饪领域将被纠正为“ tart”，而在生物信息学领域将被纠正为“ TRt”。在Google上，没有建议的更正，大概是因为网域“ trt.com”，色萨利广播电视台以及Turkiye Radyo Televizyon（又名TRT等）。上下文相关的校正 Yahoo和Google都执行上下文相关的更正。例如，查询frod（来自德语的旧英语术语，意思是“明智”或“经验丰富”）建议对福特（汽车公司等）进行更正，而查询frod baggins具有更正的查询frodo baggins（20世纪英语）虚构人物）。这就是Yahoo的行为。 Google不会纠正欺诈行为，尽管它的点击率约为785，而Frodo Baggins则为82万。另一方面，Google会更正frdo和frdo baggins。亚马逊的行为与此类似，但MSN会将frd baggins纠正为ford baggins，而不是frodo baggins。 LingPipe的模型完全支持这种上下文相关的校正。阅读这个很棒的教程

要回复问题请先登录或注册

关于拼写检查器的文献？

2 个回复

发起人

spell_checking

machine_learning

nlp

问题状态

关于拼写检查器的文献？

与内容相关的链接

2 个回复

发起人

spell_checking

machine_learning

nlp

问题状态