寻求从文档分类开始的书籍和文章参考

我有兴趣做一个关于文档分类的项目,并且一直在寻找可能对与此相关的文本挖掘中的理论部分有用的书籍或描述从具有子类别(带子类别)的文档到培训数据的过程的文章示例预测文档类别的系统。似乎有一些(相当昂贵!)的标题可用,但这些是关于较小的非常具体主题的文章的会议论文集。有人可以从数据挖掘文献中推荐书籍,这些书籍为文本挖掘项目提供了良好的理论基础,特别是文档分类或概述此过程的文章吗?     
已邀请:
Christopher D. Manning,Prabhakar Raghavan& HinrichSchütze有一本免费的信息检索书。尝试第13章 - 文本分类&朴素贝叶斯。 另请参阅Manning和Schütze的nlp书的配套网站,特别是文本分类章节的链接。 Fabrizio Sebastiani撰写了一篇关于文本分类(PDF)的有用教程和用于文本分类的机器学习评论文章(PDF)。     

要回复问题请先登录注册