文档分析和标记
假设我有一堆文章(成千上万)我想要标记,分类等等。理想情况下,我想通过手动分类/标记几百个来训练某些东西,然后让它松散。
你会推荐哪些资源(书籍,博客,语言)来完成这样的任务?我的一部分认为这适合贝叶斯分类器甚至潜在语义分析,但除了我从一些红宝石宝石中发现的东西之外,我并不熟悉。
可以通过贝叶斯分类器解决这样的问题吗?我应该更多地关注语义分析/自然语言处理吗?或者,我应该只是从那里寻找关键字密度和映射?
任何建议都表示赞赏(我不介意拿几本书,如果这是需要的话)!
没有找到相关结果
已邀请:
2 个回复
到街客核
殿虫