矩阵TFIDF的维数减少

我计算TFIdf(术语频率,逆文档频率),我已经看到,在这一步之后,有必要使用像LSI,chi -square test ......这样的方法来减少My Matrix的维数。 我不知道如何在java中为矩阵TFIDF的维数减少实现卡方检验,如果有一些库可以做到这一点或教程中他们解释我怎么做,请告诉我     
已邀请:
我不认为你想做卡方;这不是减少尺寸的技术。 你想要做的是SVD,或奇异值分解。这是LSI / LSA中用于降低维数的技术。 维基百科建议在Java中使用名为“S-Space Pacakage”的库来实现LSA。我自己没有用过它,但你可能想看看它。 http://code.google.com/p/airhead-research/     
使用gensims库为LSA,LDA。 它实际上可以为任何大型数据集执行LSA。它不会立即将整个语料库加载到内存中,而是进行惰性读取。     

要回复问题请先登录注册