如何在numpy和R之间传递大型数组?

|                                                                                                                       
已邀请:
您已经研究过RPy吗?这是R的python接口。我想这样可以节省您的数据处理时间。 要备份NumPy数组,可以使用pickle。由于在保存大量数据时似乎会产生大量开销,因此最好使用HDF标准保存NumPy数组。这是一篇涵盖以下内容的文章:http://www.shocksolution.com/2010/01/10/storing-large-numpy-arrays-on-disk-python-pickle-vs-hdf5adsf/     
使用Rpy(http://rpy.sourceforge.net/)从Python调用R。 需要注意的是,R版本和Python版本都必须恰好是Rpy二进制文件所针对的版本。因此,您需要小心安装。     
我无法评论R和Python之间共享的“大数据”,但是使用pyRserve的时间比使用RPy或RPy2轻松得多。 话虽如此,我对您正在执行的文本处理感到好奇吗? Python显然在文本处理方面提供了很多东西,但是从统计学上讲,NLTK和CLiPS的Pattern软件包中也有很多东西。您只是更愿意在R中进行统计,还是Python中缺少某些特定内容?     

要回复问题请先登录注册