随机森林代码审查

| 我正在做一个关于随机森林算法的研究项目。我发现了该算法的许多实现,但是代码的主要部分通常是用Fortran编写的,而我对此却很幼稚。 我必须编辑代码,更改主要参数(例如树深,特征变量数量等),并在每次运行期间跟踪算法的性能。 目前,我正在使用\“ Windows-Precompiled-RF_MexStandalone-v0.02- \”。训练和预测功能是matlab mex文件,无法打开或编辑。谁能给我一些有关做什么的建议,或者是否有一个有效且完全基于Matlab的随机森林版本。 我已经仔细阅读了randomforest-matlab。不幸的是,主要的培训部分是dll文件。通过阅读更多内容,我的大部分奇迹现在都可以解决。我的问题主要是如何同时运行几棵树。     
已邀请:
        您看过这些库了吗? 随机博斯克 随机森林matlab     
        如果您正在做一个研究项目,最好的办法可能是实施用C训练自己的单个树,然后编写Mex包装器。我将从一棵ID3树开始(例如,在尝试C4.5之前。)然后编写随机森林代码本身,一旦编写了树代码,它就不那么困难了。 您会: 学到很多 能够随意修改它们 最终与他们一起探索新领域 我已经从头开始实现了它们,因此一旦您发布了一些自己的代码,我将为您提供帮助。但是我认为该网站上没有人会为您编写代码。 需要努力吗?是。您会比以前拥有更多的知识和能力吗?无疑。     
        R中有一个很好的库,称为randomForest。它基于Breiman在Fortran中的原始实现,但现在主要用C重新编码。 http://cran.r-project.org/web/packages/randomForest/index.html 您所谈论的主要参数(树的深度,要测试的功能数量,...)直接可用。     
        我推荐的另一个库是Weka。它是基于Java的并且很清晰。与R相比,性能略有下降。可以从http://www.cs.waikato.ac.nz/ml/weka/下载源代码。     

要回复问题请先登录注册