作者hatemath1991 (hatemath)
看板R_Language
标题[问题] 关於randomforest
时间Wed Sep 27 23:09:00 2017
[问题类型]:
意见调查(我对R 有个很棒的想法,想问问大家的意见)
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
[软体熟悉度]:
请把以下不需要的部份删除
使用者(已经有用R 做过不少作品)
[问题叙述]:
抱歉有一些关於randomforest使用上的问题想要问一下
目前我使用randomForest这个套件去训练我的树
然後想要使用
https://github.com/araastat/reprtree/tree/master/R
上面那个套件的retree画出我的树
但是遇到了一些问题
训练组跟测试组所画的树不一样
以及如果我现在是想要做随机森林的特徵选取
那我该如何下手因为用不同的资料所会出的树不一样
[程式范例]:
请把以下不需要的部份删除
library(reprtree)
rforest <- randomForest(type~., data=train_data)
reptree <- ReprTree(rforest, train_data, metric='d2')
plot(reptree, index=1)
reptree <- ReprTree(rforest, test_data, metric='d2')
plot(reptree, index=1)
[环境叙述]:
R version 3.4.1 (2017-06-30)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 16.04.3 LTS
Matrix products: default
BLAS: /usr/lib/libblas/libblas.so.3.6.0
LAPACK: /usr/lib/lapack/liblapack.so.3.6.0
locale:
[1] LC_CTYPE=zh_TW.UTF-8 LC_NUMERIC=C
LC_TIME=zh_TW.UTF-8
[4] LC_COLLATE=zh_TW.UTF-8 LC_MONETARY=zh_TW.UTF-8
LC_MESSAGES=zh_TW.UTF-8
[7] LC_PAPER=zh_TW.UTF-8 LC_NAME=C
LC_ADDRESS=C
[10] LC_TELEPHONE=C LC_MEASUREMENT=zh_TW.UTF-8
LC_IDENTIFICATION=C
attached base packages:
[1] stats graphics grDevices utils datasets methods base
loaded via a namespace (and not attached):
[1] compiler_3.4.1 tools_3.4.1
[关键字]:
随机森林、特徵选取、绘图
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.125.96.131
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1506524943.A.391.html
1F:推 f496328mm: 为什麽要建两次 model ? 09/27 23:35
2F:→ hatemath1991: 抱歉我不是只用randomForest创一次model嘛? 09/27 23:37
3F:→ f496328mm: 应该是说 为什麽要分别对对 train and test 画树 09/27 23:51
4F:→ f496328mm: 建 model 时, 是利用 train data 去建立树model 09/27 23:52
5F:→ f496328mm: 所以整个结构是看 train data 09/27 23:54
6F:→ hatemath1991: 应该说这个是因为有一天打错所以才发现的 09/28 00:00
7F:→ hatemath1991: 我原本想说是不是我演算法理解错误,但是回去重看 09/28 00:01
8F:→ hatemath1991: 林轩田老师的影片确定应该不会因为资料不同 09/28 00:01
9F:→ hatemath1991: 产生不同树才对所以才会惨生疑问 09/28 00:02
10F:→ hatemath1991: *产 09/28 00:02
11F:→ hatemath1991: 所以现在才会疑惑,为什麽两颗树的结构有差异 09/28 00:04
12F:推 KKbiger: 为什麽会觉得train data和test data建出来的数结构会完全 09/28 10:03
13F:→ KKbiger: 一样 除非你的train data建出来的model会百分之百可以预 09/28 10:03
14F:→ KKbiger: 测test data 才有可能两个一样吧 09/28 10:03
15F:→ owem0410: 抱歉我model才建一次不是?同model解构不就要一样? 09/28 11:56
16F:推 KKbiger: 用train data抽了一棵树 又用test data 抽出另一棵树 09/28 14:37
17F:→ KKbiger: 所以抽出两颗不一样的树 09/28 14:37
18F:推 APM99: 你这样做就没有 训练集跟测试集的意义了 09/28 16:45
19F:→ APM99: 只是单纯的画了两棵树 09/28 16:46
20F:→ clansoda: 这边也看的到APM99?? 09/28 16:58