作者kuan0817 ()
看板MATLAB
标题Fw: [请益] 使用PCA在分类时的问题
时间Tue Mar 26 16:28:46 2013
※ [本文转录自 Master_D 看板 #1HKLizr2 ]
作者: kuan0817 () 看板: Master_D
标题: [请益] 使用PCA在分类时的问题
时间: Tue Mar 26 16:24:25 2013
大家好
最近使用了PCA来对我资料做降维
因为降维後的资料是要拿来做分类的
也就是有train跟test
我想问的问题是:
在找寻eigenvector时, 是否可以使用train+test一起去找
如果是这样做的话, 後续的分类结果是否仍然可以算outside test呢?
看了一些网路上的资料, 好像有些是说可以纳入test, 因为是unsupervised的
(清大张智星老师网站关於PCA的教学, 也是先对全部资料取pca, 然後再leave one out的
去看准确率)
但又觉得好像怪怪的
希望有人可以解惑
谢谢大家
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.116.82.127
※ 发信站: 批踢踢实业坊(ptt.cc)
※ 转录者: kuan0817 (140.116.82.127), 时间: 03/26/2013 16:28:46
1F:→ labbat:pca是平移转置运算的一种 运算耗费O(n^3) 03/26 19:42
2F:→ labbat:还是不是有点忘了 总之样本数大的时候等待时间很可观 03/26 19:43
3F:→ labbat:通常希望每个测试样本看到的是经过相同平移转置矩阵後结果 03/26 19:45
4F:→ labbat:分类之外 还有各种统计的分析才有意义 03/26 19:46
5F:→ u941716:可以 因为feature和label在你的case应该是独立的 03/27 01:13
6F:→ labbat:补充楼上 个人解读为分类索引并不是样本数据的变数 03/27 01:36
7F:→ labbat:所以采行pca时只要单纯处理数据即可 与独立的严谨定义不同 03/27 01:37
8F:→ labbat:但是样本的特徵分布与分类索引的相依特性还是存在着 03/27 01:40