作者kuan0817 ()
看板MATLAB
標題Fw: [請益] 使用PCA在分類時的問題
時間Tue Mar 26 16:28:46 2013
※ [本文轉錄自 Master_D 看板 #1HKLizr2 ]
作者: kuan0817 () 看板: Master_D
標題: [請益] 使用PCA在分類時的問題
時間: Tue Mar 26 16:24:25 2013
大家好
最近使用了PCA來對我資料做降維
因為降維後的資料是要拿來做分類的
也就是有train跟test
我想問的問題是:
在找尋eigenvector時, 是否可以使用train+test一起去找
如果是這樣做的話, 後續的分類結果是否仍然可以算outside test呢?
看了一些網路上的資料, 好像有些是說可以納入test, 因為是unsupervised的
(清大張智星老師網站關於PCA的教學, 也是先對全部資料取pca, 然後再leave one out的
去看準確率)
但又覺得好像怪怪的
希望有人可以解惑
謝謝大家
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.116.82.127
※ 發信站: 批踢踢實業坊(ptt.cc)
※ 轉錄者: kuan0817 (140.116.82.127), 時間: 03/26/2013 16:28:46
1F:→ labbat:pca是平移轉置運算的一種 運算耗費O(n^3) 03/26 19:42
2F:→ labbat:還是不是有點忘了 總之樣本數大的時候等待時間很可觀 03/26 19:43
3F:→ labbat:通常希望每個測試樣本看到的是經過相同平移轉置矩陣後結果 03/26 19:45
4F:→ labbat:分類之外 還有各種統計的分析才有意義 03/26 19:46
5F:→ u941716:可以 因為feature和label在你的case應該是獨立的 03/27 01:13
6F:→ labbat:補充樓上 個人解讀為分類索引並不是樣本數據的變數 03/27 01:36
7F:→ labbat:所以採行pca時只要單純處理數據即可 與獨立的嚴謹定義不同 03/27 01:37
8F:→ labbat:但是樣本的特徵分布與分類索引的相依特性還是存在著 03/27 01:40