作者hipya ()
看板MATLAB
标题[讨论] 资料分布
时间Thu Nov 14 14:30:03 2013
假设有两笔资料
根据这两笔资料画出scatter diagram後
会有一块明显集中的区域以及其他比较松散的区域
若是想要只取集中的区域内的data做分析,舍去松散的区域的data
这个作法是有什麽相关的理论吗?
在matlab上面该如何执行
感激不尽!!
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.112.19.237
1F:推 BahasaMelayu:kmeans 11/14 15:55
2F:→ hipya:楼上 请问跑kmeans他会自己找出最密集的区块吗 还是有手动 11/14 17:27
3F:→ hipya:输入呢? 11/14 17:28
4F:推 doom8199:kmeans 是 greedy alg. 原po只能多跑几轮 kmeans 11/14 17:40
5F:→ hipya:可是我只是要找出一个cluster就好,就是找资料内最密集的 11/14 17:50
6F:→ hipya:区域,其余的都舍去掉 11/14 17:50
7F:→ hipya:当资料间没有明显的区隔时,要如何把较为散开的点给去除? 11/14 17:53
8F:推 doom8199:若对资料的 distribution 不是很了解 11/14 17:54
9F:→ doom8199:我是觉得可以用 mean-shift 来求得 11/14 17:55
10F:→ doom8199:而稀疏区域排除,得看你所选取的 ROI 大小为何才能决定 11/14 17:56