作者murmurer (呢喃)
看板Programming
标题[问题] Clustering前的Normalize
时间Sat Jan 10 20:17:19 2015
这算是 machine learning 的问题
不知道该到哪发问故来此~
我对资料做clustering
事前要做normlize
我有疑问的是normalize的部分
举例
现在我有六组data
分别是
第一次实验 感冒後 黄人(10人) 白人(10人) 黑人(10人) 的体温(度C)
第二次实验 感冒後 黄人(10人) 白人(10人) 黑人(10人) 的体温(度C)
我现在想要用两次实验得到的体温
将这三个人种分群(clustering)
在做分群前必须先将资料normalize
但我就不太懂这边normalize的意义在哪里...
而且又要如何normalize呢?
(我们当然可算出这三组data的各别平均和标准差)
可能我这例子不是很好
但我是卡在为什麽要做normalize这边
还请高手讲解观念
谢谢各位 :)
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.112.94.64
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/Programming/M.1420892241.A.0D9.html
※ 编辑: murmurer (140.112.94.64), 01/10/2015 20:21:18
1F:→ fireslayer: 两次实验的差异? 可能早上测量或晚上140.113.178.253 01/10 23:13
2F:→ fireslayer: 测量的差异 normalize可以把每次实验140.113.178.253 01/10 23:13
3F:→ fireslayer: 的误差去掉 把人种的相对位置萃取出来140.113.178.253 01/10 23:14
5F:→ n3oanderson: Feature_scaling 111.243.108.15 01/11 00:03