作者RungTai (RungTai)
看板Statistics
标题[问题] 对数据做平移 使不为负或不为0
时间Sat Jul 4 10:56:10 2015
有些时候,要取 Log, Natual Log, 几何平均数..时
都要求数值不能有0
这时如果想算这些值,有人建议将原始数据平移 强迫全部不为0
如果是这样的话,那应该加上什麽样的值作为平移的标准?
a. 0 以外的「最小值」
b. 0.000000000000000000000............00000000001
请问哪一个比较好呢?
如果是第一种 a. 似乎比较客观
如果是第二种 b. 虽然可以让「平移的量」达到最小,但到底要几位数就变成人为任意
再者,像「几何平均数」是 两者相乘再开根号
如果是 b. 会使两者相乘的结果,位数跟着往後一直移
造成「几何平均数」与「算数平均数」的结果差异非常非常大
所以想问大家,是不是第一种 a. 的作法比较好?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 202.103.141.2
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1435978572.A.2C4.html
※ 编辑: RungTai (202.103.141.2), 07/04/2015 10:58:01
1F:→ allen1985: 一般最常见的是log(x+1) 但如果在解释时 都转回原本的 07/04 12:22
2F:→ allen1985: scale 建议你想一下 为什麽你需要做log转换 这问题可能 07/04 12:24
3F:→ allen1985: 比 +1, +0.1, +0.001 重要点 07/04 12:24
4F:→ jason486: 如果是想把偏态资料转换成常态 ,通常是先加上某一数 07/04 14:30
6F:→ jason486: KS2 07/04 14:31
8F:→ RungTai: 但如果原始值就是介於 0~1之间呢 07/07 11:29
9F:→ allen1985: 介於0~1之间有什麽差别吗 是所有值+1 不是只有0+1喔 07/08 09:58