作者znmkhxrw (QQ)
看板Math
标题[其他] 移动平均观念多问(统计/工程)
时间Mon Oct 18 19:37:59 2021
请问一下, 某个实数列a_n的移动平均(Moving average)有多种定义方式,
例如:
https://en.wikipedia.org/wiki/Moving_average 这边列举一堆
想请问:
(1) 这些定义跟E[a_n]有什麽关系?(E是期望值)
还是要讨论它们的关系前, 要把a_n(w)定义为随机过程才可以?
目前看起来ergodic process就能推得E[a_n] = 累积移动平均?
(2) 工程上的paper有写到说: (for any r€(0,1))
藉由 s_n := (1-r)*s_(n-1) + r*(a_n-a_n-1) ---(*)
我们可以得到
zero-mean version of E[a_n]...这到底在讲什麽?
我都不管的话直接对(*)取期望值可以化简得到 E[s_n] = 0
为什麽这个结果就是
红色那句话?
理论上红色那句话应该要是 y_n = a_n - E[a_n] 吧
-------------------------------------------------------------
总之工程上的论文只要理论是用随机过程建模的, 实作时几乎脱离不了移动平均
我提的这些问题是
统计上的定义问题还是
工程上的喜好问题呢...@@?
谢谢指教~
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 61.231.108.253 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Math/M.1634557081.A.407.html
1F:推 chy1010 : 一个时间序列最单纯的预测方式就是拿前几期平均预测10/18 20:00
2F:→ chy1010 : E[a_n] 照定义还要知道他的分布长什麽样才能算10/18 20:01
3F:推 arrenwu : 你的第(2)点 可以cite那篇paper吗?10/18 20:04
4F:推 chy1010 : 有没有论文的前後文啊, 没遇过不是很懂10/18 20:04
5F:推 annboy : 我在想应该是在讲mean-ergodic10/18 21:23
6F:→ annboy : 把(*)两边除以n再取limit到无限大10/18 21:23
7F:→ arrenwu : 可是一般moving-average不会取这麽长吧?10/18 21:42
嗨c大ar大an大 截图一下
https://imgur.com/bWZsCT0
论文出自於
https://arxiv.org/pdf/1602.08044.pdf
而我算是"举个例子"而已, 因为工作上做了两年半的audio算法
碰了很多讯号处理(DSP)的论文, 几乎99%都是由统计模型&随机过程来建模
然後用移动平均(最常就是exponential移动平均)去逼近期望值E[x_n]
但是这些年来我从论文都没办法去得到"
为什麽这麽做"的答案
而从纯理论出发又是数学语言实变, 这部分又跟论文的"
口语解释"对不起来
总之, 就是对於工程论文上的数学式都会去想
"为什麽要这麽做", "不这麽做可以吗" blabla之类的数学解释问题
然後就头好痛QQ
8F:推 chy1010 : 右上角 2007, 但在 arxiv 上是 2016, 也太有趣10/18 22:56
9F:→ chy1010 : 感谢, 有空来瞄一下.10/18 22:57
2007没错, 只是IEEE要会员, 除非用S...^^"
看来是作者上传到arxiv这个免费的平台XD
10F:→ annboy : Sci-hub了解一下 贴IEEE的网址就能载10/18 23:53
11F:→ annboy : 所以你想知道的是(*)怎麽得到它下面那一句10/18 23:55
12F:→ annboy : 还是你想知道为什麽用这样去近似mean?10/18 23:55
13F:推 annboy : 不过做工程的思维是跟数学很不一样10/18 23:57
14F:→ annboy : 通常是方法有效 解释後面补10/18 23:57
15F:→ annboy : 方法没效的话 paper早就胎死腹中 也不会需要解释10/18 23:58
所以我S才小声说XDDD
至於我想知道的就是:
(i) zero-mean version of power spectra 是否有严格定义
若有: 是什麽, 然後应该就能解决(ii)了, 而且是可以证明的
若没有: 没道理没有, 不然就不会写(17)式了
(ii) 为什麽(17)能达到" zero-mean version of power spectra "
(iii) 为何要考虑zero-mean version?
只是这个答案我通常参考多个reference下来的回答也只是语言叙述而已...
比如为了去除DC成分, 那问题又变成为什麽要去除DC成分, 不去除会怎样blabla..
16F:→ recorriendo : 那式子是1st order IIR high pass10/19 00:43
17F:→ recorriendo : 如果本来a_n没有低频trend成分 或是选filter coe10/19 00:46
18F:→ recorriendo : fficient让stop band趋近於零 那high pass基本上10/19 00:46
19F:→ recorriendo : 就是demean罗10/19 00:46
r大关於你叙述的这些应该都有定义与证明吧?
我大概叙述我遇到的逻辑问题: (反正实作都是实数列, 我就不用随机过程叙述了)
<Def1> We say a real sequence a_n is of zero-mean
if E[a_n] = 0
<Def2> We say a real sequence b_n is a "demean" of real sequence a_n
if ??????
<Theorem> Let a_n be a real sequence
Then for any r€(0, 1)
b_n:= (1-r)*b_(n-1) + r*(a_n-a_(n-1))
will be a "demean" of a_n
而接着注意:
(1) <Def1>中的期望值是要用"某个moving average"去定义
还是把a_n看成随机过程去用机率空间的期望值定义, 因人而异
假设选了某个, 接着看(2)
(2) 我在论文, reference跟纯数都找不到<Def2>
(3) 如果有<Def1>, <Def2> 那<Theorem>可以证明吧?
20F:→ recorriendo : bn is a high-passed version of an这样讲才比较10/19 08:37
21F:→ recorriendo : 标准10/19 08:37
22F:→ recorriendo : 高通滤波後 取剩下的震荡成分周期的公倍数内的时10/19 08:47
23F:→ recorriendo : 域平均 当然就会是零了10/19 08:47
24F:→ recorriendo : 这里的1st order IIR filter只是高通滤波的特例10/19 08:53
25F:→ recorriendo : 因为计算量少 所以实务上求方便常用(如果对滤波10/19 08:53
26F:→ recorriendo : rolloff等等没那麽要求的话)10/19 08:53
这些语言叙述有一致的数学定义吗? 以我对DSP的理解 有砍低频的都可以叫高通滤波器
再来回到原本的问题, 我如果定义 b_n 恒为0, 那也可以说是"de-mean" of a_n
不是吗?(或是你说的high-pass)
如果不是的话, 代表<Def2>有严格的数学定义, 然後可以"证明" b_n=0不满足
※ 编辑: znmkhxrw (61.231.108.253 台湾), 10/19/2021 10:59:34
27F:→ recorriendo : 把傅立叶变换最前面的常数拿掉 就是demean10/19 11:12
28F:→ recorriendo : 实务上这不可能 滤波不会只影响一个傅立叶系数10/19 11:14
29F:→ recorriendo : 算moving average後减掉 数学上就等价於用一个w10/19 11:16
30F:→ recorriendo : indow function做FIR filter10/19 11:16
31F:→ recorriendo : FIR比IIR需要更多计算量 但不管什麽filter都只是10/19 11:22
32F:→ recorriendo : demean的一个近似10/19 11:22
33F:→ recorriendo : 近似得好不好就是看对其他傅立叶系数的影响 这就10/19 11:25
34F:→ recorriendo : 有整套digital filter design理论讨论各种tradeo10/19 11:25
35F:→ recorriendo : ff10/19 11:25
喔喔!! 所以总结来说:
<Def> 令x_t(w)为一随机过程, X_f(w)为其傅立叶变换
令T函数把一个随机过程打到另外一个随机过程
若 T(x_t(w)) 的傅立叶转换跟 X_f(w)一模一样, 除了f=0的地方是0
那我们就称做 T 是"demean" process
而实务上只能要"逼近", 而且不同实作方式与不同的input也有不同的效果
这方面并没有数学证明, 所以才会有那麽多moving average的版本以及
各作者不同的实作方式?
36F:→ recorriendo : bn恒为零就变成all stop啊XD 理想的high pass频域10/19 11:35
37F:→ recorriendo : 响应要是step function10/19 11:35
38F:→ recorriendo : 可以证明啊 就是把各种filter的频域响应算出来再10/19 11:40
39F:→ recorriendo : 去一一检视各种性质10/19 11:40
嗯嗯! 不同的近似法(FIR, IIR)确实有不同的频率响应
所以就是在理想滤波器无法达成的情况下, 各作者/实作用不同的近似法
之後看实验结果, 好的就留下, 不好的就tune或是换, 大致上这样@@?
※ 编辑: znmkhxrw (61.231.108.253 台湾), 10/19/2021 14:09:36
41F:→ recorriendo : 要按照实际需求 在计算量/数值稳定性/对其他频率10/19 15:20
42F:→ recorriendo : 的影响之间作取舍10/19 15:20
了解~谢谢r大的分享~~
※ 编辑: znmkhxrw (223.136.14.20 台湾), 10/19/2021 15:54:36