作者ntask (ntask)
看板Math
标题Re: [机统] 书上的问题
时间Thu Jan 13 22:40:10 2011
※ 引述《yhliu (老怪物)》之铭言:
: ※ 引述《ntask (ntask)》之铭言:
: : 可是如果假设 m=n=90 s=81
: : 如果计算 x(也就是上文的N) 的期望值
: : x 的机率在 x<99时为零
: : p(x=99) 开始会大於零
: : 因此 E(X)= Sigma i*p(i) for i>=99
: : 显然 E(X) 应当会大於 100 才对
: : 而且直观上和 100有一些差距
: : 用100做估计应该不是很适用.....
: N 是随机的吗?
: 如果 N 是随机的, 有一个先验分布
: N ~ π(x) = P[N=x], x=0,1,2,...
: 例如假设 N 服从 Poisson(λ).
: 在 m,n,s 这三个观测值之下, N 的後验分布是
: π(x|m,n,s) = π(x)f(m,n,s|x)/g(m,n,s), x=99,100,101,...
: 这时可考虑
: E[N|m,n,s] = Σ x π(x|m,n,s).
: 然而这是个未知的量...即使λ已知(可能吗?)f(m,n,s|x)
: 其中仍有未知参数(如我文中的 p,q), 因此需要估计这些
: 未知参数.
: Bayesian 的做法把 N, p(P), q(Q) 都当成随机的, 并设
: 定它们的联合先验分布, 例如:
: (N,P,Q) ~ π(x,p,q) = π1(x)π2(p)π3(q)
: 而後计算 N, P, Q 在给定 m,n,s 後的後验分布, 据以对
: N 做推论.
: 但这样的计算, 就不是你提出问题时所设想的 "简单" 了!
: 估计结果和 N 的真值当然有差距.
: 因为既然假设校对或检误结果会有疏漏, 就不可能得到完
: 整的讯息, 也就不可能完全无误差地估计 N.
: 不同估计方法估计结果也会不同. 至於哪种方法好, 哪种
: 方法差, 不能一概而论.
照题意来说 N 应当是随机的
然而如果就直观来说
当我们知道 m=n=90 s=81 时
是猜 N=100 比较合理 还是 猜 N=108 比较合理?
已知 m=n=90 的话 当 N=108 时 s=81 的机率
远大於 N=100 时 s=81 的机率
不管 N 的分布为何
所以当 m=n 时 用 m+2*(m-s) 也是一个可能的估计值
我不太晓得要怎样说明我的想法 回去再想想
我的意思只是想解释说为什麽我觉得 mn/s
不是一个很好的估计值
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 118.160.193.112