作者Muscovy (三分熟的闹钟)
站内CMWang
标题[讨论] 状况内与状况外
时间Mon Aug 6 18:45:12 2007
其实当神棍还是蛮有趣的...
延续一下去年的模型: 用 Poisson distribution 研究投手表现.
首先有一个基本的问题...
小王今年越来越猛了.
而我好奇的就是, 如何评估他这些场次的表现?
7/03 MIN 7.0 IP, 7/08 LAA 6.1 IP 两场一路塞鸭蛋的比赛当然没话讲.
可是天使的火力比双城要猛, 撑 6.1 局跟撑 7.0 局的表现哪个好?
又譬如白袜今年的打击实在太悲了...
那麽对 6/06 白袜投了九局掉一分, 相较於 5/05 对西雅图投了八局掉一分.
到底哪个难度比较高?
另外那种 6.0 局掉四分, 跟 5.2 局掉三分的又要怎麽比, 也是很麻烦.
所以只好开坛作法, 呼唤 Poisson 大神.
当然还是要用几句话描述一下整个模型的概念.
我们一样假设: 一场棒球比赛的得分, 对於局数来说呈现卜松分布.
然後把整个美联赛事看成一个投手跟一个打者对决.
成绩是 1546 场比赛失 7546 分.
或者说这是 R/9 = 4.88 的卜松投手对决 RS/9 = 4.88 的卜松打者.
两个人打了........................嗯, 一千多场比赛.
现实投手的作用是什麽?
以小王做例子, 小王投 136.2 局失 53 分.
他可以把 RS/9 = 4.88 的 Poisson trial 压制成 RS/9 = 3.49.
对攻击来说呢, Yankees 在 111 场比赛里头打了 660 分.
所以 Yankees 可以把 R/9 = 4.88 的 Poisson trial 打成 R/9 = 5.95.
从上面这一段可以算出小王对决洋基的失分期望值...
我讲得很抽象, 然而算式很简单, 因为卜松大神的特色就是线性. :P
小王 vs NYY, 投七局的情况下, 失分期望值应该会是...
4.88 * (3.49 / 4.88) * (5.95 / 4.88) * 7 / 9 = 3.31
就是说大概掉三分多左右.
交代完毕... 来看结果.
──────────────
AL games: 1546, runs: 7546
NL games: 1770, runs: 8104
王建民: R = 53, IP = 136.2
──────────────────────────────────────
日期 胜 队伍 局数 失分 火力表 应失分 再压制率 持平 再失分率
──────────────────────────────────────
7/03 W MIN 7.0 0 110/507 2.56 ------ 7.70% 92.30%
7/08 W LAA 6.1 0 110/554 2.53 ------ 7.93% 92.07%
6/06 W @CWS 9.0 1 111/480 3.09 4.54% 14.04% 81.42%
5/05 W SEA 8.0 1 109/526 3.07 4.65% 14.28% 81.07%
8/03 W KC 7.0 1 110/512 2.59 7.51% 19.45% 73.04%
6/12 W NL-ARI 7.0 1 113/467 2.45 8.63% 21.14% 70.24%
5/16 W @CWS 7.0 1 111/480 2.41 9.03% 21.71% 69.27%
6/17 W NL-NYM 8.2 2 111/519 3.43 14.32% 19.03% 66.64%
5/21 W BOS 6.1 2 111/574 2.60 26.70% 25.09% 48.21%
5/26 L LAA 8.0 3 110/554 3.20 37.97% 22.26% 39.77%
7/19 L TOR 7.1 3 110/512 2.71 49.07% 22.08% 28.85%
──────────────────────────────────────
6/01 W @BOS 5.2 3 111/574 2.33 58.86% 20.50% 20.64%
7/14 W @TB 6.0 3 110/512 2.22 61.77% 19.80% 18.44%
7/29 W @BAL 6.0 3 110/503 2.18 62.81% 19.52% 17.67%
4/29 L BOS 6.0 4 111/574 2.47 76.50% 13.08% 10.42%
4/24 L @TB 6.1 4 110/512 2.34 79.07% 12.05% 8.88%
6/23 NL-@SF 6.1 4 109/466 2.29 80.07% 11.63% 8.30%
7/24 W @KC 6.0 4 110/512 2.22 81.56% 10.98% 7.46%
6/28 @BAL 6.1 6 110/503 2.30 97.00% 2.06% 0.94%
5/10 L TEX 6.1 7 111/533 2.42 98.80% 0.85% 0.35%
──────────────────────────────────────
以这张表来说, 预测失分跟实际失分的理论误差大约是 1.65 分左右.
模式符合得有点夸张, 我不知道其他投手会不会这样子. O_o
然而请不要叫我深入研究, 抄写数据很麻烦... :P
解释两个名词...
「再压制率」是说: 如果又打一场, 小王有多大的可能会让失分更低...
「再失分率」刚好反过来, 是说对手有什麽样的机会可以打得更好.
举 7/19 L TOR 7.1IP 3R 那一场来说.
如果再一次 7.1 局对决, 小王让失分更低的机率是 50% (49.07%) 左右.
而蓝鸟要打得更好的机会只有不到三成 (28.85%).
另外两成多的结果不变...
里头可以看到两场, 5/26 LAA, 7/19 TOR 算是状况内还败投.
话说回来, 状况外还胜投的有 6/01, 7/14, 7/24, 7/29 四场. :P
不过只有 5/26 LAA 败得比较冤, 7/24 @KC 胜得比较虚.
请注意, 这边都是自己跟自己比.
全盛时期的 Randy Johnson 就算状况不太好, 应该也是大杀四方.
而且这是攻守双方的数据.
或许状况未必差, 是对方的棒子也太烫了. :PPP
由好排到坏的结果, 大概长那个样子.
────
这个模型还有一些有趣的地方...
譬如也可以计算: 小王今天拿出了十场只会出现一场的压制力.
对决红袜也是十场只会出现一场的火力...
会怎麽样?
来算算对战的胜败机率赚 P 币也是可以啦.
只是呢, 那真的就是神棍之魂的领域了... :Q
--
新诗练习:新鲜。踩破初春里的狗大便;不经意的沧桑,满溢着嫩黄的喜悦。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 59.125.101.95
1F:推 sycc:这篇大概又要M了 先来推XD 08/06 18:51
2F:推 fox308:大推!!! 08/06 18:55
3F:推 superjerry2:这一篇文章值 23 银 08/06 18:59
4F:推 monsterjay:哇靠 好强!!!推!!! 08/06 19:29
5F:推 mlkj:统计魔人!!!! 08/06 19:35
6F:推 lovewhite:好强阿!!! 我虽然学过统计 不过还是一整个看不懂 囧 08/06 19:36
7F:推 gfneo:神棍成这样,不推也不行 08/06 19:37
8F:推 pdaer:唉...可惜统计没学好,不然用在棒球上应该蛮好玩得 08/06 19:41
9F:推 O5:묠这一篇文章值 23 银 08/06 19:55
10F:推 fiftyyuan:老实说 有一点复杂!! 08/06 20:28
11F:推 happiness2:其实我ㄧ直想问 有人常推文说:这篇文章值几元 08/06 21:22
12F:→ happiness2:是要做什麽啊?有什麽用意吗? 08/06 21:23
13F:推 soaringfish:推推 08/06 21:36
14F:推 lukydream:有看没懂 真惭愧 我是统计系的... 08/06 22:01
15F:推 woer:就看完比赛的感觉 08/06 22:04
16F:推 tigernaxo:一整个 Data 分析魔人,要是我作实验也有这种精神就好了 08/06 22:38
17F:推 shark0321:给happiness2:因为一篇很长的文章,通常得到的P币不少 08/06 23:13
18F:→ shark0321:而 P币太少有可能是复制贴上。 08/06 23:14
19F:→ shark0321:所以有些人会用这个来判断是不是自己打的。 08/06 23:16
20F:推 shark0321:不过有时候也只是贴好玩的啦!XD 08/06 23:19
21F:→ caten:也不能这样说,PTT现在的状况没人敢在上面打长文吧囧 08/06 23:36
22F:推 galewind:在文章列表那文章前按下shift+q 就可以查该文po完得的p币 08/06 23:36
23F:→ galewind:再看内容,可以判断出是纯灌水骗p币或是贴上的或是直接打 08/06 23:37
24F:→ galewind:字的,大概这样,基本上我把这功能当成小游戏偶尔为之 08/06 23:38
25F:推 shark0321:给caten:我没有说这篇不是自己打的意思啦!XD 08/06 23:58
26F:推 Caesar121:我比较想知道 为何可以假设这是卜瓦松分配?! 08/07 02:15
27F:推 xex999:原po可以去买运动彩卷啦 08/07 07:32
28F:推 jrshiun:这是你的论文题目吧 08/07 08:07
29F:推 Kinra:上三楼可以去搜原po以前的文 08/07 08:42
30F:推 KGenius:还颇送 ~_~ 要不要那麽专业啊........ 08/07 13:45