作者ashugh (hugh)
看板Baseball
标题[心得][计量]棒球投手表现与身高的关系(以中职 …
时间Tue Jun 10 16:51:11 2008
※ [本文转录自 Elephants 看板]
作者: ashugh (hugh) 看板: Elephants
标题: [心得][计量]棒球投手表现与身高的关系(以中职为例)
时间: Tue Jun 10 16:50:56 2008
研究显示身高与投手表现没有显着的关系
但是身高却与投手投球局数呈现显着正相关
这显示教练对投手有身高上的迷思
会给予身高高的投手更多的机会 尽管身高高的投手表现没有比较好
-----------------------------------------------------------------------------
壹、 绪论
1. 研究背景
近年来,因为王建民在美国职棒有杰出的成绩,以及近几次国际赛事的举行,还有许多国
内年轻好手往国外发展的人数也逐渐增多,使棒球运动再度受到国人注目;而王建民超过
190公分的身高也受到媒体的关注。
一般来说,普遍都认为投手的身高要高,站上投手丘後,能带给打者较大的压力,并且球
从较高的角度掉落,对打者来说也比较难攻击。许多少棒以及青棒的教练,在一开始都偏
好选择队上身高较高的选手,来负责投球的工作。
而在职棒场上,许多杰出的投手身材都相当高大,在MLB如︰
Randy Johnson,六尺十寸的身高约为208.28公分
Chien-Ming Wang,六尺四寸,193公分
在国内的则有︰
林恩宇,188公分
潘威伦,182公分
然而在这之中也存在着反例如︰
黄武雄,168公分
郭进兴,174公分
另外近年来的投手如萧任汶、吴俊亿、谢承勳等这些杰出的选手身高却都不到180公分,
是否身高是影响投手表现的因素之一呢?这是我们值得研究的一个课题。
2. 研究范围以及限制
本文以中华职棒的官方网站 上资料为准,因为职棒19年尚在进行之中,许多当年度的资
料并未上网登录,故而只蒐集至职棒18年的资料。
另外,许多投手的表现不佳,投球局数过少,导致其ERA 数值都过大;比方说职棒18年兄
弟象队投手Andre Simpson在上场後没有解决任何一名选手就被球团开除,其ERA无限大,
在此情况下即使几百份样本平均下去仍然造成相当大的影响,因此我选择投满三局的投手
资料来当做研究的范围。
贰、 相关文章探讨 (跳过)
参、 研究方法与步骤 (跳过)
肆、 模型设定
要研究投手的身高与其投手表现,首先要先判定哪一项资料较能反映投手表现。
ERA是最传统也最广为人知的一种,但是长久以来也不断有人诟病,认为ERA会受到背後队
友防守的影响。一位投手背後站的七名防守球员拥有金手套级的守备,明显跟一名投手背
後站着七名普通的防守球员有差,因此衍生出下列的数据,但仍然各自有其缺点。
WHIP是计算除了失误外,投手每局让打者上垒的数目。相较於传统的ERA,WHIP更能显示
出一名投手的压制能力。但是WHIP却有一项缺点,那就是没有将长打与一般的一垒安打做
区分,皆视为安打。第二个缺点是WHIP没能像ERA一样直觉看出其对一支球队在一场比赛
中的影响。
而在陈俊璋(民95)的研究中使用的FIP以及DERA,这两者的数据除了没法给予直觉上的解
释,一般人也很难会去接触到这两项数据;再者我也没有找到关於这两数据的理论基础,
因此在考虑到我已经有K/9值、HR/9值、WHIP这三项数据,与FIP以及DERA等在计算上用到
相同的原始资料,如SO、BB、HR、IP等,故不予考虑。
最後我仍然选择传统的ERA当做代表,因为它可以提供直觉上的解释,也是广为一般大众
所知的数据。
接下来开始设定模型,利用Two-Stage Least Squares Model(2SLS),其SAS语言为︰
proc syslin data=baseball 2sls;
Endogenous era avep ip;
instruments l fr fl h k9 hr9 age bmi whip;
model era=l fr fl h bmi age k9 hr9 whip;
model avep=l fr fl h bmi age k9 whip;
model ip=l fr fl h bmi age era avep;
run;
其中内生变数为era(防御率)、avep(平均每局投球数)、ip(每年投球局数)。
外生变数为l(本土左投)、fr(外籍右投)、fl(外籍左投)、h(身高)、bmi(身体质量指数)
、age(年龄)、k9(K/9值)、hr9(HR/9值)、whip(WHIP)。
l、fr、fl这三项变数设为Dummy Variables,本土右投手就设定为(0,0,0),本土左投手
设定为(1,0,0),外籍右投手设定为(0,1,0),外籍左投手(0,0,1)。
利用BMI指数是因为身高与体重之间存在共线性的问题,将体重用BMI代替後解决共线性问
题,并且一样能反映出投手的体型。
WHIP是用来代表投手的压制能力,但因为用来代表投手表现的话仍有不足,故将它放入影
响ERA的变数之一。
ERA设定为与投手基本资料和WHIP有关外,更设定了K/9值代表投手的类型,HR/9值代表投
手被打长打的机会。
每局投球数量设定为与投手基本资料和WHIP有关外,再加上K/9值代表投手的类型,一般
来说三振型的投手会比滚地球或飞球型投手花更多的球数;我以此来检视此说法的正确性
。
每年投球局数设定为与投手基本资料有关外,尚设定和ERA与每局投球数量有关。一来表
现好的投手机会应该较多;而每局投球数量较少的,也能用较为节省的体力来解决打者,
续航力应该较强,投球局数应该较多。
伍、 结果分析
The SAS System 41
The SYSLIN Procedure
Two-Stage Least Squares Estimation
Model era
Dependent Variable era
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 9 5559.540 617.7267 328.63 <.0001
Error 1038 1951.112 1.879684
Corrected Total 1047 7510.652
Root MSE 1.37102 R-Square 0.74022
Dependent Mean 4.57429 Adj R-Sq 0.73797
Coeff Var 29.97219
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 -4.40394 1.631743 -2.70 0.0071
l 1 -0.38034 0.182956 -2.08 0.0379
fr 1 -0.21067 0.112419 -1.87 0.0612
fl 1 -0.24540 0.158677 -1.55 0.1223
h 1 0.012637 0.008120 1.56 0.1200
bmi 1 -0.01279 0.021024 -0.61 0.5430
age 1 0.002761 0.010581 0.26 0.7942
k9 1 -0.03881 0.021035 -1.85 0.0653
hr9 1 0.855895 0.061178 13.99 <.0001
whip 1 4.387406 0.105342 41.65 <.0001
The SYSLIN Procedure
Two-Stage Least Squares Estimation
Model avep
Dependent Variable avep
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 8 4065.610 508.2013 360.81 <.0001
Error 1039 1463.439 1.408507
Corrected Total 1047 5529.049
Root MSE 1.18681 R-Square 0.73532
Dependent Mean 16.14234 Adj R-Sq 0.73328
Coeff Var 7.35213
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 5.887001 1.408972 4.18 <.0001
l 1 0.139677 0.158323 0.88 0.3779
fr 1 0.201931 0.096747 2.09 0.0371
fl 1 0.525662 0.136486 3.85 0.0001
h 1 0.008928 0.007013 1.27 0.2033
bmi 1 0.025618 0.018166 1.41 0.1588
age 1 -0.00941 0.009156 -1.03 0.3042
k9 1 0.312663 0.018194 17.18 <.0001
whip 1 4.216344 0.084746 49.75 <.0001
The SYSLIN Procedure
Two-Stage Least Squares Estimation
Model ip
Dependent Variable ip
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 8 724689.4 90586.17 33.31 <.0001
Error 1039 2825821 2719.751
Corrected Total 1047 3375196
Root MSE 52.15123 R-Square 0.20411
Dependent Mean 65.55993 Adj R-Sq 0.19798
Coeff Var 79.54741
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 32.74820 62.54071 0.52 0.6006
l 1 -9.90730 7.035363 -1.41 0.1594
fr 1 -11.3524 4.442158 -2.56 0.0107
fl 1 -15.9554 6.479334 -2.46 0.0140
h 1 0.609332 0.307580 1.98 0.0478
bmi 1 -0.85887 0.806867 -1.06 0.2874
age 1 -0.18078 0.400465 -0.45 0.6518
era 1 -11.7365 1.546406 -7.59 <.0001
avep 1 0.653514 1.860667 0.35 0.7255
我们可以看出︰
1. 身高对於投手的表现来说,并没有显着的相关性。有显着相关的变数是本土左投
、外籍右投、K/9值、HR/9值以及WHIP。第一式的Adj R-Sq 为0.73797。
2. 身高对於每局投球数量也并没有显着的相关性。有显着相关的变数是外籍右投以
及左投、K/9值以及WHIP。第二式的Adj R-Sq为0.73328。
3. 身高跟每年投球局数呈现显着相关,其他与每年投球局数呈现显着相关的是外籍
左投与右投、ERA﹔令人意外的还有每局投球数量与每年投球局数的相关性不显着。第三式
的Adj R-Sq为0.19798。
一般来说,教练应该给予投球表现良好的选手多一点的上场机会,投球局数应该较多,但
是明明身高与投球表现没有显着相关,但是投球局数却跟身高呈现显着的正相关。身高高
10公分,每年平均多投6局。
这结果意味着在中华职棒中,存在着身高的迷思;教练会给予身高较高的投手更多的机会
,尽管其投球表现并没有更为出色。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.119.46.34
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.119.46.34
1F:推 shoe:很有意思,不知道MLB有没有类似的研究 203.74.250.33 06/10 16:53
2F:推 dragon3904:有趣的文章140.112.107.208 06/10 16:59
3F:→ gardelzb:投球姿势... 140.123.41.120 06/10 17:03
4F:推 loloool:统计强者...不过我觉得SP和RP要分开 218.173.23.155 06/10 17:04
5F:→ loloool:SP投球局数较多是应该的 218.173.23.155 06/10 17:04
6F:推 wuuanbing:你可以直接贴结论嘛.没学过统计的看不懂 140.117.193.58 06/10 17:46
7F:→ wuuanbing:ANOVA 140.117.193.58 06/10 17:46
8F:→ ashugh:中职没有投球姿势的资料,sp和rp的定位也不 140.119.73.81 06/10 17:48
9F:→ ashugh:不是很清楚,甚至连max球速也没有... 140.119.73.81 06/10 17:49
10F:推 abc12812:类似的东西THT早做过了 140.112.5.3 06/10 17:57
17F:推 redbibo:看来国内教练跟欧兔女孩想法是ㄧ样的! 219.84.59.29 06/10 18:03
18F:→ ashugh:abc兄,谢了,我的结论刚好跟他相反XD 140.119.73.81 06/10 18:05
19F:推 Richter78:若矮的局数与高的一样多,表现还差不多?118.165.219.251 06/10 18:11
20F:推 bobon0921:没有感谢122.146.118.226 06/10 18:34
21F:推 loveSabina:很认真 59.116.55.59 06/10 18:58
22F:→ jaco0058:有点疑问,萧ˋ吴跟谢真的算杰出投手吗? 210.21.58.206 06/10 19:56
23F:→ jaco0058:只是单纯觉得有其他人应该更好诠释吧? 210.21.58.206 06/10 19:57
24F:→ ashugh:那些只是举例而已XD 140.119.73.37 06/10 20:06