作者TheDream (美梦)
看板NBA
标题Re: [讨论] 超级赛尔提克人
时间Fri Jan 4 00:00:58 2008
juby27 板友,本来我是不想再回你的文了,不过我看了你的前文,发
觉你自始至终都搞错一个很重要的问题,你有没有仔细去看看为什麽我
会质疑你呢?
我就直接告诉你好了,这个讨论串从头到尾我的态度都一样,
我质疑的
是你的推论过程与推论所使用的方法,我从来没有质疑过你的推论结果
。
在结果还未知的情况下, 我们在 NBA 板这个讨论区所讨论的是
推论的
过程是否合理,推论所使用的方法是否正确,这才是我们讨论时最重要
的交集点,我们讨论的交集点从来就不是结果是否正确。
虽然我的专业不是在统计学这方面,虽然我只修过生物统计学、流行病
学、公共卫生学这三门统计学相关课程,但是以我所学过的粗浅统计学
观念,很遗憾地我必须告诉你一件事。
你把统计学想简单了!!!
下面我就来教你真正的统计学是怎麽运作的吧!
首先这个讨论串里, 提出要用篮球统计学来预测 Celtics 失分走势的
人是你,那问题就很清楚了,你的目的是想要利用统计学来预测一个事
件的走势。
要怎麽用统计学来预测事件呢?
第一, 你必须先知道这个事件本身是否能够量化。
关於篮球场上的事件是否真的能够
完全量化成数据来表示这一点,相信
你也知道目前的篮球统计学在这方面有遇到很大的瓶颈,不过我个人还
是认为你一定会坚信防守失分这个部分一定能够量化。
如果我在这边要跟你吵是否能够量化的话,那看来不管我怎麽说你还是
无法理解,所以我这边就先
假设防守失分这一个事件能够被数据
完全地
量化出来。
虽然我这边是假设防守失分能够量化,不过我还是得提醒你一个很重要
的观念,
统计学家是用很有逻辑的观念与数学模型或数学程式来告诉读
者,他们如何去把一个很难量化的事件给量化出来,但是很遗憾地,我
从头到尾都没看到你告诉大家要如何去把防守失分这个事件给完美地量
化出来。
不过没关系,如果你不想说服大家你是如何把防守失分这个事件给量化
出来,那也没关系,我们先跳过这个问题,继续往下面讨论下去。
当你确定能够把你要研究的事件给量化起来时,你接着该做什麽呢?
第二,选取你要研究的母群体,然後利用这些母群体去找出一个方程式
来表达母群体里面的每个事件,然後再告诉大家你的 R(相关系数)平
方是多少,让大家知道你这个方程式是否有到达一定的效力,如果这些
都做完了,这就是你所选的母群体所组织出来的一个模型。
接着你应该就是要拿这个模型来预测了吧?
但是你现在要怎麽说服大家你这个模型真的可以预测呢?
因为预测的目
标并不是你原本所取的那些母群体,而是不属於原来母群体的新事件,
那要怎麽办呢?
第三,因为你现在想做的是预测这件事,那你应该先让大家知道这个模
型在预测时到底有多大的效力,这个时候你可以拿这个模型先去预测一
些走势比较正常的新事件(就是除了那些离群值以外的新事件),等到
你证明给大家看说这个模型的确是能预测新事件走势时,那你再进一步
来预测所谓的离群值新事件。
举个例子,在这个讨论串里, 你如果想要预测 Celtics 失分这个你认
为的离群值新事件,那你应该先把你的统计模型拿去预测本季其他球队
失分的这些新事件(当然要先扣除左端与右端的离群值),等到你的模
型的确能够精准地预测这些正常走势时的新事件时,大家才会相信你这
个模型的确是能够应用在预测新事件。
接着就是要预测新事件中离群值的走势了吧?
嗯,这边你可以开始预测新事件中的离群值了,不过我发觉你口口声声
把统计学挂在嘴巴上,可是就连基本的统计学核心观念都没有,我真的
很好奇你到底是真的懂统计学还是你根本不懂统计学。
没错!你现在可以预测离群值,只是我看了一下你前面的文章,感觉你
实在是有点好笑耶。
你拿统计学来预测新事件难道不用附上
信赖区间吗?你连基本的 95 %
信赖区间都没有列出来,你要让大家怎麽相信你的预测啊?
我真怀疑你这样搞真的是在预测吗?我头一次看到有人用统计学预测新
事件而且没有附上信赖区间,最让我吃惊的是,
没有信赖区间的预测值
竟然能够让你讲话那麽大声,我真的怀疑你学的是哪个版本的统计学?
我翻了一下你前面的文章,我发觉你根本就是在鬼打墙,
你须要做的不
是举一大堆完全不相关的例子来证明你的篮球统计学是对的,你须要做
的是实际去做一个模型出来,然後按照上面我所讲的过程去预测,你根
本不用浪费那麽多时间举一堆没有相关性的例子,你只要把你的模型建
立出来,质疑的人就只能质疑你的模型对错而已,这麽简单的道理,我
真怀疑满口统计学的你竟然不懂?
统计学家做的不是无穷举例的水磨功夫,他们是建立一个模型让质疑的
人针对模型去质疑,而只要他们的模型有错,那就完全不用去看他们的
结论了。
就算 Celtics 的防守失分最後会上修, 我还是敢站出来指出你的错误
,因为我质疑的不是你的结论,而是你拿来论证的方法与推论过程。
在你还没有办法做到符合科学步骤的推理过程时,希望你不要再把科学
与统计学挂在嘴巴上,因为那只是
假科学,那只是
假统计学而已。
等你真的能够做到科学与统计学的步骤时,那你再来跟其他人说你使用
的是科学,你使用的是统计学。不然的话,你也只是假科学与统计学之
名,进行谎言的包装来误导板友而已。
我方法都丢给你了,既然你口口声声想要用篮球统计学来预测 Celtics
失分,那你就做给大家看吧!这会比你举什麽网球的例子、棒球的例子
、足球的例子都还要有意义,在你建立起你的模型来解释你的理论前,
你的任何举例都没有任何说服力。
你口口声声把统计学挂在嘴上,你仔细想一想,我上面讲的步骤你做到
几个呢?
--
http://blog.pixnet.net/IZXNHSO
个人 Blog,欢迎参观指教。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 118.168.12.98
1F:推 jkw552403:推一个 专业战文 01/04 00:03
2F:嘘 GoBay:这已经跟NBA没有关系了,要战寄信去战 01/04 00:03
3F:推 ForeverOrz:战到现在juby讲的感觉比较有道理-.- 01/04 00:03
4F:→ UncleGarlic:收手吧 01/04 00:04
5F:推 XI:好像已经战很久了 01/04 00:04
6F:→ TheDream:jubt27 要使用统计学请按照步骤来。 01/04 00:04
7F:→ sanpaul:你现在打这篇 已经不算是讨论了 算是挑毛病差不多了= = 01/04 00:04
8F:→ TheDream:上面打错,是juby27。 01/04 00:05
9F:推 rangertsao:推~~在我看来 j版友根本是在传教 01/04 00:04
10F:推 ARODisGod:好像在看教科书喔 不过还是要推 01/04 00:05
11F:推 Caster:大魔王出声了 来人搬张椅子过来 01/04 00:04
12F:→ TheDream:juby27 的模型有问题,说我挑毛病? 01/04 00:05
13F:推 Price:喔 ... 个人认为这已经太离题了,建议 TheDream 多聊聊数据 01/04 00:06
14F:推 chuehyeh:我推美梦大~ 01/04 00:06
15F:→ Price:背後的东西吧,这才是广大版友(包括我)想看的喔 ~ 01/04 00:06
16F:推 Drexler:juby上一篇有点呛的文章把梦大惹火了Orz 01/04 00:07
17F:推 rangertsao:被呛讨回来也是正常的啦 01/04 00:07
18F:→ Price:研究攻守数据的确很有意思,但攻守数据的来源仍然是场上的比 01/04 00:07
19F:→ TheDream:juby27 想聊统计学,我就陪他聊一下啊! 01/04 00:08
20F:推 ForeverOrz:..哪门子的惹火 他怀疑他的模型也是你这篇才新跳出来的 01/04 00:08
21F:推 ericlov:我推你的勇敢与坚持,以及从来就不迂回的直接(  ̄ ﹁ ̄)b 01/04 00:07
22F:推 tiberian:数据不一定要全用统计的方法来看吧,模型也不是j大作的啊 01/04 00:07
23F:→ TheDream:Price 大你说的东西等我有更多了解时,我才敢出来谈。 01/04 00:08
24F:→ ForeverOrz:之前那篇明明只是在讲不应该以统计学来看 01/04 00:08
25F:→ Price:赛,还是先把焦点放在比赛本身吧! 01/04 00:08
26F:→ TheDream:不是juby27做的?那怎麽预测呢?这是哪门子统计学? 01/04 00:09
27F:→ TheDream:juby27 想用统计学,那就不要半调子。 01/04 00:10
28F:→ Price:客气啦~ 你已经懂很多罗,不过就算懂的不够多,也还是可以聊 01/04 00:09
29F:推 hardaway:好想大推......................... 01/04 00:10
30F:推 rahim1211:推文里头好多资深板友XD 01/04 00:10
31F:→ tiberian:都是用82games上面的东西吧,只是他认为那个数据有点夸张 01/04 00:10
32F:→ TheDream:他想预测,那他的模型在哪里我看不到,只看到嘴炮吧! 01/04 00:11
33F:→ tiberian:但是讨论似乎是走错方向了,他想用常理来推断却捡用不太 01/04 00:11
34F:推 DonNelson:推,这个好。 01/04 00:12
35F:推 carbineer25:连推文都有原PO的踪迹^^ 01/04 00:12
36F:→ tiberian:洽当的例子,统计并不好做啊,82games并没有开放数据让大 01/04 00:12
37F:→ TheDream:juby27 想预测就把自己的模型建立起来再说!不然只是嘴炮 01/04 00:13
38F:→ tiberian:家自由的去玩,那要怎麽去作呢 01/04 00:13
39F:→ TheDream:怎麽做为什麽要问我?是我拿数据来预测吗? 01/04 00:14
40F:→ tiberian:何必火气这麽大,他想说塞队防守不如数据上那麽惊人而已 01/04 00:15
41F:→ Altair: 说真的 根本就是量化vs.质化 01/04 00:16
42F:→ Altair: 质化的人说量化研究不可信 01/04 00:16
43F:推 hardaway:的确,一开始莫名其妙跳出来预测 Celtics 的失分会上修的 01/04 00:16
44F:→ TheDream:我重申一点,要用统计学,就请不要半调子。谢谢! 01/04 00:16
45F:→ hardaway:是 jubu27.. 01/04 00:16
46F:推 Altair: 量化的人说质化在练肖话 End 01/04 00:16
47F:嘘 CaCHookaMan:整篇我没看到跟nba有关的东西 01/04 00:14
48F:推 rangertsao:问题是量化的那边说的话又笼统模糊还语带指责.... 01/04 00:17
49F:推 CKnightalker:信赖区间ing 推一个XD 01/04 00:18
50F:推 tim1112:数据分析也是NBA的一部份,何况主题一直绕着塞尔提克啊 01/04 00:19
51F:嘘 lawrence0000:整篇我没看到跟nba有关的东西 01/04 00:19
52F:推 brianhuang15:我要推这篇 01/04 00:20
53F:推 jack18262:不推不行 01/04 00:21
54F:推 tiberian:一些指标本来就是设计给人看的,讨论一下没有什麽关系 01/04 00:20
55F:推 rangertsao:嘘文的是连讨论串都没看就来乱入的吧~~ 01/04 00:21
56F:推 AQUANGEL:息怒阿~~ 01/04 00:22
57F:→ joumay:不推不嘘, 只想到以前在盈月看到的老怪物(统计系教授)..... 01/04 00:23
58F:→ joumay:顺带一提-量化必须考到尺度的问题,非连续尺度该怎麽做呢... 01/04 00:24
59F:嘘 crazyvsjay:....NBA I love this game 01/04 00:32
60F:推 niubert:jubu讲的是均值回归现象,基本上很合理,你真的了解统计吗? 01/04 00:39
61F:推 voon:这个好...我喜欢 01/04 00:41
62F:→ TheDream:楼上的知道母群体来源不同吗? 01/04 00:41
63F:→ TheDream:我指的是 niubert 01/04 00:41
64F:推 ader302:想讨论可以私下 已经离题了站起来 01/04 00:42
65F:推 niubert:不同球队一样视为NBA的母群所抽样的样本啊,不然勒 01/04 00:42
66F:→ TheDream:.......juby27 用以前三年的母群体还预测今年的Celtics 01/04 00:43
67F:→ TheDream:这叫母群体一样,我也真是佩服你。 01/04 00:44
68F:→ niubert:以年份当X轴,一样可以预测啊,既然是NBA球队,一样是母群 01/04 00:44
69F:→ niubert:所抽样出来的 01/04 00:45
70F:→ jjackk:以数据来说,judy的母群体比较大,不过两位都说分析的很好 01/04 00:43
71F:推 kuromo:就算是回归也得要有模型去跑才行,不同的母体有不同的分配啊 01/04 00:45
72F:→ niubert:并不是Dream说的有错,而是他的对不代表JUBU的错 01/04 00:46
73F:→ kuromo:好吧,来个假设检定呗,天气冷,大家早点睡吧 01/04 00:49
74F:推 trh:看到楼上不小心笑了出来... 01/04 00:56
75F:推 kaede0711:这一系列的专业程度已经远超过一般水准@@ 01/04 00:58
76F:→ shch:这篇讲很清楚阿... j版友套了统计来预测但又不走常规步骤 01/04 01:06
77F:推 zomzom:我觉得THE DREAM说的没错 拿出东西来 避免质疑 01/04 01:09
78F:→ shch:所以结论并不能由他的过程推出 (即便是对的结论) 01/04 01:07
79F:推 tzar:原波对统计似乎也没有很明白,篮球统计比一般统计更复杂 01/04 01:10
80F:→ tzar:其实在做这样的预测时,看得是统计方法的Power,不是信赖区间 01/04 01:12
81F:推 zomzom:既然很复杂 那JUBU怎麽预测? 01/04 01:12
82F:→ tzar:你谈到关於统计的"重点",对篮球统计而言都不是最重要的问题 01/04 01:13
84F:推 shch:tzar兄 P-value还是很重要的观念 Power是看这模型的适用性 01/04 01:21
85F:→ shch:也许不同模型 P-value可以修正cutoff 但总还是该有个P-value 01/04 01:22
86F:→ TheDream:你这些话不应该拿来跟我讲,请跟要预测的人讲,谢谢。 01/04 01:24
87F:推 tzar:嗯,那是当然. P值不显着这个MODEL也不用提了 01/04 01:24
88F:→ tzar:嗯,我对预测的那一位没什麽意见,基本上他只是一个想法 01/04 01:25
89F:→ TheDream:把你想说的话拿去对你应该向他说的人说,谢谢。 01/04 01:25
90F:推 danieljaw:有人愿意提供专业意见 到底有哪里不妥? 01/04 01:26
91F:→ tzar:我想说的对象就是你呀,我觉得你的做法很好,但不是很精确 01/04 01:26
92F:→ TheDream:该做的精确的人不应该是我,是要预测的人,谢谢。 01/04 01:27
93F:推 ando:两位的文章真的都很有见解 可是感觉好像有点参入情绪在其中了 01/04 01:27
94F:→ tzar:信赖区间,p值,POWER,还有MODEL本身,信赖区间是最不重要的东西 01/04 01:27
95F:→ ando:很可惜的.... 01/04 01:27
96F:→ tzar:嗯,我只是针对你统计的说法,没有什麽特别的意思~拍谢 01/04 01:28
97F:→ TheDream:ando 要不要看看是谁的口气先变的这麽差的? 01/04 01:28
98F:→ TheDream:还有 tzar 请看清楚我说的,统计学不是我的专业,我只是 01/04 01:29
99F:→ TheDream:提出一些 juby27 该努力去论证的方向。 01/04 01:30
100F:推 tzar:是的,我当然懂,我们都不是统计学专家 01/04 01:30
101F:→ tzar:我也赞成你指出好的方向给J板友参考 01/04 01:31
102F:→ TheDream:那你为什麽推文说我对统计学不明白?我自认为没有像juby2 01/04 01:31
103F:→ tzar:不过我只是想提醒你,你对统计的说法似乎太果断 01/04 01:32
104F:→ TheDream:7那样滥用统计学,请你先看清楚是谁滥用统计学,谢谢。 01/04 01:32
105F:→ tzar:我不想比较你和别人,我是针对你本篇的内容推文的 01/04 01:32
106F:→ TheDream:果断也罢,我本来就是指出方向而已,你不觉得你这些话更 01/04 01:32
107F:→ TheDream:应该拿去对滥用统计学的 juby27 说吗? 01/04 01:33
108F:→ tzar:我只是单纯回应你本篇的内容中,关於统计的部分 01/04 01:33
109F:→ tzar:我不觉得.懂统计学的人就知道他的预测方法不好 01/04 01:34
110F:→ TheDream:我不打算做预测,所以我实在不懂你跟我讲这些要做什麽。 01/04 01:34
111F:→ tzar:不懂的也看不出来他做的有什麽不对.所以跟J板友讲没意义 01/04 01:34
112F:→ tzar:我就是单纯要跟你说,你想用对方统计的弱点攻击别人 01/04 01:35
113F:嘘 jeei:哇,教学勒... 01/04 01:35
114F:→ tzar:就要考虑到自己的统计是不是有弱点,若有,就不要太果断 01/04 01:35
115F:→ TheDream:呵呵,原来我提出的步骤错的juby27来的大,所以你才来推 01/04 01:36
116F:→ TheDream:文指正我啊。真是受教了,少陪了。 01/04 01:36
117F:→ tzar:否则你的说法也跟他一样,是不值得信赖的 01/04 01:36
118F:→ tzar:我没有这样说,TheDream. 你不要硬把自己跟J板友扯在一起 01/04 01:37
119F:→ ted0217:TheDream已经火起来了,不过我想tzar是没有恶意的 01/04 01:38
120F:推 shch:大家消消火气 Boston这边零下十三度 冷死我了 (≧<>≦) 01/04 01:39
121F:推 zedan:thedream好热血啊 01/04 01:40
122F:推 kuromo:不过老实说,juby如果要用数据,的确要把自己的模型拿出来 01/04 01:41
123F:→ kuromo:不然其实是不能说是统计,只是自己主观的拿些资料用而已 01/04 01:42
124F:→ kuromo:S大,暴风雪走了没,再待几天,我看原油都要破$110了 01/04 01:43
125F:推 danieljaw:既然有人先提到数据跟统计 那就得回应一下吧??? 01/04 01:57
126F:推 AKgino:juby大用数据来佐证自己的推论并没错阿~ 01/04 02:07
127F:→ AKgino:况且也不可能写出一个能百分百预测的模型~ 01/04 02:08
128F:推 shch:後天会回暖到零度 但是前天还是五度 突然一天降十度受不了 01/04 02:08
129F:推 maisonette:judy27的方法不是不行 但是对於C's这样一个相对於近几 01/04 02:40
130F:→ maisonette:年差异甚大的队伍而言 会产生类似Lucas critique的效果 01/04 02:42
131F:推 shch:刚想到要验证可以简单做些数据 把前几年防守排名好的队伍 01/04 02:52
132F:→ shch:82场切割成三份 只要证明局部场次有特别高防守表现 01/04 02:53
133F:→ shch:但是整体又会趋於稳定平均就可以说明赛程和样本只有33%有影响 01/04 02:54
134F:→ shch:这样就比较不会流於空谈 因为别人也发生过局部防守表现特好 01/04 02:56
135F:→ shch:不过这样也不足以归因於为 和强队交手场次不够 01/04 02:58
136F:推 shadowwind:TheDream的主观意识真的很强 tzar有说错吗? 01/04 03:15
137F:→ shadowwind:为什麽不能想想他说的是什麽意思 而一味地将矛头转回 01/04 03:15
138F:→ shadowwind:juby27 有料令人激赏 但你的态度实在不敢领教 01/04 03:16
139F:→ shadowwind:口口声声说自己统计不够专业 那为什麽无法接受别人对你 01/04 03:17
140F:→ shadowwind:在统计上的质疑 不是自打嘴巴吗? 01/04 03:18
141F:推 rangertsao:楼上根本搞不清楚状况 01/04 03:56
142F:推 Diawara:推这个 01/04 08:52
143F:推 Diawara:应多看几场比赛再来做深入评论 看统计数据有很多盲点 01/04 08:55
144F:推 Caster:大推啊 01/04 09:33
145F:推 dollow333:有学过统计的才知道你这篇中肯,话说我还要考这科阿 01/04 09:59
146F:推 Chungyiang:口气先变差的真的是juby 就此打住吧 01/04 12:11
147F:→ himem:写得这麽详细的话,投稿论文就好了啊,干嘛来打B -_- 01/04 12:20
148F:→ himem:这篇的要求太过强人所难 01/04 12:24
149F:推 danieljaw:如果不是对方要扯到统计学专业 大概也不会变成这样吧? 01/04 13:12
150F:推 zerohsu:太猛了 我已经跳过文章了 两位都太强了 01/04 13:53
151F:→ himem:这篇文章有历史群组某战神的味道 (茶) 01/04 14:47
152F:→ existfor:我怎麽看都觉得j大上篇口气不到差 他只是不解被质疑的点 01/04 16:17
153F:推 SuWeiLin:好文,不过口气如果能更和缓些一定更好,加油吧! 01/05 02:22
154F:推 charlie99999:推 01/05 12:10
155F:嘘 koking730929:关於模型的建立与效力跟预测力的解释完全错误 01/05 17:22