作者StaticVortex ()
看板ask-why
标题Re: [请益] 网路上的评分
时间Sun Apr 19 18:45:02 2009
※ 引述《size (金色曙光)》之铭言:
: ※ 引述《StaticVortex ()》之铭言:
: : 例如在 youtube 等网站, 各项资源都开放网友评分, 而且即时显示结果,
: : 我觉得这类型的评分机制可能有些问题.
: : 首先, 什麽时候会想去评分?
: : 就我个人的经验, 通常只有我认为极好或极坏的资源才会想去评分, 否则浏览过便算了.
: : 换句话说, 这类型人在评分时绝对不会评中庸的分数.
: : 单看一项资源, 如果评分者全是这类人, 那麽评量结果应该会往边界偏移吧?
: 中庸者不评分也不会影响 你把极端的分数都平均完
: 还是能看到真实的分数是偏高还偏低 [支持多或反对多]
我的意思比较像这样:
考虑某物件, 有多人阅览过, 於是每人对此物件有个评价,
假设以一项五等第评分表示, 目标是想得到此评价分布.
但是如果所有阅览人都是原文中所提的那类人, 得到的评价分布便非上述所希望得到的.
假设留下评分比例对等第的分布, 也就是取样的偏差如下.
口 口 | 留下评分的比例
口口 口口 |
口口 口口 |
口口 口口 |
口口口口口 |
评价 -++++++++++--+
-2 0 +2
-1 +1
那麽原来长相如左下的分布, 会偏移成如右下.
口 |
口 |
口 | 口
口 | 口
口 | 口
口口口口 | 口口
口口口口 | 口 口口
口口口口 | 口 口口
口口口口口 | 口口 口口
口口口口口 | 口口口口口
-++++++++++--+--++++++++++-
数格子可以发现在此例中平均由 + 11/27 ~ + 0.4074 偏移成 + 10/20 = + 0.5000
或者考虑另一个例子.
取 y > 0 , x: -2 ~ +2 , 取样偏差 x^2 ,
原分布 y = ( 1-(x-1)^2 )*3/4 偏移成 y = ( 2x^3 - x^4 )*5/8 ,
平均由 x = 1 偏移成 x = 4/3 .
: : ( 题外话, 在此例中评量者是自愿去评分的, 评量者可以决定要不要评量某物件.
: : 与此相对的,
: : 如果要求评量者对每项物件皆必须评分, 或更甚至要求具名或留下相关具体资料,
: : 应该可以想见, 单项物件的评量结果会往中庸靠拢吧? )
: 这就和投票率一样 对这件事的在意程度低 可有可无
: 给的回答就会是'还好,随便' 这些人通常也是不投票的人
: 去评分不但没意义 反而很好操作
: 你问赞成的人举手 他们没反应 操作成反对
: 问反对的人举手 一样没反应 操作成赞成
: 而这些人通常也不会是消费者 顾客群
: 所以问卷调查时这类人的意见就变得不重要
: 常态分布2-6-2里 会影响事情发展的反而是两端的人
原文括号中的情况, 我原来的想法有些如你所说的一样, 取得的样本掺了多余的数据.
原文括号对这些多余数据评分分布的假设大概如下.
|
口 |
口 |
口口口 |
口口口口口 |
评价 -++++++++++--+
-2 0 +2
-1 +1
那麽原来长相如左下的分布, 会被灌水成如右下.
| 口
| 口
口 | 口
口 | 口口
口 | 口口
口 | 口口口
口 | 口口口口
口口口口 | 口口口口
口口口口 | 口口口口
口口口口 | 口口口口口
口口口口口 | 口口口口口
口口口口口 | 口口口口口
-++++++++++--+--++++++++++-
数格子可以发现在此例中平均由 + 11/27 ~ + 0.4074 被灌成 + 11/37 ~ + 0.2973
虽然实际上, 天晓得那些偏差精确是长怎样, 不过万一真的知道, 很容易就能还原.
: : 其次, 评分结果公开的影响.
: : 最明显的便是影响到点阅率, 不过另外也还有一种可能.
: : 举个例, 有时候看到某项喜爱的物件评价却被低估, 这时候多少会评高分一点吧?
: : 换句话说, 评分者的真实评价并非表现在其评分上,
: : 而是表现在令评分後的结果尽量靠近评分者的真实评价.
: : 统计上要处理第一项问题的方法应该不难想像,
: : 第二项问题要如何处理呢?
: : 上述之瑕疵应该在很多层面皆会遇上吧, 一般而言有必要去处理吗?
: 双盲实验就是防预期心理的
: 资讯公开的活动人就会参考彼此的反应
: 抽样 统计即使去除这些变因 却会反而变得不准
: 因为现实里的人又不是双盲 只想要知道理论性的结果
: 那可以去处理 只是就不符合现实了..
不太了解为何除去这些变因反而会不准?
你的意思是否比较像是,
评价者会受前人评价而调整自己对此物件的评价,
而评价时的评分便是自己调整後的对此物件的评价,
因此该评分便相当於评价者的真实评分,
而在受前人评价影响前, 评价者心中的评分在此後不存在,
故除去这些变因企图寻求先前评价者心中的评分毫无意义.
也许大部分的例子里, 要求每个人的评价相互独立是不可能的,
不过在原文的例子里, 虽然评分会受前人影响, 但该评分并非表示评价者的真实评分,
那麽除去此因素以寻求真实评价的分布应该不致於无意义吧?
暂时先接受吧.
假设原文所提的情况, 行为模式如下所述.
若 Z+1 > |当前评分平均 - 当前评分者之真实评价| >= Z
则 当前评分者评分时往另一侧加 Z 或 加至边界
则考虑同样分布不同次序. 原平均 + 11/27 ~ + 0.4074
人次/
22 | -2 -2 -1 -1 -1 -1 -1 0 0 真实评价
21 | -2 -2 0 -1 -1 -1 -1 +1 0 评分
20 | -2 -2 -1.3 -1.3 -1.2 -1.2 -1.1 -0.9 -0.8 平均
19 |
18 | 0 0 0 +1 +1 +1 +1 +1 +1
7121727 | 0 0 0 +2 +2 +2 +2 +1 +1
6111626 | -0.7 -0.6 -0.6 -0.4 -0.2 -0.1 +0.1 +0.1 +0.2
5101525 |
2 4 91424 | +1 +1 +1 +1 +2 +2 +2 +2 +2
1 3 81323 | +1 +1 +1 +1 +2 +2 +2 +2 +2
-++++++++++--+ +0.2 +0.3 +0.3 +0.3 +0.4 +0.5 +0.5 +0.6 +0.6 (+0.6296)
27 | -2 +2 -1 +1 0 -2 +2 -1 +1
26 | -2 +2 -2 +2 0 -2 +2 -2 +2
25 | -2 +0 -0.7 +0 +0 -0.3 +0 -0.3 +0
24 |
23 | 0 +2 -1 +1 0 +2 -1 +1 0
20222119 | 0 +2 -2 +2 -1 +2 -2 +1 0
16181715 | +0 +0.2 +0 +0.2 +0.1 +0.2 +0.1 +0.1 +0.1
12141311 |
6 810 9 7 | +2 -1 +1 0 +1 +1 +1 +1 +1
1 3 5 4 2 | +2 -2 +1 0 +1 +1 +1 +1 +1
-++++++++++--+ +0.2 +0.1 +0.1 +0.1 +0.2 +0.2 +0.2 +0.3 +0.3 (+0.2963)
15 | +2 +2 +2 +2 +2 +1 +1 +1 +1
14 | +2 +2 +2 +2 +2 0 +1 +1 +1
13 | +2 +2 +2 +2 +2 +1.7 +1.6 +1.5 +1.4
12 |
11 | +1 +1 +1 +1 +1 +1 0 0 0
252010 5 | +1 +1 +1 +1 +1 +1 -1 -1 -1
2419 9 4 | +1.4 +1.4 +1.3 +1.3 +1.3 +1.3 +1.1 +1 +0.9
2318 8 3 |
272217 7 2 | 0 0 -1 -1 -1 -1 -1 -2 -2
262116 6 1 | 0 0 -2 -2 -2 -2 -2 -2 -2
-++++++++++--+ +0.8 +0.8 +0.7 +0.5 +0.4 +0.3 +0.2 +0.2 +0.1 (+0.0741)
知道真实评价的分布及评分者行为模式, 可以推得结果平均的上下限,
但若只知评分者行为模式及评分者评分, 要反推真实评价该如何办呢?
如果不知道次序应该完全没辄吧?
如果知道次序的话, 大概可以如下示意图这般想像,
前(Z-1)人 前(Z-1)人
平均 平均
:: ::
:: ::
口 第Z人 口
口 口 评分 口
口 口 口 第Z人
口 口 口 评分
口 口 口 品
口 口 口 品品
口 口 口品品品
-+++++++++++++++- -+++++++++++++++-
将 第Z人评分 拆为从 前(Z-1)人平均 到 第Z人评分 间的某个分布, 逆着次序剥回去.
或者是乾脆在每个评分者评分後, 即时显示的平均评分中便实作了上述的修改.
虽然实际上细节很难推估, 天晓得行为者模式究竟如何, 天晓得要修改成怎样的分布.
不过究竟有没有什麽好方法来处理这类的问题呢?
包括事件前事件时事件後的手段.
一般网站上的评分有考虑这些问题吗?
虽然很难期待网友评分的精确度,
不过如果有考虑这些问题,
多少能稍微提昇一些准确率吧,
多少有些好处吧?
这类问题在很多层面都会遇到吧,
有没有什麽例子呢?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 114.42.16.153
1F:推 xiaoa:我觉得你好认真 >_< 我都把评分当参考,自己用过才知道好坏 04/19 18:52
2F:推 bonniekiss2:认真推 04/19 19:27
3F:推 zhaomine801:专业推! 04/19 21:29