Re: [请益] 网路上的评分

时间Sun Apr 19 18:45:02 2009

※ 引述《size (金色曙光)》之铭言： : ※ 引述《StaticVortex ()》之铭言： : : 例如在 youtube 等网站, 各项资源都开放网友评分, 而且即时显示结果, : : 我觉得这类型的评分机制可能有些问题. : : 首先, 什麽时候会想去评分? : : 就我个人的经验, 通常只有我认为极好或极坏的资源才会想去评分, 否则浏览过便算了. : : 换句话说, 这类型人在评分时绝对不会评中庸的分数. : : 单看一项资源, 如果评分者全是这类人, 那麽评量结果应该会往边界偏移吧? : 中庸者不评分也不会影响你把极端的分数都平均完 : 还是能看到真实的分数是偏高还偏低 [支持多或反对多] 我的意思比较像这样: 考虑某物件, 有多人阅览过, 於是每人对此物件有个评价, 假设以一项五等第评分表示, 目标是想得到此评价分布. 但是如果所有阅览人都是原文中所提的那类人, 得到的评价分布便非上述所希望得到的. 假设留下评分比例对等第的分布, 也就是取样的偏差如下. 口口 | 留下评分的比例口口口口 | 口口口口 | 口口口口 | 口口口口口 | 评价 -++++++++++--+ -2 0 +2 -1 +1 那麽原来长相如左下的分布, 会偏移成如右下. 口 | 口 | 口 | 口口 | 口口 | 口口口口口 | 口口口口口口 | 口口口口口口口 | 口口口口口口口口 | 口口口口口口口口口 | 口口口口口 -++++++++++--+--++++++++++- 数格子可以发现在此例中平均由 + 11/27 ~ + 0.4074 偏移成 + 10/20 = + 0.5000 或者考虑另一个例子. 取 y > 0 , x: -2 ~ +2 , 取样偏差 x^2 , 原分布 y = ( 1-(x-1)^2 )*3/4 偏移成 y = ( 2x^3 - x^4 )*5/8 , 平均由 x = 1 偏移成 x = 4/3 . : : ( 题外话, 在此例中评量者是自愿去评分的, 评量者可以决定要不要评量某物件. : : 与此相对的, : : 如果要求评量者对每项物件皆必须评分, 或更甚至要求具名或留下相关具体资料, : : 应该可以想见, 单项物件的评量结果会往中庸靠拢吧? ) : 这就和投票率一样对这件事的在意程度低可有可无 : 给的回答就会是'还好,随便' 这些人通常也是不投票的人 : 去评分不但没意义反而很好操作 : 你问赞成的人举手他们没反应操作成反对 : 问反对的人举手一样没反应操作成赞成 : 而这些人通常也不会是消费者顾客群 : 所以问卷调查时这类人的意见就变得不重要 : 常态分布2-6-2里会影响事情发展的反而是两端的人原文括号中的情况, 我原来的想法有些如你所说的一样, 取得的样本掺了多余的数据. 原文括号对这些多余数据评分分布的假设大概如下. | 口 | 口 | 口口口 | 口口口口口 | 评价 -++++++++++--+ -2 0 +2 -1 +1 那麽原来长相如左下的分布, 会被灌水成如右下. | 口 | 口口 | 口口 | 口口口 | 口口口 | 口口口口 | 口口口口口口口口 | 口口口口口口口口 | 口口口口口口口口 | 口口口口口口口口口口 | 口口口口口口口口口口 | 口口口口口 -++++++++++--+--++++++++++- 数格子可以发现在此例中平均由 + 11/27 ~ + 0.4074 被灌成 + 11/37 ~ + 0.2973 虽然实际上, 天晓得那些偏差精确是长怎样, 不过万一真的知道, 很容易就能还原. : : 其次, 评分结果公开的影响. : : 最明显的便是影响到点阅率, 不过另外也还有一种可能. : : 举个例, 有时候看到某项喜爱的物件评价却被低估, 这时候多少会评高分一点吧? : : 换句话说, 评分者的真实评价并非表现在其评分上, : : 而是表现在令评分後的结果尽量靠近评分者的真实评价. : : 统计上要处理第一项问题的方法应该不难想像, : : 第二项问题要如何处理呢? : : 上述之瑕疵应该在很多层面皆会遇上吧, 一般而言有必要去处理吗? : 双盲实验就是防预期心理的 : 资讯公开的活动人就会参考彼此的反应 : 抽样统计即使去除这些变因却会反而变得不准 : 因为现实里的人又不是双盲只想要知道理论性的结果 : 那可以去处理只是就不符合现实了.. 不太了解为何除去这些变因反而会不准? 你的意思是否比较像是, 评价者会受前人评价而调整自己对此物件的评价, 而评价时的评分便是自己调整後的对此物件的评价, 因此该评分便相当於评价者的真实评分, 而在受前人评价影响前, 评价者心中的评分在此後不存在, 故除去这些变因企图寻求先前评价者心中的评分毫无意义. 也许大部分的例子里, 要求每个人的评价相互独立是不可能的, 不过在原文的例子里, 虽然评分会受前人影响, 但该评分并非表示评价者的真实评分, 那麽除去此因素以寻求真实评价的分布应该不致於无意义吧? 暂时先接受吧. 假设原文所提的情况, 行为模式如下所述. 若 Z+1 > |当前评分平均 - 当前评分者之真实评价| >= Z 则当前评分者评分时往另一侧加 Z 或加至边界则考虑同样分布不同次序. 原平均 + 11/27 ~ + 0.4074 人次/ 22 | -2 -2 -1 -1 -1 -1 -1 0 0 真实评价 21 | -2 -2 0 -1 -1 -1 -1 +1 0 评分 20 | -2 -2 -1.3 -1.3 -1.2 -1.2 -1.1 -0.9 -0.8 平均 19 | 18 | 0 0 0 +1 +1 +1 +1 +1 +1 7121727 | 0 0 0 +2 +2 +2 +2 +1 +1 6111626 | -0.7 -0.6 -0.6 -0.4 -0.2 -0.1 +0.1 +0.1 +0.2 5101525 | 2 4 91424 | +1 +1 +1 +1 +2 +2 +2 +2 +2 1 3 81323 | +1 +1 +1 +1 +2 +2 +2 +2 +2 -++++++++++--+ +0.2 +0.3 +0.3 +0.3 +0.4 +0.5 +0.5 +0.6 +0.6 (+0.6296) 27 | -2 +2 -1 +1 0 -2 +2 -1 +1 26 | -2 +2 -2 +2 0 -2 +2 -2 +2 25 | -2 +0 -0.7 +0 +0 -0.3 +0 -0.3 +0 24 | 23 | 0 +2 -1 +1 0 +2 -1 +1 0 20222119 | 0 +2 -2 +2 -1 +2 -2 +1 0 16181715 | +0 +0.2 +0 +0.2 +0.1 +0.2 +0.1 +0.1 +0.1 12141311 | 6 810 9 7 | +2 -1 +1 0 +1 +1 +1 +1 +1 1 3 5 4 2 | +2 -2 +1 0 +1 +1 +1 +1 +1 -++++++++++--+ +0.2 +0.1 +0.1 +0.1 +0.2 +0.2 +0.2 +0.3 +0.3 (+0.2963) 15 | +2 +2 +2 +2 +2 +1 +1 +1 +1 14 | +2 +2 +2 +2 +2 0 +1 +1 +1 13 | +2 +2 +2 +2 +2 +1.7 +1.6 +1.5 +1.4 12 | 11 | +1 +1 +1 +1 +1 +1 0 0 0 252010 5 | +1 +1 +1 +1 +1 +1 -1 -1 -1 2419 9 4 | +1.4 +1.4 +1.3 +1.3 +1.3 +1.3 +1.1 +1 +0.9 2318 8 3 | 272217 7 2 | 0 0 -1 -1 -1 -1 -1 -2 -2 262116 6 1 | 0 0 -2 -2 -2 -2 -2 -2 -2 -++++++++++--+ +0.8 +0.8 +0.7 +0.5 +0.4 +0.3 +0.2 +0.2 +0.1 (+0.0741) 知道真实评价的分布及评分者行为模式, 可以推得结果平均的上下限, 但若只知评分者行为模式及评分者评分, 要反推真实评价该如何办呢? 如果不知道次序应该完全没辄吧? 如果知道次序的话, 大概可以如下示意图这般想像, 前(Z-1)人前(Z-1)人平均平均 :: :: :: :: 口第Z人口口口评分口口口口第Z人口口口评分口口口品口口口品品口口口品品品 -+++++++++++++++- -+++++++++++++++- 将第Z人评分拆为从前(Z-1)人平均到第Z人评分间的某个分布, 逆着次序剥回去. 或者是乾脆在每个评分者评分後, 即时显示的平均评分中便实作了上述的修改. 虽然实际上细节很难推估, 天晓得行为者模式究竟如何, 天晓得要修改成怎样的分布. 不过究竟有没有什麽好方法来处理这类的问题呢? 包括事件前事件时事件後的手段. 一般网站上的评分有考虑这些问题吗? 虽然很难期待网友评分的精确度, 不过如果有考虑这些问题, 多少能稍微提昇一些准确率吧, 多少有些好处吧? 这类问题在很多层面都会遇到吧, 有没有什麽例子呢? --

※ 发信站: 批踢踢实业坊(ptt.cc) ◆ From: 114.42.16.153

1^F：推 xiaoa:我觉得你好认真 >_< 我都把评分当参考,自己用过才知道好坏 04/19 18:52

2^F：推 bonniekiss2:认真推 04/19 19:27

3^F：推 zhaomine801:专业推! 04/19 21:29

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

ask-why 板

Re: [请益] 网路上的评分

热门看板

赞助商连结