以文本方式查看主题 - 游子吟论坛 (http://www.youziyin.com/bbs/index.asp) -- 华清杯赛 (http://www.youziyin.com/bbs/list.asp?boardid=9) ---- 对华清杯打分的一些统计分析(纯技术贴) (http://www.youziyin.com/bbs/dispbbs.asp?boardid=9&id=9395) |
-- 作者:emptyrain -- 发布时间:2009/6/23 12:45:17 -- 对华清杯打分的一些统计分析(纯技术贴)
1。谜题打分的“争议程度”
由于大家对谜的偏好不同(有道是“八十一口味,十八一口味”),打分有差异是再正常不过的事情。这里我把标准化后得分0.9以上的谜称为“上品”,得分0.1以下的谜称为“弃作”。经统计,129条谜(61.4%)有至少一队认为它是上品,同时108条谜(51.4%)有至少一队认为它是弃作。53条谜既有人认为是上品,也有人认为是弃作。
为了更精确一些,我计算了每条谜得分的标准差,并根据标准差,排出本届“最具争议”的前十条谜:
谜面 谜目 谜底 初评名次 标准差
“有=冇”和“睡觉睡到自然醒”这两条谜居于榜首可谓实至名归,尤其是“有=冇”,上品(打分>0.9)与弃作(打分<0.1)之比达到惊人的5:6, 说明喜欢的很喜欢,不喜欢的很不喜欢,两极分化极其严重。“要留清白在人间”和“开心果一堆”都只有50%的猜中率,而且猜中的队和没中的队打分差异巨大。“要留清白在人间”猜中的10个队平均分为0.548,未中的队平均分为0.146;“开心果一堆”猜中的队平均分为0.647,未中的队平均分为0.144。这样的打分把这两谜被直接送进了“最具争议”十强。其他谜作可以说都有亮点,同时也都有这样那样的争议,所以打分差异较大,也在情理之中。
标准差最小(也就是最没争议)的谜作前10名大都是得分偏低,普遍认为有些问题的谜作。而在第10-20名之间有两条佳谜,分别是“遣使以此意达曹操” 六字篮球术语,末字五笔 策应配合战术 和 杖朝暮老喜清淡,二九韶龄爱膏鲜 离合字二 八十一口味/十八一口味,说明这两条谜大家感觉都不错,是难得的公认的佳谜,值得庆祝一下。
2。各队打分的相似度
这里我用相关系数来评估两队打分的相似程度(用标准化后的分数来计算)。先说一下什么是相关系数,相关系数是用来计算两组数据相似程度的量,范围是-1到1。如果两队打分完全相同,则相关系数为1,如果两队打分完全相反(比如A队打0,B队就打1;A队打1,B队就打0,以此类推),则相关系数为-1,如果两队打分互有高低,基本上没什么规律可循,则相关系数为0。
上面这张图是一张聚类图,产生的过程是,先把相关系数最高的两队聚在一起,用线连起来,然后再加入一个相关系数次高的队,以此类推,直到把所有队都加上去,最后形成上面的树状图(图中竖线的长度为1减去相关系数)。总分用红色标出,可以看出,打分与总分最接近的是谜踪虎影队,相关系数高达0.727(伯乐阿伯乐),其次是风云谜社和春风谜社,相关系数分别为0.68和0.64,其余绝大多数队伍的打分与总分的相关系数也都在0.5以上。打分与总分差距最大的是潮州队,相关系数为0.236。由于我平时用的聚类软件只支持英文,一时又懒得去找别的软件,所以队名都用拼音表示,只能请大家凑和看了,不好意思。
两队之间并没出现打分特别相似的现象,相关系数最高的是风云谜社和谜踪虎影(0.525), 相关系数最低的是潮州和舟山(-0.013)。
3。各队打分“勤快程度”排名
这里的“勤快程度”是指,分打得是比较集中,还是比较分散。最“懒惰”的打分方法是给所有的谜同样的分数,而最“勤快”的打分方法是给每个谜不同的分数(虽然现在还无法做到)。由于大家打分都不是随手乱打,决定两个谜哪个要给82,哪个要给83,比简单的都给80或者都给85,要付出更多的精力去思考。因此,我认为打分打的分散的队要更“勤快”一些,而打的集中的队则相对“懒”一些。打分的分散程度,也就是复杂度,可以用熵来计算,具体公式参见 http://zxw.idm.cn/ZCL/part1/C8a.htm
队伍 熵值 由此可见,打分“最勤快”的队伍是沈阳,其次是风云谜社和春风谜社(熵值,也就是打分的复杂度最高),而打分“最不勤快”的是成都,无锡和中原谜社。
|
-- 作者:微风 -- 发布时间:2009/6/23 13:06:44 -- 好贴. |
-- 作者:星汉 -- 发布时间:2009/6/23 13:30:26 -- 空雨好贴! 这样一分析才知道我队有两个谜属于很有争议的 |
-- 作者:慈母吟 -- 发布时间:2009/6/23 13:31:04 -- 以下是引用微风在2009-6-23 13:06:44的发言:
好贴. 仔细看了下,发现你这个好帖属于无效贴 我这个 好帖 . 才有说服力. |
-- 作者:醉乡遗老 -- 发布时间:2009/6/23 13:37:56 -- 尽管俺是数学盲,但凭感觉,空姐的帖,好就一个字:好帖 但愿今后大赛此类帖多多益善。
另:
慈母兄容禀:人家那是啥来着?举内不避亲么:) |
-- 作者:越南天牛 -- 发布时间:2009/6/23 14:12:17 -- 哇,感谢空雨,俺终于也上榜一次了
PS:顺便发现了一下,最具争议的谜都是成句谜,汗~~~ |
-- 作者:顽石斋 -- 发布时间:2009/6/23 14:31:44 -- 空雨有心。本届华清最好的一贴 |
-- 作者:国父大手笔 -- 发布时间:2009/6/23 14:40:04 -- 风云和春风真可谓又“快”(勤快)又“准” |
-- 作者:琥珀 -- 发布时间:2009/6/23 19:26:48 -- 空雨太牛了! |
-- 作者:一意翁 -- 发布时间:2009/6/23 21:19:15 -- 顶一下,有空再分析 |