关于安定段位的碎碎念
声明:我数学学得不好,概念、解释等可能有误
本文讨论的pt分布为天凤凤凰桌半庄战。
用“1位数量:2位数量:3位数量”来表示真实实力的顺位分布,“1位数量+2位数量+3位数量”表示实际对局结果。
安定段位和顺位分布的关系
三麻:20:19:18为安8,19:19:19(即1:1:1)为安7。安8的一位率比三位率高不少,但是和安7比,其实只是57个半庄里相差2个顺位而已。一个安8实力的人,如果每28.5个半庄(按每半庄14分算,约6.6小时)因为体系外原因掉一个顺位,就会变成安7实力的人。
四麻:17:16:16:15为安8,16:16:16:16(即1:1:1:1)为安7。64个半庄里相差3个顺位,相当于每21.33个半庄里相差1个顺位。一个安8实力的人,如果每21.33个半庄(按每半庄27分钟来算,约9.6小时)因为体系外原因掉一个顺位,就会变成安7实力的人。当然,由于四麻吃4后果比较严重,主要要看多吃的4的数量,不能仅仅看掉的顺位的个数。这里仅以这个顺位分布举例了。
我的想法:因为偶尔掉顺位对安定段位影响也很大,所以要尽量避免因为体系外原因的损失,例如状态不好、精神不能集中导致的体系外失误,以及掉线。当然这些因素也不是每次都会导致掉顺位,有时甚至能升顺位,例如鸡打狗和、摸切不点等。安8和安7实际顺位分布相差并没有那么大,但安8和安7是巨大的实力差距。
安定段位有多安定
三麻:
如果一个人真实实力为1:1:1的顺位分布,安7,每次对局均独立,则ta打一定数量的对局,安定段的范围如下表:
对局数 | 1% | 2.5% | 5% | 10% | 50% | 90% | 95% | 97.5% | 99% |
---|---|---|---|---|---|---|---|---|---|
500半庄 | 4.980 | 5.253 | 5.501 | 5.817 | 7.000 | 8.367 | 8.776 | 9.158 | 9.615 |
1000半庄 | 5.525 | 5.732 | 5.926 | 6.151 | 7.000 | 7.937 | 8.227 | 8.475 | 8.770 |
3000半庄 | 6.113 | 6.244 | 6.363 | 6.497 | 7.000 | 7.533 | 7.684 | 7.823 | 7.993 |
5000半庄 | 6.304 | 6.409 | 6.503 | 6.610 | 7.000 | 7.409 | 7.527 | 7.631 | 7.756 |
10000半庄 | 6.502 | 6.580 | 6.646 | 6.723 | 7.000 | 7.288 | 7.371 | 7.445 | 7.528 |
(每行数据均为模拟100000次结果,下同)
数据解读方法也许是:以1000半庄行、2.5%列和97.5%列的数据为例,一个三麻真实实力为1:1:1、安7的人,在三凤打1000半庄,安定段位有97.5%的概率不高于8.475,有2.5%的概率不高于5.732。这个5.732到8.475的区间有点像95%置信区间,但和置信区间的概念似乎是不一样的,置信区间是以样本估计真实值时使用的,而这个表格里的数据是已知真实值求样本参数。
如果一个人真实实力为20:19:18的顺位分布,安8,每次对局均独立,则ta打一定数量的对局,安定段的范围如下表:
对局数 | 1% | 2.5% | 5% | 10% | 50% | 90% | 95% | 97.5% | 99% |
---|---|---|---|---|---|---|---|---|---|
500半庄 | 5.753 | 6.069 | 6.350 | 6.684 | 8.000 | 9.527 | 9.980 | 10.423 | 10.946 |
1000半庄 | 6.348 | 6.587 | 6.807 | 7.054 | 7.994 | 9.044 | 9.356 | 9.647 | 9.980 |
3000半庄 | 7.009 | 7.162 | 7.290 | 7.442 | 8.000 | 8.591 | 8.764 | 8.914 | 9.096 |
5000半庄 | 7.221 | 7.344 | 7.447 | 7.565 | 8.001 | 8.456 | 8.588 | 8.708 | 8.847 |
10000半庄 | 7.451 | 7.536 | 7.609 | 7.695 | 8.002 | 8.321 | 8.411 | 8.492 | 8.588 |
四麻:
如果一个人真实实力为1:1:1:1的顺位分布,安7,每次对局均独立,则ta打一定数量的对局,安定段的范围如下表:
对局数 | 1% | 2.5% | 5% | 10% | 50% | 90% | 95% | 97.5% | 99% |
---|---|---|---|---|---|---|---|---|---|
500半庄 | 4.980 | 5.273 | 5.523 | 5.826 | 7.000 | 8.425 | 8.879 | 9.279 | 9.780 |
1000半庄 | 5.511 | 5.723 | 5.913 | 6.138 | 7.000 | 7.966 | 8.262 | 8.520 | 8.851 |
3000半庄 | 6.105 | 6.240 | 6.357 | 6.496 | 7.000 | 7.544 | 7.703 | 7.846 | 8.011 |
5000半庄 | 6.297 | 6.406 | 6.498 | 6.605 | 7.000 | 7.418 | 7.541 | 7.648 | 7.774 |
10000半庄 | 6.491 | 6.572 | 6.638 | 6.717 | 7.000 | 7.293 | 7.379 | 7.455 | 7.549 |
我的想法:很可能已经有不止一个人做过类似的表格了。数千半庄的安定段位波动范围也不小。我更想说的是:表格里,真实实力三凤安8、3000战,2.5th percentile是安7.162,97.5th percentile是安8.914,这意味着平均每40个三凤真实实力安8且打了3000战的人,就会出现一个3000战至多安7.162的人,和一个3000战至少安8.914的人。另外,根据大石的数据(B站专栏《网络麻将实力的评价方法》),四凤南安7在3000战内到达过十段的概率为0.0229,也就是说,平均每44个真实实力安7且打了3000战的人中,就有一个升到过十段。因此,高安定段位/高段位者中,部分可能只是众多实力普通的人里波出来的。
最近有日本人做了个真·安定段位计算器(仅限四麻),大概是以凤桌人群的安定段位分布作为先验,用贝叶斯来估计一个人的真实水平(我统计没学好,很可能说得有问题,因此我也不评价该方法的优缺点)。注意最后的以文字进行的实力评价(豆凤、凤凰的猛者等)的评价标准带有作者的主观性。https://ichijojisagarimatsu.hatenablog.com/entry/tenho_antei_bayes
同样是真实实力安7(获得每个顺位的概率相等)、对战数相同的情况下,三麻和四麻相比,四麻的安定段位波动范围大多略大一点。这可能是末位惩罚规则导致的,人数越多,相同对局数安定段位波动范围就越大。考虑一种千人麻将,只有第1000名扣pt,那么1000次对局下来,有不小的概率(约0.368)没有获得过1000名,此时安定段位是正无穷(忽略1000次对局全是第999名的情况)。当然,绝对的段位pt变化肯定是三麻更大。
既往对局对以后安定段的影响
如果一真实实力为1:1:1的顺位分布的人,在三凤刚开始时就遇到了平平无奇一小波恶调,1+3+5,这对以后的安定段位有多大影响呢?
假设那个人以后ta打了300半庄,运气正常,100+100+100。
那么总数为101+103+105,安6.657
相反如果ta上来就遇到了平平无奇一小波好调,5+3+1,那么总数为105+103+101,安7.356。
如果改为以后打了330+330+330半庄,则安定段位分别为6.893、7.109。
我的想法:对局数不多时,一点点的好调恶调就会对安定段有较大影响。
以升降段为节点,安定段位会怎么样
水表网上“预计在x半庄战后升段/降段”是根据既往对局的1234位分布,估计未来对局的pt期望,然后将升段/降段所需pt除以pt期望算出来的。例如pt期望为2,离升段还差1400pt,那么就会显示“预计在700半庄战后升段”。但是由于波动,实际对战数期望是小于这个数的。另外,pt期望为正,也并非一定升段,也可能降段;pt期望为0,并不是永远不会升段降段了。
三麻:考虑真实实力为1:1:1的人,从七段原点开始打,直到升段或者降段。模拟一百万次。
筛选结果为升段的情况,平均对局数为182,对局数中位数为137,安定段中位数为9.475。
筛选结果为降段的情况,平均对局数为181,对局数中位数为138,安定段中位数为5.059。
四麻:考虑真实实力为1:1:1:1的人,从七段原点开始打,直到升段或者降段。模拟一百万次。
筛选结果为升段的情况,平均对局数为305,对局数中位数为232,安定段中位数为8.904。
筛选结果为降段的情况,平均对局数为300,对局数中位数为227,安定段中位数为5.453。
我的想法:原来安定段会偏离7段那么多啊。所以刚升凤时七段升八安定段很高也不要自负,七段降六安定段很低也不要气馁,可能只是波。