关于安定段位的碎碎念

声明:我数学学得不好,概念、解释等可能有误

本文讨论的pt分布为天凤凤凰桌半庄战。

用“1位数量:2位数量:3位数量”来表示真实实力的顺位分布,“1位数量+2位数量+3位数量”表示实际对局结果。

安定段位和顺位分布的关系

三麻:20:19:18为安8,19:19:19(即1:1:1)为安7。安8的一位率比三位率高不少,但是和安7比,其实只是57个半庄里相差2个顺位而已。一个安8实力的人,如果每28.5个半庄(按每半庄14分算,约6.6小时)因为体系外原因掉一个顺位,就会变成安7实力的人。

四麻:17:16:16:15为安8,16:16:16:16(即1:1:1:1)为安7。64个半庄里相差3个顺位,相当于每21.33个半庄里相差1个顺位。一个安8实力的人,如果每21.33个半庄(按每半庄27分钟来算,约9.6小时)因为体系外原因掉一个顺位,就会变成安7实力的人。当然,由于四麻吃4后果比较严重,主要要看多吃的4的数量,不能仅仅看掉的顺位的个数。这里仅以这个顺位分布举例了。

我的想法:因为偶尔掉顺位对安定段位影响也很大,所以要尽量避免因为体系外原因的损失,例如状态不好、精神不能集中导致的体系外失误,以及掉线。当然这些因素也不是每次都会导致掉顺位,有时甚至能升顺位,例如鸡打狗和、摸切不点等。安8和安7实际顺位分布相差并没有那么大,但安8和安7是巨大的实力差距。

安定段位有多安定

三麻:

如果一个人真实实力为1:1:1的顺位分布,安7,每次对局均独立,则ta打一定数量的对局,安定段的范围如下表:

对局数 1% 2.5% 5% 10% 50% 90% 95% 97.5% 99%
500半庄 4.980 5.253 5.501 5.817 7.000 8.367 8.776 9.158 9.615
1000半庄 5.525 5.732 5.926 6.151 7.000 7.937 8.227 8.475 8.770
3000半庄 6.113 6.244 6.363 6.497 7.000 7.533 7.684 7.823 7.993
5000半庄 6.304 6.409 6.503 6.610 7.000 7.409 7.527 7.631 7.756
10000半庄 6.502 6.580 6.646 6.723 7.000 7.288 7.371 7.445 7.528

(每行数据均为模拟100000次结果,下同)

数据解读方法也许是:以1000半庄行、2.5%列和97.5%列的数据为例,一个三麻真实实力为1:1:1、安7的人,在三凤打1000半庄,安定段位有97.5%的概率不高于8.475,有2.5%的概率不高于5.732。这个5.732到8.475的区间有点像95%置信区间,但和置信区间的概念似乎是不一样的,置信区间是以样本估计真实值时使用的,而这个表格里的数据是已知真实值求样本参数。

如果一个人真实实力为20:19:18的顺位分布,安8,每次对局均独立,则ta打一定数量的对局,安定段的范围如下表:

对局数 1% 2.5% 5% 10% 50% 90% 95% 97.5% 99%
500半庄 5.753 6.069 6.350 6.684 8.000 9.527 9.980 10.423 10.946
1000半庄 6.348 6.587 6.807 7.054 7.994 9.044 9.356 9.647 9.980
3000半庄 7.009 7.162 7.290 7.442 8.000 8.591 8.764 8.914 9.096
5000半庄 7.221 7.344 7.447 7.565 8.001 8.456 8.588 8.708 8.847
10000半庄 7.451 7.536 7.609 7.695 8.002 8.321 8.411 8.492 8.588

四麻:

如果一个人真实实力为1:1:1:1的顺位分布,安7,每次对局均独立,则ta打一定数量的对局,安定段的范围如下表:

对局数 1% 2.5% 5% 10% 50% 90% 95% 97.5% 99%
500半庄 4.980 5.273 5.523 5.826 7.000 8.425 8.879 9.279 9.780
1000半庄 5.511 5.723 5.913 6.138 7.000 7.966 8.262 8.520 8.851
3000半庄 6.105 6.240 6.357 6.496 7.000 7.544 7.703 7.846 8.011
5000半庄 6.297 6.406 6.498 6.605 7.000 7.418 7.541 7.648 7.774
10000半庄 6.491 6.572 6.638 6.717 7.000 7.293 7.379 7.455 7.549

我的想法:很可能已经有不止一个人做过类似的表格了。数千半庄的安定段位波动范围也不小。我更想说的是:表格里,真实实力三凤安8、3000战,2.5th percentile是安7.162,97.5th percentile是安8.914,这意味着平均每40个三凤真实实力安8且打了3000战的人,就会出现一个3000战至多安7.162的人,和一个3000战至少安8.914的人。另外,根据大石的数据(B站专栏《网络麻将实力的评价方法》),四凤南安7在3000战内到达过十段的概率为0.0229,也就是说,平均每44个真实实力安7且打了3000战的人中,就有一个升到过十段。因此,高安定段位/高段位者中,部分可能只是众多实力普通的人里波出来的。

最近有日本人做了个真·安定段位计算器(仅限四麻),大概是以凤桌人群的安定段位分布作为先验,用贝叶斯来估计一个人的真实水平(我统计没学好,很可能说得有问题,因此我也不评价该方法的优缺点)。注意最后的以文字进行的实力评价(豆凤、凤凰的猛者等)的评价标准带有作者的主观性。https://ichijojisagarimatsu.hatenablog.com/entry/tenho_antei_bayes

同样是真实实力安7(获得每个顺位的概率相等)、对战数相同的情况下,三麻和四麻相比,四麻的安定段位波动范围大多略大一点。这可能是末位惩罚规则导致的,人数越多,相同对局数安定段位波动范围就越大。考虑一种千人麻将,只有第1000名扣pt,那么1000次对局下来,有不小的概率(约0.368)没有获得过1000名,此时安定段位是正无穷(忽略1000次对局全是第999名的情况)。当然,绝对的段位pt变化肯定是三麻更大。

既往对局对以后安定段的影响

如果一真实实力为1:1:1的顺位分布的人,在三凤刚开始时就遇到了平平无奇一小波恶调,1+3+5,这对以后的安定段位有多大影响呢?

假设那个人以后ta打了300半庄,运气正常,100+100+100。

那么总数为101+103+105,安6.657

相反如果ta上来就遇到了平平无奇一小波好调,5+3+1,那么总数为105+103+101,安7.356。

如果改为以后打了330+330+330半庄,则安定段位分别为6.893、7.109。

我的想法:对局数不多时,一点点的好调恶调就会对安定段有较大影响。

以升降段为节点,安定段位会怎么样

水表网上“预计在x半庄战后升段/降段”是根据既往对局的1234位分布,估计未来对局的pt期望,然后将升段/降段所需pt除以pt期望算出来的。例如pt期望为2,离升段还差1400pt,那么就会显示“预计在700半庄战后升段”。但是由于波动,实际对战数期望是小于这个数的。另外,pt期望为正,也并非一定升段,也可能降段;pt期望为0,并不是永远不会升段降段了。

三麻:考虑真实实力为1:1:1的人,从七段原点开始打,直到升段或者降段。模拟一百万次。

筛选结果为升段的情况,平均对局数为182,对局数中位数为137,安定段中位数为9.475。

筛选结果为降段的情况,平均对局数为181,对局数中位数为138,安定段中位数为5.059。

四麻:考虑真实实力为1:1:1:1的人,从七段原点开始打,直到升段或者降段。模拟一百万次。

筛选结果为升段的情况,平均对局数为305,对局数中位数为232,安定段中位数为8.904。

筛选结果为降段的情况,平均对局数为300,对局数中位数为227,安定段中位数为5.453。

我的想法:原来安定段会偏离7段那么多啊。所以刚升凤时七段升八安定段很高也不要自负,七段降六安定段很低也不要气馁,可能只是波。