近日,严晓东副研究员依托山东大学陈增敬教授非线性概率理论研究团队完成的合作论文“Strategic two sample test via two-armed bandit process”在英国皇家统计协会会刊《Journal of the Royal Statistical Society Series B: Statistical Methodology》2023年第4期正式发表。论文链接:https://doi.org/10.1093/jrsssb/qkad061
本论文基于彭实戈院士的非线性期望开创了“策略极限理论”,为策略博弈过程产生的非独立同分布样本的统计推断研究提供了基础理论。本研究旨在通过检验两个总体参数之间的差异来介绍原创的“策略极限理论”的应用思路,从而证明非线性期望理论在统计推断中的优势。基于独立同分布样本的经典检验统计量往往将原始数据视为可交换的,而本文的检验统计量打破了这种结构,提出采用强化学习最简单模型“双臂老虎机”的策略博弈过程对数据进行整合,构建了针对策略的检验统计量,亦被成为“策略统计量”。利用策略极限理论在更大的概率空间中研究了渐近分布,并且该研究推导出了渐近分布密度函数的显式表达式,对应的非线性中心极限定理被成为“策略中心极限定理”。渐近分布表明,与经典的中心极限定理相比,所提出的统计量在零假设下更集中,在备选假设下更分散,从而提高了检验的功效。仿真和实际数据研究为理论结果提供了有利证据,并在使用有限样本时获得了更强大的power。
团队开创的“策略极限理论”, 变革了传统统计方法研究范式,后续开展的相关研究在大数据以及迁移学习、在线学习和强化学习等可解释和可信赖的理论与方法研究上取得重大突破。
关于期刊
统计学四大顶刊指的是统计学领域公认的四大顶级杂志,其中包括 Journal of the Royal Statistical Society, Series B (JRSSB:皇家B) 、Annals of Statistics(AOS) 、Journal of the American Statistical Association (JASA)、和Biometrika。 其中JRSSB是由英国皇家统计学会主办的学术期刊,该刊为季刊,每期收录15篇左右的文章,年文章总数50篇左右,属于四大中发表难度系数最大的杂志。以2022年为例,统计四大期刊年发文量如下:
严晓东在大数据统计分析与统计机器学习领域从事一线的教学和研究工作,研究方向主要集中在非线性期望下统计推断理论研究。近5年,在统计学顶级期刊JRSSB, AOS, JASA等发表论文30余篇, 以主持人获得了国自科面上和青年基金、国家统计局、省自科和社科以及济南市科技局等项目资助。