罗曼诺夫斯基检验法(Romanowski Test),又称 t 检验,是一种常见的异常数据检测方法,其基本流程为:
(1)剔除疑似离群值 \(x_{o}\),计算新样本的均值和标准差:
\[\overline{x'}=\frac{1}{n-1}\sum_{i=1}^{n-1}{x_i} \]
\[s'=\sqrt{\frac{1}{n-2}\sum_{i=1}^{n-1}\left({x_i-\overline{x}}\right)^2}\]
(2)计算统计量 \(K_{o}\) 的值:
\[K_{o}=\frac{\left| x_{o}-\overline{x'} \right| }{s'}\]
(3)确定检出水平 \(\alpha\),查临界值 \(K_{\alpha}{\left( n \right)}\)。
(4)当 \(K_{o} > K_{\alpha}{\left( n \right)}\) 时,判定 \(x_{o}\) 为离群值,否则未发现 \(x_{o}\) 为离群值。
在具体应用时,发现网上竟然找不到完整的临界值表,也没有找到可用的 C# 类库。无奈之下,数学渣小编只好努力温习相关理论方法,自己编程进行计算。好在理论不是特别复杂,不过由于其中涉及积分问题,为了兼顾计算效率和准确性,还是花了好久时间才找到比较好的解决方案。
下面是小编计算的临界值表,主要给出了 \(\alpha\)=0.250、0.100、0.050、0.025、0.010 和 0.005 情况下。
[table id=6 /]

需要说明的是,小编提供的临界值表使用的是单侧概率,而下面这张网络上广泛流传的临界值表使用的双侧概率。大家在使用时需要根据实际情况进行选择!
除特别注明外,本站所有文章均为交通人原创,转载请注明出处来自http://www.hijtr.com/romanowski-test/
暂无评论