符号检验(Sign Test)是一种用于比较两个总体或样本的非参数检验方法。当我们的数据不服从正态分布,或者两个总体的方差不相等时,我们会使用这种方法。符号检验主要用于检验零假设,即两个总体的中位数是否相等。
符号检验的工作原理是,比较两个总体中成对观测值之间的差异。对于每一对观测值,我们要计算两者之间的差值。然后,根据哪个观测值更大,我们会给每个差值分配一个正号或负号。如果两个观测值相等,我们就分配一个零。接着,我们会计算正号和负号的数量,并利用二项分布来计算,如果零假设成立,观察到这么多正号的概率是多少。
符号检验的假设条件
符号检验对数据的底层分布不做任何假设。然而,为了使符号检验有效,必须满足一些假设条件:
> – 数据必须是 成对的。
> – 各对数据之间必须是 独立的。
> – 配对之间的差异必须呈 对称分布。
在R中执行符号检验
为了在 R 编程语言中执行符号检验,我们将使用 stats 包中的 binom.test() 函数。该函数接受两个参数:x 和 y,它们代表我们要比较的两个总体或样本。
我们使用包含正负值的数值向量 data 来执行双侧符号检验。我们首先计算有多少个值大于零,然后执行二项检验,假设正负值的比例为 50-50(即 p = 0.5),以检查这个计数是否显著不同于随机预期的结果。
R
CODEBLOCK_22d3582a
输出结果:
Exact binomial test
data: sum(data > 0) and length(data)
number of successes = 4, number of trials = 8, p-value = 1
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.1570128 0.8429872
sample estimates:
probability of success
0.5
从输出中我们可以看到,
- 成功次数(Number of successes):4(数据中正差值的计数)。
- 试验次数(Number of trials):8(具有非零差值的观测值总数)。
- p-value = 1:这表明观察到的成功率与预期比例 0.5 之间没有显著差异,因此我们无法拒绝零假设。
- 备择假设:真实的成功率不等于 0.5。
- 95% 置信区间:真实的成功率位于 0.157 和 0.843 之间。
- 样本估计值:观察到的成功率为 0.5,这与零假设下的假设值相同。