在统计学中,样本量公式是一个关键工具,它能帮助我们确定样本需要多大才能获得代表总体结果。根据数据类型和所需统计分析的不同,这个公式也会有所变化。
对于一项调查或研究,计算样本量取决于几个因素,包括所需的置信水平、误差范围(置信区间)、总体规模以及被测属性的预期比例。
!Sample-Size-Formula样本量公式
在统计学领域,样本量被定义为用于计算特定总体估计值的观测数量。换句话说,它是指在数据研究中使用的个体样本数量。它利用总体和样本之间的差异来计算正确的样本大小。这是从总体中选择一组人来估计整个总体特征的过程,被称为抽样。它通常用符号 n 表示。
目录
- 样本量公式
- 估计总体均值的样本量公式
- 估计总体比例的样本量公式
- 有限总体修正的样本量公式
- 如何使用样本量公式?
- 使用样本量公式的示例
对于较小的样本量,我们将使用 T 分布的概念来代替正态分布。具体来说,当样本量值小于 30 时,会使用这种分布。在该测试中,如果总体方差未知且样本量较小,我们利用 t 统计量通过单尾和双尾检验来测试 零假设。这也被称为调整后的样本量。
> A = n / (1 + (n – 1)/P)
>
>
> 其中,
>
>
> – A 是调整后的样本量,
> – n 是样本量,
> – P 是总体大小。
对于无限总体大小,公式根据 z 值和误差范围表示。
> n = Z2p(1 – p)/m2
>
>
> 其中,
>
>
> – n 是样本量,
> – Z 是 z 值,
> – p 是总体比例(通常取为 0.5),
> – m 是误差范围。
估计总体均值的样本量公式
为了以一定的置信水平估计总体均值,我们可以使用以下公式来确定样本量:
> n= [(Z.σ)/E]2
其中:
- nnn = 所需样本量
- ZZZ = Z 值(标准正态分布中与所需置信水平相对应的平均值标准差数量,例如 95% 置信水平对应 1.96)
- σ\sigmaσ = 总体标准差
- EEE = 误差范围(样本均值与总体均值之间可接受的最大差异)
估计总体比例的样本量公式
为了以一定的置信水平估计总体比例,我们可以使用以下公式计算样本量:
n = [Z2.p.(1-p)/E2]
其中:
- nnn = 所需样本量
- ZZZ = Z 值(针对所需的置信水平)
- ppp = 总体的估计比例(如果未知,使用 0.5 代表最大变异性)
- EEE = 误差范围
有限总体修正的样本量公式
当总体规模有限且相对较小时,我们可以使用有限总体修正(FPC)来调整样本量公式:
> nadjusted = [n/(1+(n-1)/N)]
如何使用样本量公式?
要计算必要的样本量,我们必须先确定几个数值,然后将它们应用到正确的公式中。以下是实现这一目标的步骤:
步骤 1:确定关键值
我们需要确定关键值,例如总体规模。这个数值代表了特定人口中个人的总数。对于大型研究,可以使用近似总体规模,而对于较小的群体,精度对于确保统计显著性至关重要。
步骤 2:确定误差范围或置信区间
误差范围是研究中的一个关键指标,它表示研究中允许的误差。它以百分比表示,说明了样本结果能在多大程度上反映总体的真实值。较小的误差范围通常需要较大的样本来保持准确性。
步骤 3:设置置信水平
置信水平与误差范围密切相关,它衡量的是样本在选定的误差范围内代表整个总体的确定性。常见的置信水平包括 90%、95% 和 99%。