最小樣本數公式

最小樣本數(Minimum Sample Size)是指在統計學中,為了進行有效的推斷和分析,所需要的最小數據量。這個數字取決於許多因素,包括研究的目的、預期的效果大小、可接受的誤差範圍、統計檢驗的效力(power)等。一般來說,樣本數越少,抽樣誤差就越大,研究結果的可靠性就越低。

最小樣本數的計算公式因研究設計和分析方法的不同而有所差異。以下是一些常見的公式:

  1. 簡單隨機抽樣: [ n = \frac{Z^2 \times p \times (1-p)}{e^2} ] 其中:

    • n 是所需的樣本數。
    • Z 是標準正態分佈中對應於給定置信水準的Z值(例如,95%置信水準時,Z=1.96)。
    • p 是預期的樣本中事件發生的機率(通常是預期的陽性率或預期響應率)。
    • (1-p) 是預期的事件不發生的機率。
    • e 是可接受的誤差範圍(也稱為置信區間的寬度)。
  2. 二項檢驗: [ n = \frac{Z^2 \times p \times (1-p)}{e^2} ] 這個公式與簡單隨機抽樣的公式相同,因為二項檢驗通常用於簡單隨機抽樣的情況。

  3. 置信區間: [ n = \frac{Z^2 \times \sigma^2}{e^2} ] 其中:

    • n 是所需的樣本數。
    • Z 是標準正態分佈中對應於給定置信水準的Z值。
    • \sigma 是總體標準差(通常需要通過先前的研究或數據來估計)。
    • e 是可接受的誤差範圍。
  4. t檢驗: [ n = \frac{t^2 \times \sigma^2}{e^2} ] 其中:

    • n 是所需的樣本數。
    • t 是t分佈中對應於給定置信水準和自由度的t值。
    • \sigma 是總體標準差(通常需要通過先前的研究或數據來估計)。
    • e 是可接受的誤差範圍。
  5. 方差分析(ANOVA): [ n = \frac{F_{\alpha/2, df_1, df_2} \times \sigma^2}{e^2} ] 其中:

    • n 是所需的樣本數。
    • F_{\alpha/2, df_1, df_2} 是對應於給定α水準和自由度的F值。
    • \sigma 是總體標準差(通常需要通過先前的研究或數據來估計)。
    • e 是可接受的誤差範圍。

在實際應用中,研究者通常會使用統計軟件或網上的樣本數計算器來幫助確定最小樣本數。這些工具會考慮到研究設計、預期的效果大小、可接受的誤差範圍和所需的統計檢驗效力等因素。