回歸直線最適直線
回歸直線(Regression line)是用來描述兩個變量之間關係的一種線性模型。最適直線(Best fit line)是指在數據點的集合中,找到一條直線,使得這條直線與數據點的距離和最小。在統計學中,這通常通過最小二乘法來實現。
最小二乘法回歸直線的方程為:
y = mx + b
其中,m是斜率,b是截距,x是自變量,y是因變量。
通過最小化誤差項(e = y - mx - b)的平方和,可以找到最適合數據的直線。誤差項的平方和被稱為總離差平方和(Total Sum of Squares, SST),它可以用以下公式計算:
SST = Σ(yi - y-bar)^2
其中,y-bar是因變量的平均值,Σ表示對數據點的求和。
斜率m和截距b可以使用以下公式來計算:
m = Σ(xi - x-bar)(yi - y-bar) / Σ(xi - x-bar)^2 b = y-bar - m * x-bar
其中,x-bar是自變量的平均值。
通過這些公式,可以找到最適合數據的回歸直線。這條直線可以用來預測因變量的值,或者解釋自變量與因變量之間的關係。