最或是值公式

"最或是值"(Maximum a Posteriori,MAP)估計是一種在統計學和機器學習中常用的參數估計方法,它基於貝葉斯定理來選擇具有最大後驗機率的參數值。MAP估計通常用於分類問題和參數估計問題。

最或是值公式可以根據貝葉斯定理來推導:

根據貝葉斯定理,我們有: [ P(x|y) = \frac{P(y|x)P(x)}{P(y)} ]

其中,(P(x|y)) 是後驗機率,(P(y|x)) 是likelihood(似然),(P(x)) 是先驗機率,(P(y)) 是歸一化常數。

在MAP估計中,我們想要找到使得後驗機率最大的參數值 (y): [ y_{MAP} = \arg\max_y P(y|x) ]

為了找到 (y{MAP}),我們可以對 (y) 套用 log 函式,因為 log 函式是單調遞增的,所以最大化 (P(y|x)) 等價於最大化 (\log P(y|x)): [ y{MAP} = \arg\max_y \log P(y|x) ]

現在,我們可以使用 log 規則來展開 (\log P(y|x)): [ \log P(y|x) = \log \left(\frac{P(y|x)P(x)}{P(x)}\right) = \log P(y|x) - \log P(x) ]

由於 (P(x)) 是一個常數,我們可以將其從最大化過程中移除: [ y_{MAP} = \arg\max_y \log P(y|x) - \log P(x) ]

現在,我們只需要最大化 (\log P(y|x))。在許多套用中,(P(y|x)) 可以寫成 (P(y|x) \propto P(y)P(x|y)),其中 (P(y)) 是先驗機率,(P(x|y)) 是likelihood。在這種情況下,MAP估計等價於:

[ y_{MAP} = \arg\max_y P(y)P(x|y) ]

這就是最或是值公式。在實際套用中,(P(y)) 和 (P(x|y)) 通常由特定的模型和數據給出,而 (y_{MAP}) 可以通過最佳化算法(如梯度上升)來找到。