最小信息長度

最小信息長度（Minimum Message Length, MML）是一種統計學和機器學習中的原理，用於數據壓縮和模型選擇。這個原理基於這樣一個想法：最能解釋數據的模型應該是最佳的模型，並且在選擇模型時，應該考慮到模型的複雜度。

在MML中，信息長度不僅包括數據本身的長度，還包括用於描述數據的模型本身的長度。因此，MML可以看作是模型選擇和數據壓縮的統一框架。在選擇模型時，MML原則上要求選擇那個在給定數據下產生最短訊息長度的模型。

MML的應用包括但不限於：

MML的一個重要特點是，它不僅考慮了模型的預測能力，還考慮了模型的簡單性。這有助於避免過擬合，因為簡單的模型通常具有較短的信息長度。

然而，MML也有一些局限性。例如，計算最佳模型的信息長度可能很複雜，尤其是在數據集很大或者模型很複雜的情況下。此外，MML可能不適用於所有類型的數據和模型，因為它要求模型和數據都滿足特定的條件。