最小支持度

在數據挖掘和關聯規則學習中,最小支持度(Minimum Support)是一個非常重要的概念。它是指在數據集中,一個項集出現的次數至少要達到的支持度閾值。這個閾值是由數據挖掘算法事先設定的,用於確定哪些項集是「頻繁的」,哪些是不頻繁的。

例如,如果我們有一個交易數據集,其中包含不同商品的交易記錄。我們可以設定一個最小支持度閾值,比如5%。這意味著如果一個商品在至少5%的交易中出現,那麼它就是一個頻繁項集。

最小支持度的設定取決於具體套用和數據的特點。如果最小支持度設得太高,可能會遺漏一些實際上有意義的關聯規則;如果設得太低,可能會發現很多不具代表性的規則。因此,選擇合適的最小支持度是一個需要根據實際情況進行權衡的過程。