最小支持度閾值

最小支持度閾值(Minimum Support)是在關聯規則挖掘中用於過濾不頻繁的項目集的一個參數。它定義了項目集在數據集中出現的最低次數,只有超過這個閾值的項集才會被考慮用於生成關聯規則。

最小支持度閾值通常是一個百分比或者一個具體的數值,取決於數據集的大小和項集的種類。例如,如果數據集中有1000個交易,最小支持度閾值設定為5%,那麼只有那些在至少50(1000 * 0.05 = 50)個交易中出現的項集才會被認為是有足夠支持度的。

最小支持度閾值的設定取決於套用場景和分析的目的。如果閾值設定得太高,可能會遺漏一些在實際中有意義的關聯規則;如果設定得太低,可能會發現很多不具代表性的規則。因此,選擇一個合適的閾值是很重要的。

在Apriori算法和一些其他的關聯規則挖掘算法中,最小支持度閾值是一個基本的參數。通過調整這個閾值,可以控制挖掘出的關聯規則的數量和質量。