最小支持度怎么算

最小支持度(Minimum Support)是數據挖掘中關聯規則(Association Rule)的一個概念。關聯規則用於發現數據集中不同項目之間有趣的關聯模式。最小支持度是一個閾值,用於確定一個關聯規則是否足夠頻繁地出現在數據集中,從而被認為是「有趣」或「有意義的」。

最小支持度的計算公式如下:

最小支持度(Minimum Support) = 支持度(Support)閾值

支持度(Support)是對所有交易或者事務的計數,這些交易或者事務包含了關聯規則中的所有項目。支持度通常用百分比或者絕對數來表示。

例如,如果我們有一個數據集包含1000個事務,其中至少有300個事務包含了項目A和項目B,那麼支持度(Support)就是30%。如果我們的最小支持度閾值是20%,那麼這個關聯規則「A -> B」將被認為是「有意義的」,因為它的支持度超過了閾值。

最小支持度的計算通常是在數據挖掘的預處理階段進行的,它可以幫助我們過濾掉那些不頻繁的模式,從而減少後續規則生成階段的工作量。在實際套用中,最小支持度的值需要根據具體的數據集和業務需求來設定。