為甚麼softmax要減最大值

softmax函式在神經網路中用於將模型的輸出轉換為機率分布。在套用softmax函式時,通常會減去最大值,這是因為softmax函式將模型的輸出轉換為機率分布,而機率分布的取值範圍通常在0到1之間。為了使機率分布的取值更接近於均勻分布,通常會減去最大值,這樣可以使得機率分布的取值更加均勻。此外,減去最大值還可以避免出現數值溢出的問題。因此,softmax函式在套用中通常會減去最大值。