Pca最早的論文

PCA(Principal Component Analysis,主成分分析)是一種統計學方法,用於降維和數據壓縮。它通過將數據投影到最重要的幾個方向上,來減少數據的維度。這些方向被稱為主成分,它們是數據變異最大的方向。PCA最早出現在1901年瑞典統計學家Karl Pearson的論文中,用於分析生物學數據。

Karl Pearson的論文題目是 "On lines and planes of closest fit to systems of points in space",這篇論文發表在《Biometrika》雜誌上。在這篇論文中,Pearson提出了使用線性和二次曲線來擬合數據點的方法,這是最早的主成分分析思想的體現。

然而,PCA的實際應用和理論發展是在20世紀50年代和60年代,當時計算機技術的進步使得對大量數據進行分析成為可能。在這期間,許多統計學家對PCA進行了深入的研究和發展,包括J.H. Hotelling, R.A. Fisher, and H. Hotelling等。

Hotelling的貢獻在於他提出了PCA的統計學基礎,並將其應用於樣本數據的分析。他還提出了PCA的一些重要概念,如主成分的解釋度量,這使得人們能夠更好地理解主成分的意義。

總之,PCA的起源可以追溯到Karl Pearson的早期工作,但它的發展和應用是一個逐步的過程,涉及許多統計學家的貢獻。