敘述統計與機率分布 吳漢銘老師 AI學校經理人班教材 網頁連結 要做出足夠深入的 EDA,對於統計的理解是必須的,這份教材可以提供同學了解統計觀念的機會,但是這份教材的範圍太廣,牽涉到太多預備知識,並不適合同學完整閱讀,只建議在不熟悉名詞時,回頭當作工具書參考即可。 常見的統計分佈 (英文) healthknowledge.com 網頁連結 這個網頁描述了幾個常見的分布 : 常態分布 / 二項式分布 / 卜瓦松分布,其中常態分布是我們最常使用到的,這個網頁建議同學大致上知道常態分布的形狀 (右圖) 即可,至於機率密度函數等其他相關知識,可以等到有需要時再查詢。 統計分佈清單 (英文) wikipedia.org 網頁連結 維基百科上有更完整的統計模型清單, 包含離散與連續分布,不過當清單到這麼完整的時候,就更不可能全部讀完,建議同學也是當作查詢工具即可。(附圖為卜瓦松分佈 Poisson Distribution) 推薦各種圖形範例網頁 matplotlib https://matplotlib.org/gallery/index.html seaborn https://seaborn.pydata.org/examples/index.html 若需要用 pandas 計算統計量或畫圖,可參考以下連結 Descriptive Statistics For pandas Dataframe pandas 中的繪圖函數