Datawhale 8月 組隊(duì)學(xué)習(xí)活動
參考書籍:《科研論文配圖繪制指南—— 基于Python》,寧海濤著,人民郵電出版社
【資料圖】
PS:已開學(xué),中心已向?qū)W校內(nèi)容為主
一、單變量圖
單變量圖指使用數(shù)據(jù)組的一個變量進(jìn)行相應(yīng)圖的繪制。其中數(shù)據(jù)變量分為連續(xù)變量和離散型變量。
1.基于連續(xù)變量繪制的單變量圖的類型
(1)直方圖:表示數(shù)據(jù)分布和離散情況,使用一系列寬度相等、高度不等的長方形來表示相應(yīng)的每個分組內(nèi)的數(shù)據(jù)元個數(shù)??梢燥@示各組數(shù)據(jù)的分布情況,也體現(xiàn)了組間數(shù)據(jù)差異、數(shù)據(jù)異常等情況。
(2)密度圖:是直方圖的一個變種類型。體現(xiàn)了數(shù)據(jù)在連續(xù)時間段內(nèi)的分布狀況。它不會因分組個數(shù)而導(dǎo)致數(shù)據(jù)顯示不全,幫助用戶判斷數(shù)據(jù)的整體趨勢。
(3)Q-Q圖:Q代表分位數(shù),Q-Q圖本質(zhì)是概率圖,作用是檢驗(yàn)數(shù)據(jù)分布是否服從某一個分布。不但可以檢驗(yàn)樣本數(shù)據(jù)是否符合某種數(shù)據(jù)分布,而且可以通過對數(shù)據(jù)分布形狀的比較,來發(fā)現(xiàn)數(shù)據(jù)在位置、標(biāo)度和偏度方面的屬性。
(4)P-P圖:與Q-Q圖相似,根據(jù)變量的累積概率與指定的理論分布累積概率的關(guān)系繪制,檢驗(yàn)樣本數(shù)據(jù)是否符合某一概率分布。檢驗(yàn)樣本數(shù)據(jù)符合預(yù)期分布時,圖中的各點(diǎn)將會呈現(xiàn)一條直線。
(5)經(jīng)驗(yàn)分布函數(shù)圖:檢驗(yàn)樣本數(shù)據(jù)是否符合某種預(yù)期分布。
2.圖形繪制
在 Matplotlib 中使用 () 函數(shù)繪制。參數(shù) x 為要繪制的樣本數(shù)據(jù),參數(shù) bins 用于定義分布區(qū)間。參數(shù) density對應(yīng)的值為布爾類型,該參數(shù)決定繪圖結(jié)果是否為密度圖,默認(rèn)值為 False 。同時還可以使用 SciencePlots 的繪圖主題進(jìn)行進(jìn)一步美化。還可以使用 () 函數(shù)對繪制數(shù)據(jù)實(shí)現(xiàn)正態(tài)擬合,計(jì)算出概率密度函數(shù)結(jié)果。
二、核心代碼實(shí)現(xiàn)
(未完待續(xù))