視覺化常見圖表 — 選擇正確的圖表

視覺化常見圖表 — 選擇正確的圖表

統計圖表是最早的資料視覺化形式之一，如何將資料直觀且容易了解和操作的方式呈現給使用者，以下介紹基本圖表及屬性和使用時機，讓大家可以依據自己的情境選擇合宜的圖表，達到傳達資訊或解決問題的目的。

🔅推薦視覺化介紹網頁

這個網站整理了60種視覺化圖表，也介紹每種圖表的使用時機、定義、使用工具，範本等供參考。

TheData Visualisation Catalogue

網站介面：提供各式視覺畫圖表說明

例如：熱圖Heatmap，詳細說明定義及使用情境等。

資料來源：The Data Visualisation Catalogue網站

🔅阿貝拉的圖表類型

Andrew Abela是美國天主教大學教務長暨錢商學院院長，將常見的不同圖表歸納出四種目的：比較(Comparison), 分佈(Distribution), 組成(Composition)及關係(Relationship)。依自己的目的做選擇，藉由了解圖表分類及類型，廣泛的收集範例，整理成筆記，並大量瀏覽視覺化網站，幫助自己快入進入視覺化世界，再依需求畫出適合自己主題的圖來。

資料來源：https://twitter.com/tonydejonker/status/1097191707916025856

🔅常見圖表—依原始資料繪圖

用於視覺化原始資料的屬性值，值觀呈現資料特徵，代表圖形如下

-資料軌跡：

為單變數的資料呈現方式，呈現X軸與Y軸關係，常見股票隨時間的價格走勢。

資料來源：奇摩股市截圖

-柱狀圖/長條圖(bar chart)：

採長方形的形狀和顏色編碼資料的屬性，每根直柱內部也可用像素編碼，也稱推疊圖(stacked graph)，可用在多變數和高維資料的視覺化上。

適用不連續資料，每一條長條之間沒有什麼連續、順序性。

長條圖python作法

-直方圖(histogram)：

針對資料裡的某個資料屬性的頻率統計，是連

續資料，對於單變數的資料，如身高或體重，

設定值的範圍對應到橫軸，分割成多個子區間，

每個資區間用長方形表示，高度為子區間的資料

個數。可呈現資料的分布、離群值等。

如何區別直方圖與長條圖(或稱柱狀圖)??

直方圖的各部分之和等於單位整體，長條間有連在

一起。

長條圖各部分之和無限制，長條間沒有連在一起。

雙直方圖，比較兩個資料集的方法，將兩個資料沿橫軸對稱呈現。

如，back-to-back Histograms (for each sex) 。

資料來源：The Data Visualisation Catalogue網站

-圓形圖/圓餅圖(pie chart)：

用餅乾隱喻，用圓形方式呈現各份量在整體中的比例。

資料來源：https://zh.wikipedia.org/wiki/%E8%87%BA%E7%81%A3%E5%8E%9F%E4%BD%8F%E6%B0%91%E6%97%8F

-散佈圖(scatter plot)：

表示二維資料的方式，以點的形式出現在笛卡爾坐標顯示中，每個點所對應的橫垂直座標，Y軸為垂直軸表示現象測量值，X軸為水平軸表示可能有關的原因因素，點為該維度的屬性值大小。

方便找出X與Y是否存在正負相關、線性相關、U字形( U-shaped)，也可看出異常值或極端值( outliers)。

如果你是籃球迷，假定某支球隊得分與某對手得分的關係圖。

資料來源：

https://stats.seandolinar.com/2012-basketball-scoringcorrelation/

以下是進階版的動態散佈圖，運用SAS預測美國大學籃球隊哪些球隊將參加NCAA錦標賽（他們稱為 Dance Card 舞蹈卡），從2002年至 2013年的表現。

資料來源：

http://robslink.com/SAS/democd46/ncaa_basketball_dancecard.htm

-熱圖(heat map)：

用顏色表得位置相關的二維數值資料大小，常以矩陣或方格呈現，或在地圖上按位置關係排列。

世界銀行的報告，定義的極端貧困為生活在每天1.90美元以下的國家人口比例。以下為全球情況，台灣在地圖上呈現灰色，表示無此問題。

資料來源：

https://howmuch.net/articles/people-living-in-extremepoverty-2018

視覺化首要目的是要準確的展示和傳達資料所包含的訊息，藉由了解目的和使用者的需求與預期後，將資料做直觀且清晰的呈現，若能藉由容易理解請簡單的圖表方式達成目的是最好不過的了。

留言