統計圖表是最早的資料視覺化形式之一,如何將資料直觀且容易了解和操作的方式呈現給使用者,以下介紹基本圖表及屬性和使用時機,讓大家可以依據自己的情境選擇合宜的圖表,達到傳達資訊或解決問題的目的。
🔅推薦視覺化介紹網頁
這個網站整理了60種視覺化圖表,也介紹每種圖表的使用時機、定義、使用工具,範本等供參考。
網站介面:提供各式視覺畫圖表說明
例如:熱圖Heatmap,詳細說明定義及使用情境等。
資料來源:The Data Visualisation Catalogue網站
🔅阿貝拉的圖表類型
Andrew Abela是美國天主教大學教務長暨錢商學院院長,將常見的不同圖表歸納出四種目的:比較(Comparison), 分佈(Distribution), 組成(Composition)及關係(Relationship)。依自己的目的做選擇,藉由了解圖表分類及類型,廣泛的收集範例,整理成筆記,並大量瀏覽視覺化網站,幫助自己快入進入視覺化世界,再依需求畫出適合自己主題的圖來。
用於視覺化原始資料的屬性值,值觀呈現資料特徵,代表圖形如下
-資料軌跡:
為單變數的資料呈現方式,呈現X軸與Y軸關係,常見股票隨時間的價格走勢。
資料來源:奇摩股市截圖
-柱狀圖/長條圖(bar chart):
採長方形的形狀和顏色編碼資料的屬性,每根直柱內部也可用像素編碼,也稱推疊圖(stacked graph),可用在多變數和高維資料的視覺化上。
適用不連續資料,每一條長條之間沒有什麼連續、順序性。
-直方圖(histogram):
針對資料裡的某個資料屬性的頻率統計,是連
續資料,對於單變數的資料,如身高或體重,
設定值的範圍對應到橫軸,分割成多個子區間,
每個資區間用長方形表示,高度為子區間的資料
個數。可呈現資料的分布、離群值等。
如何區別直方圖與長條圖(或稱柱狀圖)??
直方圖的各部分之和等於單位整體,長條間有連在
一起。
長條圖各部分之和無限制,長條間沒有連在一起。
雙直方圖,比較兩個資料集的方法,將兩個資料沿橫 軸對稱呈現。
如,back-to-back Histograms (for each sex) 。
資料來源:The Data
Visualisation Catalogue網站
-圓形圖/圓餅圖(pie
chart):
用餅乾隱喻,用圓形方式呈現各份量在整體中的 比例。
-散佈圖(scatter
plot):
表示二維資料的方式,以點的形式出現在笛卡爾坐標顯示中,每個點所對應的橫垂直座標,Y軸為垂直軸表示現象測量值,X軸為水平軸表示可能有關的原因因素,點為該維度的屬性值大小。
方便找出X與Y是否存在正負相關、線性相關、U字形( U-shaped),也可看出異常值或極端值( outliers)。
如果你是籃球迷,假定某支球隊得分與某對手得 分的關係圖。
資料來源:
以下是進階版的動態散佈圖,運用SAS預測美國大 學籃球隊哪些球隊將參加NCAA錦標賽 (他們稱為 Dance Card 舞蹈卡),從2002年至 2013年的表現。
資料來源:
http://robslink.com/SAS/democd46/ncaa_basketball_dancecard.htm
-熱圖(heat map):
用顏色表得位置相關的二維數值資料大小,常 以矩陣或方格呈現,或在地圖上按位置關係排列。
世界銀行的報告,定義的極端貧困為生活在每天1.90美元以下的國家人口比例。以下為全球情況,台灣在地圖上呈現灰色,表示無此問題。
資料來源:
https://howmuch.net/articles/people-living-in-extremepoverty-2018
視覺化首要目的是要準確的展示和傳達資料所包含的訊息,藉由了解目的和使用者的需求與預期後,將資料做直觀且清晰的呈現,若能藉由容易理解請簡單的圖表方式達成目的是最好不過的了。
留言
張貼留言