跳到主要內容

視覺化常見圖表 — 選擇正確的圖表




       統計圖表是最早的資料視覺化形式之一,如何將資料直觀且容易了解和操作的方式呈現給使用者,以下介紹基本圖表及屬性和使用時機,讓大家可以依據自己的情境選擇合宜的圖表,達到傳達資訊或解決問題的目的。




🔅推薦視覺化介紹網頁
這個網站整理了60種視覺化圖表,也介紹每種圖表的使用時機、定義、使用工具,範本等供參考。


             網站介面:提供各式視覺畫圖表說明

例如:熱圖Heatmap,詳細說明定義及使用情境等。


        資料來源:The Data Visualisation Catalogue網站




  🔅阿貝拉的圖表類型
Andrew Abela是美國天主教大學教務長暨錢商學院院長,將常見的不同圖表歸納出四種目的:比較(Comparison), 分佈(Distribution), 組成(Composition)及關係(Relationship)。依自己的目的做選擇,藉由了解圖表分類及類型,廣泛的收集範例,整理成筆記,並大量瀏覽視覺化網站,幫助自己快入進入視覺化世界,再依需求畫出適合自己主題的圖來。






  🔅常見圖表依原始資料繪圖

用於視覺化原始資料的屬性值,值觀呈現資料特徵,代表圖形如下
-資料軌跡
        為單變數的資料呈現方式,呈現XY軸關係,常見股票隨時間的價格走勢。
         資料來源:奇摩股市截圖

    -柱狀圖/長條圖(bar chart)

        採長方形的形狀和顏色編碼資料的屬性,每根直柱內部也可用像素編碼,也稱推疊圖(stacked graph),可用在多變數和高維資料的視覺化上。
適用不連續資料,每一條長條之間沒有什麼連續、順序性。
長條圖python作法
         
 -直方圖(histogram)
            針對資料裡的某個資料屬性的頻率統計,是
     續資料,對於單變數的資料,如身高或體重,
     設定值的範圍對應到橫軸,分割成多個子區間,
     每個資區間用長方形表示,高度為子區間的資料
     個數。可呈現資料的分布、離群值等。

      如何區別直方圖與長條圖(或稱柱狀圖)??
      直方圖的各部分之和等於單位整體,長條間
      一起。
     長條圖各部分之和無限制,長條間沒有連在一起。




      
  雙直方圖,比較兩個資料集的方法,將兩個資料沿橫      軸對稱呈現。
  如,back-to-back Histograms (for each sex)
       資料來源:The Data Visualisation Catalogue網站


    -圓形圖/圓餅圖(pie chart)
        用餅乾隱喻,用圓形方式呈現各份量在整體中的             比例。
  
-散佈圖(scatter plot):
表示二維資料的方式,以點的形式出現在笛卡爾坐標顯示中,每個點所對應的橫垂直座標,Y軸為垂直軸表示現象測量值,X軸為水平軸表示可能有關的原因因素,點為該維度的屬性值大小。
方便找出XY是否存在正負相關、線性相關、U字形U-shaped),也可看出異常值或極端值outliers)
         如果你是籃球迷,假定某支球隊得分與某對手得      分的關係圖。
     資料來源:

 以下是進階版的動態散佈圖,運用SAS預測美國大   學籃球隊哪些球隊將參加NCAA錦標賽  (他們稱為 Dance Card 舞蹈卡),從2002年至 2013年的表現。
  資料來源:

          http://robslink.com/SAS/democd46/ncaa_basketball_dancecard.htm

   -熱圖(heat map):
    用顏色表得位置相關的二維數值資料大小,常    以矩陣或方格呈現,或在地圖上按位置關係排列。




世界銀行的報告,定義的極端貧困為生活在每天1.90美元以下的國家人口比例。以下為全球情況,台灣在地圖上呈現灰色,表示無此問題。
  資料來源:

  https://howmuch.net/articles/people-living-in-extremepoverty-2018

  


視覺化首要目的是要準確的展示和傳達資料所包含的訊息,藉由了解目的和使用者的需求與預期後,將資料做直觀且清晰的呈現,若能藉由容易理解請簡單的圖表方式達成目的是最好不過的了。


留言