跳到主要內容

發表文章

目前顯示的是 10月, 2019的文章

使用python繪製視覺化--熱圖(Heatmap)

熱圖簡言之就是將數值的大小用顏色深淺來呈現,將量化數據透過視覺化的方式傳遞,讓閱讀者可以快速獲取資訊。 在這基本概念下利用 python 的 Plotly 套件來繪製熱圖。這次以 2019 年 1 月到 8 月空氣品質數據為例做二維圖表的熱圖 ( 資料來源為 環保署的監測網 ) 。 空氣品質議題受到全球關注 : 隨著科技發展的同時,環境相關的議題也受到國際重視,包含空氣品質對於健康之衝擊等議題,其中以 PM2.5 對健康的影響最為受到關注。唯影響空氣品質的因素複雜,需立基於全球觀點共同探討空氣汙染、氣候改變對健康的衝擊,因此探討對於健康之影響並非本篇著墨的重點。空氣品質的議題固然龐大,基於民眾的立場,我們應該具備基礎認知以及對生活環境的關注,以因應大環境的變化。 即時空氣品質指標 (AQI) 空氣品質指標 (AQI) 是描述空氣品質的指數,全世界並沒有針對這個指標有一致的規定,各國可以依據不同的情況調整,制定適合的空氣指標,因此不同國家會有不同的 AQI 指標,例如加拿大與美國 AQI 指標就不太一樣。但指標都有一致共通點,當指標數值越高皆表示空氣品質越差。 目前臺灣環保署所採用的即時空氣品質指標 (AQI) 則是參考美國環境保護署標準而制定。 加拿大空氣品質指標 ( 參考來源 : 加拿大政府網站 ) 美國空氣品質指標 ( 參考來源 : 美國環境保護署 ) 臺灣空氣品質指標 臺灣環保署偵測 O 3 、 PM 2.5 、 PM 10 、 CO 、 SO 2 、 NO 2 等 6 個測項之即時副指標值,各副指標皆有不同的濃度計算方式,有興趣的人可連結至 臺灣環保署網站查詢 ( https://taqm.epa.gov.tw/taqm/tw/b0203.aspx ) ,計算後的濃度值對應到「污染物濃度與即時副指標值對照表」,取其中最大值為即時空氣品質指標,該汙染物則為指標污染物。 空氣品質監測資源 (1)   環保署的監測網提供空氣品質監測資料 ( https://taqm.epa.gov.tw/taqm/tw/ ) 。 (2)   民間自立架設監測之空氣品質監測資料 ( https://airbox.edimaxcloud.com/ ) 。

資料視覺化基礎—圖表的第一印象

要進入資料視覺化前,就算沒有學習視覺感知理論,我們可以先從鑑賞學習起,以下簡介必知的五大概念,可讓我們快速了解圖表,知道究竟我們吸收了什麼,可以釐清更多有價值的洞見。 什麼是資料科學 當我們手裡拿到一手資料後,就是所謂的原始數據,經過資料修正與補充後,將資料進行確認及清洗,而後進行分析或預測,最後產出結果,這結果可能運用在新聞媒體、工作報告、社群網站、行銷或展覽、網頁設計 ….. 等,幾乎無所不在的被視覺化資料包裹著。 圖表的五大概念 1.我們不會按一定的順序看圖 不同文化有不同的閱讀順序,由上而下、由左至右,以下兩張圖每個人的順序都不同,視覺溝通的重點是清晰、聚焦和簡單。 2. 會先看到最凸顯的部分 往往會先看到改變和不同的地方,例如特別的顏色、陡峭的曲線、群聚或異常值。 以下應該會先看到交叉點,而後才會注意 XY 軸或標題,乾淨俐落的呈現單一凸顯點,可以毫不費力地了解圖表意思。 3. 一次只會看到幾樣東西 人無法辨別 8 種以上的顏色,若出現 5~10 個變數或元素時,個體的意義就會消失,具體還須依照業務需求或分析目標不同而有所變化。 例題:若老闆想知道員工的個體表現,第一張圖顯然需要花時間仔細對照,第二張圖明顯可看出想要了解的員工表現如何。 4. 找出圖示的意義與關聯 當一看到圖上的紅線 ( 凸顯的部分 ) ,馬上可以聯想這是要做什麼是什麼意思,原來是逃生路線,若真發生火警有看到圖看沒看到圖逃生的機率因該可想而知了。 除了找尋圖的意義,我們的視覺系統會自動將顏色做為連結,看到以下圖會思考橘色是什麼意思,因下意識的會想橘色 ( 主色 ) 優於其他資訊,只會先想到看到的顏色,可能會以為商務艙舒適程度高,但細看其實經濟艙舒適程度高且價位穩定,由於商務艙的分歧。 5. 受到常規和隱形約制 通常會依據心理的預期,賦予視覺線索一定的意義, ü 相近的顏色代表相似的項目 ü 色彩飽和度表示數值高低變化 ü 類別是從正極端到負極端逐一排列 第二張圖明顯可感受到, 哪組占多數 ? 是正面意涵還是負面 ? 哪個類別人數最少 ? 我們