跳到主要內容

發表文章

目前顯示的是 4月, 2019的文章

使用python繪製視覺化--堆疊區域圖

區域圖是基於折線圖延伸出的圖表,因此具有折線圖的優勢,一覽整體趨勢。相較於折線圖,區域圖還可透過面積來呈現數據多寡,做不同分類之間的比較。區域圖分為 2 種,堆疊區域圖與百分比堆疊區域圖,後者概念似百分比堆疊長條圖,以各個值所佔的百分比呈現。 在這基本概念下利用 python 的 Plotly 套件來繪製堆疊區域圖。這次以腸病毒為主軸,在開始操作前先做個知識補充,對腸病毒有個基本概念。 腸病毒基礎概念 : 往年隨著開學季開始,總能在新聞報導上看到腸病毒的蹤跡,伴隨著家長的恐慌,我們對腸病毒的認知有多少 ? n   病毒型態 : 腸病毒屬於小 RNA 病毒科,可以分成 5 種類型,小兒麻痺病毒、     克沙奇病毒 A 型、克沙奇病毒 B 型、伊科病毒、腸病毒 68-71 型,其特性因為生長於     腸胃道而總稱為腸病毒。 n    傳染途徑 : 有 3 種,糞口傳染、飛沫傳染以及接觸傳染。 n      疾病症狀 : 感染者多數不會出現症狀或出現發燒等類似一般感冒的輕微症狀。常      引起 手足口病及疱疹性咽峽炎,有些時候則會引起一些較特殊的臨床表現,包括      病毒性腦炎、 無菌性腦膜炎、心肌炎、肢體麻痺症候群、急性出血性結膜炎、      腦炎或急性無力脊髓炎等。 三歲以下幼童感染則要特別注意,容易併發腸病毒重症。 n      流行情況 : 不見得每年皆會發生 腸病毒 大流行,但 腸病毒的流行的情況具有季節性, 5月開始疫情逐漸升溫, 6-7 月達到流行高峰期 。台灣位於亞熱帶地區,所以全 年皆有病例發生 。疾管署 例行性針對腸病毒感染病例檢出之病毒型別進行 監測 ,如果大家有興趣可以到疾管署的網站上了解疫最新的情資訊。 操作步驟 1. 選定主題,準備素材 以 2018 年每週腸病毒病毒分離型別 為例 ( 資料來源為疾管署開放資料 ) ,來看腸病毒的趨勢以及型別的變化。開始執行前,尚未安裝 plotly 者需要先安裝 plotly 套件,在 Window 環境下,開起命令提示字元,輸入 pip install plotly ,安裝完成後,就可進入繪圖步驟。 2. 確認繪圖需要用到的參數

使用python繪製視覺化--折線圖

折線圖主要是用來呈現連續性的變化,也就是趨勢,利用線條斜率的改變,讓人短時間內取得長期變化的資訊。 在這基本概念下利用 python 的 Plotly 套件來繪製基本款折線圖。 操作步驟 1. 選定主題,準備素材 以口腔 癌症歷年標準化發生率為例 ( 資料來源為整理衛生署開放資料 ) ,來看不同性別的發生率趨勢。開始執行前,尚未安裝 plotly 者需要先安裝 plotly 套件,在 Window 環境下,開起命令提示字元,輸入 pip install plotly ,安裝完成後,就可進入繪圖步驟。 2. 確認繪圖需要用到的參數 : X 軸 ( x ): 年份 ( 西元年 ) Y 軸 ( y ): 標準化發生率 ( 每十萬人口 ) 3. 繪製堆疊長條圖 操作時每一個分層要各別建構 ( 例如 : 分別呈現男女的發生率 ) ,再把各分層的圖層結合成一張圖。 import plotly.graph_objs as go import plotly.offline as py #分層為男性 trace0 = go.Scatter( x = df['year'], y = df['Male'], name = 'Male', line = dict( color = ('#1B813E'), width = 4, #設定線條寬度) ) #分層為女性 trace1 = go.Scatter( x = df['year'], y = df['Female'], name = 'Female', line = dict( color = ('#86C166'), width = 4) ) data = [trace0, trace1] layout = dict(title = '口腔癌標準化發生率', titlefont=dict(family='Courier New, monospace', siz

使用python繪製視覺化--堆疊長條圖

堆疊長條圖屬於長條圖的一種,可以做組內、組間比較。 ²   組內比較 : 同一個長條中不同項目所佔的比重。 ²   組間比較 : 比較不同長條圖中,某一個項目佔的比重大小。 有了基本的概念與構思好主題後,就可以 利用 python 的 Plotly 套件來繪製簡單的堆疊長條圖了。 🌞操作步驟 1. 選定主題,準備素材 以 2015 年 10 大癌症診斷的臨床期別分佈為例 ( 資料來源為整理國健署癌症開放資料 ) ,來看不同癌症診斷時的期別分佈情況。開始執行前,尚未安裝 plotly 者需要先安裝 plotly 套件,在 Window 環境下,開起命令提示字元,輸入 pip install plotly ,安裝完成後,就可進入繪圖步驟。 2. 確認繪圖需要用到的參數 : X 軸 (x): 不同期別所佔的比例 (%) Y 軸 (y): 各癌症的分類 3. 繪製堆疊長條圖 這邊要注意一下,操作時每一個分層要各別建構,再把各分層的圖層結合成一張圖。 import plotly.graph_objs as go import plotly.offline as py #分層為stage0 data1= go.Bar( y=df['stage0_rate'], #y軸欄位 x=df['Cancer'], #x軸欄位 name='stage0') #圖例名稱 #分層為stage1 data2= go.Bar( y=df['stage1_rate'], x=df['Cancer'], name='stage1') #分層為stage2 data3= go.Bar( y=df['stage2_rate'], x=df['Cancer'], name='stage2') #分層為stage3 data4= go.Bar( y=df['stage3_ra

從統計學視角談 商業周刊:百憂解撤台背後的砍藥價危機(61%醫師、專家:健保藥已經不堪用)

                                                                                                                         撰文:李商琪 數學、機率、統計的關聯性 對世界或生活有疑惑,大部分的人會問這是什麼 ? 對我有幫助嗎 ? 什麼樣的決定是較好的 ? 我們對世界的全貌一知半解,統計解決了我們的好奇心,用數據看社會現象了解我們所處的環境。 近期熱點議題: 頻砍藥價原廠藥恐出走健保擬保障藥品「地板價」生活 - 自由時報電子報 2019/03/29 防原廠藥出走健保擬保障藥品「地板價」 2 元起跳|蘋果新聞網|蘋果日報 2019/03/29 抗憂鬱藥品撤台揭背後的砍藥價大廠出走危機 - 財經 - 中時電子報 2019/03/30 ………… 商周 1637 期報導: 61 %醫師、專家:健保藥已經「不堪用」 數據的重要性—從資料來源開始 我們接受的資訊是否都需相信呢 ? 最近健保藥的砍藥危機,使得某些藥廠將退出台灣市場,請問以下的訊息真實性及可信度如何呢 ? 這份問卷的目的因該是讓大家快速了解健保砍藥造成的影響,資料來源為 181 位醫師與醫療、藥物專家,對象不只有醫師還有醫療和藥物專家,以下簡述問題, Q1 :近年您的臨床治療,有無感受到醫療專業要因成本考量而有所妥協? 這題的對象是醫師,才具有診斷及開藥能力,若為醫療或藥物專家是否具有相同能力,回答者中有 96% 人認為有妥協。 Q2 :您覺得健保藥品或醫材有到了不堪用的程度嗎? 此題目還提及醫材,能回答有關醫材的問題的人是醫師、病人、醫材專家 ?? ➽思考重點    問卷設計:如上    選樣偏差:樣本數是否有代表性 ??         如果相關母體 ( 全台醫師 ) 的每一個分子被選入樣本的機會並不均等,從該樣本得到的結論就可能有問題。 常見的資料收集方式 描述統計 (Descriptive statistics) : 商周蒐集資料的方式是觀測研究,抽樣調查屬於這種數據蒐集方式之一。數據呈現的方式屬 描述統計學 ,主要處理