使用Tableau 繪製—折線圖 (Line Chart)

折線圖是最常用來呈現兩個維度的量化關係圖表，與長條圖 (bar chart)最大的不同於，折線圖適用於連續資料，長條圖則是類別資料。折線圖可用來傳達趨勢的變化(銷售金額、保險費用、醫療費用…等)，將資料點與點之間用線接起來的變化圖。

這次我們還是用醫院服務滿意度資料，變項中多了年代，可比較不同時間點的滿意度圖表。

Step1：度量名稱丟入畫布中，它會自動視為「列」的資料，此時的度量名稱包含門診、急診、住院的滿意度分數，注意這裡的數值為加總後的分數。

Step2：Year丟入欄中。這時候可以看見畫布中的數值，在左邊的畫布中也同時出現折線圖的圖示。

Step3：點選折線圖示。可以看見門診、急診及住院的線條，此線條從2015~2021年，但實際上並沒有2015及2021年的資料，且數值的加總的總和，並非平均值，因此我們下一步需要做調整。

Step4：調整圖表內容。將Year修正成2016~2020，可在X軸

Year上按右鍵後，調整年代。同時在列上將門診急診住院調整成平均值，也同時將計數移除。

現在我們完成一張折線圖了，也可以自由調整線的顏色及大小，或是增加參考線等等，因為我們的滿意度每年差異不大，因此較難看出趨折的變化，這也代表每年的滿意度都維持一定的水準，至少皆有85分以上。

留言

這個網誌中的熱門文章

如何快速註冊統合分析題目~以PROSPERO為例

初步檢索心中的愛當心目中有一個理想題目時，為避免地球上另一個人也同時跟你想的一樣，而且還比我們早發表，若等我們發表時才發現，當下一定很扼腕，有了註冊系統除了幫自己先占好位子，也可以同時確認這個題目是否已經有人正在做了，不用浪費時間投注在上面。很多人其實不曉得實際上到底要如何註冊，以下一起註冊吧。什麼是 PROSPERO?? PROSPERO (International prospective register of systematic reviews) 是一個國際前瞻性系統性文獻回顧評價系統，由美國國立衛生研究院 NIHR （ National Institute for Health Research ）資助，由英國約克大學 CRD(Centre of Reviews and Dissemination) 創立，針對將已完成的評價或正進行中的計畫做紀錄。目的：避免重複並減少報告偏見的機會，增加透明性。步驟流程 Step 1 ：檢索主題先確認其他人是否對這主題感興趣，有人捷足先登了嗎 ?? 也可以確認目前流行的趨勢是哪類型的研究等。 Step 2 ：註冊帳號 ID 先到 PROSPERO 官網，填寫基本資料後註冊 ID 。 Step 3 ：點選註冊文獻 review 要需先有帳號後才能註冊題目，進入頁面後依指示一步一步操作。以下是網頁步驟，依研究對象是人群還是動物選擇按鈕點選，一般我們都是人群研究，選紫色。同時須確認以下五步驟是否都經過檢驗了。第 1 步檢查納入標準。第 2 步確保您的 protocol 處於（接近）最終形式。第 3 步搜尋 PROSPERO ，以確保評論尚未被註冊。第 4 步搜尋 PROSPERO ，以確保您沒有不必要地重複由另一個團隊進行的審核或先前已註冊的審核第 5 步開始註冊 Step 4 ：點選相關事前準備工作進度。這裡有一系列問題須皆回答完，才能進行下一步...

閱讀完整內容

使用python繪製Upset plot

Upset plot 將集合視覺化，特別是當集合數大於 5 的時候， Upset plot 相較於 Venn plot 可以更清楚的呈現。 Upset plot 來自於 Venn plot 的變化， Venn plot 較常用於生物資訊呈現 ( 圖 1-3) ，但是往往會遇到集合數太多不易呈現的情況，從下圖可清楚看到當集合數為 4 的時候，畫面已經有些複雜，所以 Venn plot 的缺點就是當集合數過多時，畫面所呈現的資訊反而會造成視覺上的負擔，增加訊息解讀的困難性，失去視覺化的意義 — 方便閱讀，因此當集合數 ≥5 時不建議使用 Venn plot ，而後衍生出 Upset plot 。 Upset plot 優勢在於當集合數 ≥5 時可以清楚呈現資訊，不會造成視覺上的混亂。 2020 年影響全球的 COVID-19 ，在面對未知的流行病時沒有人可以確定真正有效的治療物，因此優先挑出具有高度可能性的藥物，嘗試用於治療病患，在高度不確定性的情況下會產生多種治療組合，這樣的情況就很適合採用 Upset plot 呈現 Real World 用藥資料，這裡有一篇發表於 CANCER DISCOVERY 的文章，這是一個很好的實務範例 ( 圖 4) ，以下擷取這篇 paper 的部份數據，簡單的做個 Upset plot 。操作步驟 1. 選定主題，準備素材以這篇文章中的數據來畫 Upset plot 圖。開始執行前，需要先安裝 Upset plot 的套件。在 Window 環境下，開起命令提示字元，輸入 pip install upsetplot ，安裝完成後，就可進入繪圖步驟。 2. 繪製 Upset plot 這邊帶入 paper 中前 10 筆的數據。 from upsetplot import generate_counts from upsetplot import plot from upsetplot import from_memberships example = from_memberships([['Azithromycin','Hydroxychloroquine'], ['Hydroxychloroquine'...

閱讀完整內容

python與SAS資料處理-歸人與排除重複

歸人顧名思義就是將一個人多筆的資料整合，每人只留下 1 筆。通常取得的資料都是原始資料，並未經過整理。例如手上有疑份顧客購物紀錄，裡面有每個顧客在這 1 年內的每筆消費紀錄，這是一份以每次消費紀錄為 1 筆的紀錄形式，所以一個人可以有多筆的消費紀錄。當我們想要知道這些消費紀錄源自於多少顧客的購買時，這時候就需要用到歸人的概念，將資料轉換為每一個人只有 1 筆資料的紀錄形式 ( 如下圖所示 ) 。以 SAS 進行資料歸人歸人留 1 筆消費紀錄 proc sort data =cost; by ID time; run ; /* 在規筆前依照 ID 跟消費日期做排序 */ data cost_1; set cost; by ID; if first.id; run ; /* 保留第一筆資料 */ 之前已經有針對 proc sort 的排序語法進行說明，有需要可參考這篇文章， SAS 排序的設定值為升冪，也就是說每個人都會從最早那次的紀錄開始往後排序，所以用 first.id 就可以留下每個人最早那次的消費紀錄。這邊也可以用排除重複的概念保留 1 筆資料 proc sort data =cost out =cost_2 nodupkey ; BY ID; run ; 利用 nodupkey ，將 ID 重複的資料刪除，僅保留每個 ID 第一次出現的該筆紀錄。歸人累計所有消費金額 proc sort data =cost; by ID time; run ; data cost_1; set cost; by ID; if first.id then count= 0 ;/* 每個人第一筆資料都令 count=0*/ count+NT;/* 同 ID 累計 NT 數值 */ if last.id; run ; 除了要歸人以外，還要累計每個仁所有的消費金額，所以這邊就會創建一個 count 欄位，每一個人的第一筆 ID 令 count=0 ，在同樣 ID 時累加 NT 的數值，最後每個人保留最後一筆 ID ，也就是最後累計的總額。以 Python 進行資料歸人...

閱讀完整內容

臨床統計農莊

搜尋此網誌