跳到主要內容

發表文章

目前顯示的是 3月, 2019的文章

【懶人圖解簡報術】-秒懂圖解技術正流行。將複雜變簡單的好幫手。

https://www.books.com.tw/products/0010814914 看完本書後,以「台南智慧城市 - 資料視覺應用挑戰賽」參賽作品文案,重新設計排版。 實做體驗 目的:提供台南市糖尿病的親友 / 民眾,選擇離家近的醫療單位,或合適的醫師就醫,藉由簡報說明期望大家能使用視覺化的網站做搜尋。 如何發想圖解簡報 ? 首要清楚明白這簡報做給誰看,須走入人心換位思考,最後預測問題。作者提供十種熱門主題架構供參考模擬。 轉換專業術語 除了運用經驗讓觀眾感同身受外,也須懂得設計情境,建立觀眾腦中的清楚框架,書中建議以 SCAN 法則架構。 Situation( 現況 ) 、 Consequence( 後果 ) 、 Aims( 目標 ) 、 Need( 解法 ) 等,牽動觀眾的心情建立記憶點。 從無到有的圖解簡報 作者製作懶人包讓你可以依循簡單步驟作出圖表來,是一個很好的指導篇幅,可以讓自己快速進入流程中,除了友好的主題及構想,也需要有順暢的排版原則。 我總認為眼睛的舒適度是重要的,不只排版,連色彩、位置、留白等都需花心思構圖,若沒有好的藝術天份,至少極簡風格是不易出錯的選項,讓畫面顏色少,空白多,排列整齊,基本上作出來的簡報很難道不起眼的程度,至少閱讀舒適無負擔。 說再多都沒有用,立馬實做,過程中記憶與熟悉度才會留存,透過記錄可幫助自己修正 ,並增加成就感 ,推薦大家趕快試試 。 相關連結 懶人圖解簡報術購買

使用python繪製視覺化--橫向長條圖

長條圖是利用長條長度的不同來表示數量 ( 百分比 ) 的多少 一般在使用上常常會把長條圖跟直方圖搞混。 長條圖 的主要特徵是 長條間 不相連 ,類別間可以任意調換位置,因此一般會使用在非 連續型資料 上,例如 : 不同城市的人口數、不同產品的銷售量。 直方圖則是長條間 相連 ,因此一般會使用在 連續型資料上,例如 : 身高分佈。 這次就利用 python 的 Plotly 套件來繪製簡單的橫向長條圖。 操作步驟 1. 選定主題,準備素材 以 2012 年 10 大癌症藥費佔醫療花費的比例為例 ( 資料來源為政府開放資料 ) 。開始執行前需要先安裝 plotly 套件,在 Window 環境下,開起命令提示字元,輸入 pip install plotly ,安裝完成後,就可進入繪圖步驟。 2. 確認繪圖需要用到的參數 X 軸 ( x ): 各癌症的分類 Y 軸 ( y ): 各癌症藥費佔醫療花費的比例 (%) 3. 繪製長條圖 語法 : import plotly.graph_objs as go import plotly.offline as py data= [go.Bar( y=df_hb['Cancer'], #y軸欄位 x=df_hb['med_rate1'], #x軸欄位 orientation='h', #調整成橫向 text=df_hb['med_rate1'], #長條圖上標示資料數值 textposition = 'auto', #長條圖上標示資料數值的位子,有auto、inside、outside可以做設定 #長條圖顏色設定 marker=dict( color='rgb(158,202,225)', #長條圖填滿部分顏色設定 line=dict(color='rgb(8,48,107)')) #長條圖外框顏色設定 )] #圖表外層設定 layout=go.Layout( title='2012年十大癌症藥費佔比', t

使用python繪製視覺化--動態泡泡圖

近年視覺化受到很高的關注熱度,生硬的數據藉由視覺化帶出了靈魂,拉近了溝通的距離,達到訊息的有效傳遞,成大教授呂宗學老師對視覺化有一段很精闢的闡述 : 「視覺化的目的,幫助觀眾在茫茫數據中,找到原本想要找數據,發現原本看不到的問題。」。 本著這個想法,將政府開放的公開數據做運用,以較容易理解的方式做視覺化呈現,起初選定台灣公部門使用度較高的 Tableau 軟體,希望能將歷年累積的數據用動態的方式呈現於網頁上,但嘗試後發現, Tableau 動態泡泡圖僅能於儀錶板上呈現,發佈成網頁後就無動態播放的功能,且於 2012 年開始就有相關使用者反應希望未來可以有這項功能,只是截至 2018 年底仍未有這項功能 ( 如果希望 Tableau 新增這項功能,可以來此投票 : https://community.tableau.com/ideas/1201 ) 。 有鑑於此,與其受限於現有的軟體功能不如轉個彎使用 python , python 有相當多的軟體套件可以運用,基本上可以涵蓋大部分想要呈現的視覺化做圖。 這次介紹一個比較簡單的套件 bubbly , bubbly 套件運用 Plotly 套件的一些功能,畫出動態泡泡圖,讓使用者可以不用撰寫繁複的語法,只要對 python 有基本的概念,就可以運用 bubbly 套件,帶入參數,畫出如同 Hans Rosling 在 TED Talk 令人讚嘆的視覺化呈現。 泡泡圖是一種散佈圖的變化型,將原本的沒有提供資訊的點替換成泡泡,利用泡泡的大小提供多一個維度的訊息 操作步驟 1. 選定主題,準備素材 以 2012-2016 年 10 大癌症醫療花費及死亡率變化為例 ( 資料來源為政府開放資料 ) ,畫出動態泡泡圖。開始執行前需要先安裝套件 bubbly 跟 plotly ,在 Window 環境下,開起命令提示字元,輸入 pip install bubbly 以及 pip install plotly ,安裝完成後,就可進入繪圖步驟。 2. 確認繪圖需要用到的參數 : X 軸 (x_column): 各癌症醫療花費總額 ( 單位 : 新台幣億元 ) Y 軸 (y_column): 各癌症死亡率 (%) 泡泡大小 (size_column): 各癌症就醫人數 泡泡顏

2019年「台南智慧城市-資料視覺應用挑戰賽」參賽心得

以下想為這次活動做個紀錄,並督促自己下次會更好。 # 活動原由 3/23~3/24 參加台南市政府,舉辦的「台南智慧城市 - 資料視覺應用挑戰賽」,活動主要目的是藉由大眾集思廣益,點出民眾的需求,公部門可收集開放數據,對資料做有效的應用,共 14 組參與。 我們這組的團隊領者是成大公衛所 呂宗學老師 ( 成功大學健康資料加值應用研究中心 ) ,主題是: 特搜「厝邊好醫師」 糖尿病照護品質資訊 。藉由網頁,糖尿病親友能搜尋到離家近、品質優良的醫療院所。 # 「厝邊好醫師」特色 1.   首創針對糖尿病照護品質需求設計的入口網頁。 2.   宣傳良好照護品質知識:在首頁包含教育功能,說明糖化血色素檢查、微尿蛋尿檢查、眼底檢查、空複血脂檢查的重要性。 3.   搜尋離家近的醫療院所:地圖上可先從地區找起,並選擇醫療層級,或直接打上加以附近的路段,點選院所,可看到實況街景呈現,便於確認位置。 4.   各家醫療院所的品質排序:可察看自己家附近的優良醫療院所。 5.最佳人氣王:從地圖上可看到台南的人氣王所在位置與區域,並藉由地圖搜尋前五名品質的院所,及該院所的實際圖片。 # 個人事後復盤 評審問我們以下問題: 1.   競爭對手有誰 :當下愣住,努力思考有哪些競爭對手?現在回想,我們的主題其實無關有無競爭對手, 並非創業比賽 ,能讓更多人知道此資訊並去使用品質指標,才是目的。呂老師: 「我們一定要讓有價值的資訊傳遞到有需要的人手中」 。 換個角度思考,有競爭對手反而是好事,會喚起更多人關注且重視,醫療資訊攸關生命,是相對嚴肅的存活議題。雖然這個主題跟其他組比較下,受眾比例不高 ( 國健署 102-104 年國民營養健康狀況變遷調查, 臺灣 18 歲以上國人 糖尿病盛行率為 12.3% ,而 國人 106 年主要死因排行版中,糖尿病也是位居 第 5 名 ,死亡率 5.7% ; 台南市 的 106 年十大死因中, 糖尿病佔第 5 名 ,死亡率 6.9% ,每十萬人口死亡率有 29.1% ,數字不會說謊,這是糖尿病的品質照護是需具備且重要的資訊 ) 。              2.   誰會想用我們的系統 :雖然報告時有說明是糖尿病患及親友等,但似乎評審們感覺沒什麼有需求的,感覺使用者太

【商業思維】掌握數據脈絡,管理/研究不偏失。 商業的基礎也需數據資料做輔助。

雷軍:「不要以戰術上的勤奮,來掩蓋戰略上的懶惰。」 參加#中正大學南科創新育成基地所舉辦的讀書會 , 作者游舒帆 Gipi 大量閱讀後將商業的價值、目標、知識融會貫通後產出一本有架構且幫助進入狀況的商管工具書,好比吃了十全大補丸後依每個人體質不同而吸收差異轉換成自己的知識。 經營的本質是「營利」,那什麼是 經營者? 【 經營者養成筆記 】 柳井正說 : 「一言以蔽之就是『懂得創造成果的人』」。要如何獲利呢 ? 了解收入的脈絡是關鍵,脈絡中的結構都代表跟營利有關,在思考時將每個結構都引導到最終目標獲利上,便能把握公司的利潤結構具體掌握管理的脈絡。 商業思維的全貌: 數據、營運、策略、敏捷 本書圍繞這四個主軸去分析每步驟該如何思考,   Ø    數據力 ,如何用運數據指標讓自己了解公司現況,內容包含毛利、淨利、業績、回購率等,可利用設立目標的 SMART 原則幫助清晰數據化, 我們希望在三個月內,藉由積極互動提升客戶對我們的認知,詢問度從 1% 提升到 5% ,滿意度由 5 提升到 7 分以上,回購率提升至 2% ,營收的貢獻每季提升至 2% ,此業務由 Nicole 負責。 S pecific 具體明確:   讓客戶認識到我們,詢問度從 1% 提升到 5%   客戶的滿意度由 5 提升到 7 分以上   客戶的回購率提升至 2% M easurable 可測量的: 1% 提升到 5% , 5 提升到 7 分以上。衡量的基準是什麼 ? 比如主動打電話聯絡比例, FB/ 部落格留言按讚數 … 等。 A ttainable 可達成的:目標不可好高騖遠, 1% 提升到 5% ,而不是提升到 10% 。 R elevant 相關聯的:與工作內容相關的人負責 。 T ime bound 時效性:三個月 。 Ø    營運力 ,了解客戶的營運週期,客戶獲取 (Acquisition) 、客戶留存 (Retention) 、客戶忠誠 (Loyalty) ,一般獲取新客戶的成本高,若能從舊客戶著手避免流失並喚醒靜止客戶是比較優先的選擇,可盤點自己舊客戶名單適時拜訪了

敏感度、特異度的盲點

敏感度、特異度對於學過流行病學的人應該都不陌生,甚至說相當熟悉,有相當多的實戰經驗,不過可能不少人跟我一樣把敏感度、特異度以及 AUC 的數值呈現完後,就停筆在此了,除非審查委員有特別要求,不然不會特別呈現陽性預測值、陰性預測值的結果。但是在聽了成大 2018 年底石瑜老師的短期授課後,深刻的理解到以後不能偷懶,陽性預測值、陰性預測值都應該主動回報在文章中。 陽性預測值、陰性預測值的重要性 為什麼主動在文章中主動回報陽性預測值、陰性預測值這件事重要,以下跟大家分享一下石瑜老師舉的例子 : 這是 2015 年發表於 The new england journal o f medicine 的文章,文章主要探討 Cell-free DNA (cfDNA) 的這個新的檢測技術相較於傳統羊膜穿刺術 在檢測唐氏症上是否比較好。 研究期間從 2012 年 3 月至 2013 年 4 月,涵蓋 6 個國家 35 個中心,納入需要做 First Trimester Screening 的孕婦,符合資格的媽媽會同時接受傳統羊膜穿刺以及 Cell-free DNA (cfDNA) 的檢測,但同意參加的媽媽只會收到傳統羊膜穿刺的檢測結果,為了不影響研究 Cell-free DNA (cfDNA) 的檢測結果到最後才做解盲。最後有 15,841 個媽媽進入分析 ( 相關研究設計的細節在此就不細講 ) 。 看到結果可以發現,不論是 羊膜穿刺 或是 cfDNA 的 AUC 都非常接近 1 。 再往下看敏感度、特異度,羊膜穿刺的敏感度 78.9% ,特異度 94.6% , cfDNA 敏感度 100% ,特異度 99.9% ,看起來羊膜穿刺的敏感度沒有 cfDNA 好,但特異度兩個檢測方法都相當高。 如果只看到這裡會覺得 新的檢測技術 cfDNA 比羊膜穿刺好 ,但當 cfDNA 的檢測花費比羊膜穿刺高出許多,就會開始思考,這樣的差異是否值得。 大家耐心得繼續往下看表的下半部,可發現羊膜穿刺與 cfDNA 在陽性預測值上有很大差異, 羊膜穿刺的陽性預測值只有 3.4% ,也就是檢測出 100 個陽性中只有 3 至 4 個真的是唐氏症寶寶,有將近 97 個媽媽在孕程中一直擔驚受怕 !!!  而新