跳到主要內容

發表文章

目前顯示的是 1月, 2020的文章

讀「真確」瞭解世界貧窮,發現事情比你想的美好

作者漢斯.羅斯林有多重身分,臨床醫師、數據學家、全球公衛學家,也是知名的公共教育家,早期至第一級及第二級國家待過,致力於解決公共衛生問題,透過數據來了解世界。不靠數據無法了解世界,但光靠數據也無法了解世界。本書透過十項常見的偏誤來引導思考背後的真實原因及問題。 數據改變了你的心智 --- 世界健康圖 本書第一頁彩色世界健康圖 ,顛覆了以前腦中對世界的認知,每個泡泡代表一個國家,泡泡大小代表人口數, X 軸是收入 ( 人均 GDP 依 2011 年做調整,美元計價 ) , Y 軸是預期壽命 (life expectancy) ,若有興趣建議直接點選官方連結,可看到隨時間變化的動態發展,更可做細部的點選國家或替換 XY 軸等,常見的公衛議題如小孩死亡率、 CO2 排放、每名婦女的子女數(總生育率)等,以下是官網上呈現的 2015 年資料,以及 2018 年的分布情況。 貧窮人口比想像中的低 書中有一題題目「世界上多數人生活在哪裡 ? 」 A 低所得 、 B 中所得、 C 高所得 正解: B 中所得 A 低所得 9% 、 B 中所得 76% 、 C 高所得 16% 由圖可以看出絕大多數國家落在第二級及第三級,並非都在低所得國家裡,低所得國家比想像中來要進步,有些已晉級至中所得國家。 若大部分的人都生活在中所得的國家裡,想必貧窮應該離我們很遠,來看看以下這題: 「在過去 20 年 ,全球赤貧人口占總人口的比例是 …. ? 」 A 幾乎翻倍 、 B 大致不變、 C 幾乎減半 正解: C 幾乎減半 按照 2011 年購買力平價換算,每日收入不到 1.9 美元便屬於赤貧。世界銀行的數據顯示 1981 年赤貧人口為 42.1 %降至 2015 年的赤貧人口為 10 %,像這樣的數據其實只要查一下便可得知 真實情況 ,網路上的資訊量多且雜,若無這層思考訓練,易受媒體報紙影響,認為貧窮率高或赤貧人口激增等。書中提到的 失真型直覺偏誤 ,就屬這類,我們可以從 對比或除法 概念按比例了解事物,才能決定這個數字是否有意義。 以下為世界銀行資料: 貧困人口比例,按每天 1.90 美元衡量的( 2011 PPP ) 美元街( Dollar Street )看貧

python與SAS資料處理入門--資料匯入匯出

為什麼要學程式語言,不能用 excel 做大型資料的處理 不建議使用 excel 做大型資料處理的原因有 2 點, (1)excel 行列的限制, 2003 年以前的版本,最大資料列筆數為 65,536 行、欄位數最多為 256 列, 2007 之後的版本雖然行列都有擴展,最大資料列筆數可達到 1,048,576, 行、欄位數最多為 16,384 列,但對於現在隨便動輒幾億筆的資料來說,這真的不算什麼,因此實務上可能會遇到一份資料得分成好幾個 sheet 儲存的情況。 (2) 資料量太大,可能會遇到 excel 執行上耗時的問題。 對於即將跨入大數據的人而言, SPSS 雖然也是個不錯的選項,具有操作簡單之優勢,短期內可快速掌握,但也因介面以選單式操作為主,使用彈性相對受限,此外對於大數據處理效率也較差,如果 未來工作上需經常面對大數據 ( 例如 : 醫學資料庫、商業資料庫 ) ,建議可以直接選擇學習 SAS 、 R 或是 Python 。 以下就挑選 SAS( 付費軟體 ) 以及近年很熱門的 Python( 開源軟體 ) ,從基本的資料匯入、匯出開始介紹起。不論 SAS 或是 Python 皆可以匯入許多不同類型的檔案格式,本文就挑選幾個可能比較常接觸到的類型做說明。 以 SAS 進行操作 介面 執行 SAS 會經常使用到的視窗有幾個部分,以下簡述其用途 : (1) 編輯器:指令輸入,未來相關語法的編輯都在該視窗完成。 (2) 日誌:顯示指令執行結果,如果有程式上的執行錯誤,皆顯示於該視窗。 (3) 結果:分析結果的索引,方便使用者管理結果的部分。 (4) 檔案總管:資料集的管理,可於此處點選瀏覽資料內容。 資料匯入 (proc import) ²      Excel 檔案匯入 proc import datafile = "c:\test.xlsx" /* 資料匯入的路徑 */ out =test  /* 資料匯入後的名稱 */ dbms =xlsx replace; /* 輸入檔案的類型 */ sheet = " Sheet" ; /* 選擇讀取的工作表 */ getnames =YES; /* 第一

新手入門Tableau—安裝與導入資料瑞

        瑞典教授 / 醫師 Hans Rosling :「讓我的數據改變你的心智」,藉由資料數據視覺化,讓人們更容易理解數據、提升決策信心、溝通效率、增加吸引力 ,更願意閱讀,勾起渴望了解的心態後,將數據的意涵傳播的更遠了。 以下介紹 Tableau 的入門,了解一門好用工具達到事半功倍的效果。 🌞 Tableau 版本介紹 ·    付費版 Tableau  Server :企業私有雲端儲存,將桌面製圖後上傳至此雲端。  Tableau  Desktop :擁有商業的完整功     能,是公司。 Tableau  Online :透過瀏覽器線上分析及製圖編輯。 ·    免費版 Tableau  Public :個人需求使用,可滿足絕大部分分析。  Tableau  Reader :提供桌面的瀏覽體驗。 ➤ Tableau Public 版本   Step1 :進行註冊 填入 mail 後即可進行安裝作業。 Step2 :安裝完成後進入畫面 Step3 :導入資料 Step4 :導入資料畫面操作 🌞 認識製作環境 1.        數據與分析視窗:分為維度與量值兩區域, Tableau 會自動依數據屬性將資料放應至相對的位置。 2.        頁面設定:將維度或量值拆分多個畫面的功能區。 3.        過濾設定:設定包含或排除的數據。 4.        標記設定:可設定資料的顏色、大小、提示文,很常使用到的功能。 5.        行與列設定:設定資料的「行」與「列」,可清楚呈現邏輯。 6.        工作畫布:視覺化的圖表呈現區。 7.        圖形選擇:視覺化圖形選擇區,依資料型態自動化選取適合圖表,也可手動選取。 8.        資料來源與設計頁籤:切換資料來源與編輯成果區,可設立圖表、儀表板及故事頁籤等。 今天就先介紹到這,了解基本操作介面後,後續操作將容易許多,這一個讓數據平民化的好工具。