新手入門Tableau—安裝與導入資料瑞

瑞典教授/醫師Hans Rosling：「讓我的數據改變你的心智」，藉由資料數據視覺化，讓人們更容易理解數據、提升決策信心、溝通效率、增加吸引力，更願意閱讀，勾起渴望了解的心態後，將數據的意涵傳播的更遠了。以下介紹Tableau的入門，了解一門好用工具達到事半功倍的效果。

🌞Tableau版本介紹

· 付費版

Tableau Server：企業私有雲端儲存，將桌面製圖後上傳至此雲端。

Tableau Desktop：擁有商業的完整功

能，是公司。

Tableau Online：透過瀏覽器線上分析及製圖編輯。

· 免費版

Tableau Public：個人需求使用，可滿足絕大部分分析。

Tableau Reader：提供桌面的瀏覽體驗。

➤Tableau Public版本

Step1：進行註冊

填入mail後即可進行安裝作業。

Step2：安裝完成後進入畫面

Step3：導入資料

Step4：導入資料畫面操作

🌞認識製作環境

1. 數據與分析視窗：分為維度與量值兩區域，Tableau會自動依數據屬性將資料放應至相對的位置。

2. 頁面設定：將維度或量值拆分多個畫面的功能區。

3. 過濾設定：設定包含或排除的數據。

4. 標記設定：可設定資料的顏色、大小、提示文，很常使用到的功能。

5. 行與列設定：設定資料的「行」與「列」，可清楚呈現邏輯。

6. 工作畫布：視覺化的圖表呈現區。

7. 圖形選擇：視覺化圖形選擇區，依資料型態自動化選取適合圖表，也可手動選取。

8. 資料來源與設計頁籤：切換資料來源與編輯成果區，可設立圖表、儀表板及故事頁籤等。

今天就先介紹到這，了解基本操作介面後，後續操作將容易許多，這一個讓數據平民化的好工具。

留言

這個網誌中的熱門文章

如何快速註冊統合分析題目~以PROSPERO為例

初步檢索心中的愛當心目中有一個理想題目時，為避免地球上另一個人也同時跟你想的一樣，而且還比我們早發表，若等我們發表時才發現，當下一定很扼腕，有了註冊系統除了幫自己先占好位子，也可以同時確認這個題目是否已經有人正在做了，不用浪費時間投注在上面。很多人其實不曉得實際上到底要如何註冊，以下一起註冊吧。什麼是 PROSPERO?? PROSPERO (International prospective register of systematic reviews) 是一個國際前瞻性系統性文獻回顧評價系統，由美國國立衛生研究院 NIHR （ National Institute for Health Research ）資助，由英國約克大學 CRD(Centre of Reviews and Dissemination) 創立，針對將已完成的評價或正進行中的計畫做紀錄。目的：避免重複並減少報告偏見的機會，增加透明性。步驟流程 Step 1 ：檢索主題先確認其他人是否對這主題感興趣，有人捷足先登了嗎 ?? 也可以確認目前流行的趨勢是哪類型的研究等。 Step 2 ：註冊帳號 ID 先到 PROSPERO 官網，填寫基本資料後註冊 ID 。 Step 3 ：點選註冊文獻 review 要需先有帳號後才能註冊題目，進入頁面後依指示一步一步操作。以下是網頁步驟，依研究對象是人群還是動物選擇按鈕點選，一般我們都是人群研究，選紫色。同時須確認以下五步驟是否都經過檢驗了。第 1 步檢查納入標準。第 2 步確保您的 protocol 處於（接近）最終形式。第 3 步搜尋 PROSPERO ，以確保評論尚未被註冊。第 4 步搜尋 PROSPERO ，以確保您沒有不必要地重複由另一個團隊進行的審核或先前已註冊的審核第 5 步開始註冊 Step 4 ：點選相關事前準備工作進度。這裡有一系列問題須皆回答完，才能進行下一步...

閱讀完整內容

python與SAS資料處理-歸人與排除重複

歸人顧名思義就是將一個人多筆的資料整合，每人只留下 1 筆。通常取得的資料都是原始資料，並未經過整理。例如手上有疑份顧客購物紀錄，裡面有每個顧客在這 1 年內的每筆消費紀錄，這是一份以每次消費紀錄為 1 筆的紀錄形式，所以一個人可以有多筆的消費紀錄。當我們想要知道這些消費紀錄源自於多少顧客的購買時，這時候就需要用到歸人的概念，將資料轉換為每一個人只有 1 筆資料的紀錄形式 ( 如下圖所示 ) 。以 SAS 進行資料歸人歸人留 1 筆消費紀錄 proc sort data =cost; by ID time; run ; /* 在規筆前依照 ID 跟消費日期做排序 */ data cost_1; set cost; by ID; if first.id; run ; /* 保留第一筆資料 */ 之前已經有針對 proc sort 的排序語法進行說明，有需要可參考這篇文章， SAS 排序的設定值為升冪，也就是說每個人都會從最早那次的紀錄開始往後排序，所以用 first.id 就可以留下每個人最早那次的消費紀錄。這邊也可以用排除重複的概念保留 1 筆資料 proc sort data =cost out =cost_2 nodupkey ; BY ID; run ; 利用 nodupkey ，將 ID 重複的資料刪除，僅保留每個 ID 第一次出現的該筆紀錄。歸人累計所有消費金額 proc sort data =cost; by ID time; run ; data cost_1; set cost; by ID; if first.id then count= 0 ;/* 每個人第一筆資料都令 count=0*/ count+NT;/* 同 ID 累計 NT 數值 */ if last.id; run ; 除了要歸人以外，還要累計每個仁所有的消費金額，所以這邊就會創建一個 count 欄位，每一個人的第一筆 ID 令 count=0 ，在同樣 ID 時累加 NT 的數值，最後每個人保留最後一筆 ID ，也就是最後累計的總額。以 Python 進行資料歸人...

閱讀完整內容

python與SAS資料處理入門--資料匯入匯出

為什麼要學程式語言，不能用 excel 做大型資料的處理不建議使用 excel 做大型資料處理的原因有 2 點， (1)excel 行列的限制， 2003 年以前的版本，最大資料列筆數為 65,536 行、欄位數最多為 256 列， 2007 之後的版本雖然行列都有擴展，最大資料列筆數可達到 1,048,576, 行、欄位數最多為 16,384 列，但對於現在隨便動輒幾億筆的資料來說，這真的不算什麼，因此實務上可能會遇到一份資料得分成好幾個 sheet 儲存的情況。 (2) 資料量太大，可能會遇到 excel 執行上耗時的問題。對於即將跨入大數據的人而言， SPSS 雖然也是個不錯的選項，具有操作簡單之優勢，短期內可快速掌握，但也因介面以選單式操作為主，使用彈性相對受限，此外對於大數據處理效率也較差，如果未來工作上需經常面對大數據 ( 例如 : 醫學資料庫、商業資料庫 ) ，建議可以直接選擇學習 SAS 、 R 或是 Python 。以下就挑選 SAS( 付費軟體 ) 以及近年很熱門的 Python( 開源軟體 ) ，從基本的資料匯入、匯出開始介紹起。不論 SAS 或是 Python 皆可以匯入許多不同類型的檔案格式，本文就挑選幾個可能比較常接觸到的類型做說明。以 SAS 進行操作介面執行 SAS 會經常使用到的視窗有幾個部分，以下簡述其用途 : (1) 編輯器：指令輸入，未來相關語法的編輯都在該視窗完成。 (2) 日誌：顯示指令執行結果，如果有程式上的執行錯誤，皆顯示於該視窗。 (3) 結果：分析結果的索引，方便使用者管理結果的部分。 (4) 檔案總管：資料集的管理，可於此處點選瀏覽資料內容。資料匯入 (proc import) ² Excel 檔案匯入 proc import datafile = "c:\test.xlsx" /* 資料匯入的路徑 */ out =test /* 資料匯入後的名稱 */ dbms =xlsx replace; /* 輸入檔案的類型 */ sheet = " Sheet" ; /* 選擇讀取的工作表 */ getnames =YES; /* 第一...

閱讀完整內容

臨床統計農莊

搜尋此網誌