跳到主要內容

發表文章

目前顯示的是 5月, 2020的文章

Python與SAS資料處理入門-欄位保留與刪除

透過刪除不必要欄位或保留特定欄位,讓資料表簡潔以便做後續的併檔或分析處理。 大數據除了資料筆數龐大外,通常也有很多欄位數,但實際需要的只需要幾個特定欄位時,龐大的欄位數量在處理上也會拖慢執行效能。因此依照需求使用保留特定變項或是刪除某些變項是很常使用的做法。 以簡單的例子進行操作 假定手上有 1 個 2019 年滿意度調查結果的資料,調查的問題有很多,但我們只關心前 5 題的滿意度結果,對於其他的問題不是那麼滿興趣,因此為了畫面簡潔以及避免拖慢處理速度,針對欄為進行保留、刪除的處理,接下來分別以 SAS 及 Python 進行操作示範,如果對於軟體基本概念不清楚的可參閱 此篇內容 。 以 SAS 進行欄為保留、刪除 當保留的欄位數少於將要移除的數量時,建議用 keep 保留所需的欄位。 data test; set y_2019; keep ID Q_date Q1 Q2 Q3 Q4 Q5; run ; 當保留的欄位數多於將要移除的數量時,建議用 drop 刪除不需要的欄位 data test; set y_2019; drop Q6 Q7 Q8 Q9 Q10; run ; 上面的語法,不論用 keep 或 drop 皆可達到相同的結果,因此使用者可依據需求選擇適合的指令。 以 Python 進行欄為保留、刪除 保留特定欄位時 test=y_2019[["ID","Q_date","Q1","Q2","Q3","Q4","Q5"]] 刪除特定欄位時 test=y_2019.drop (columns=["Q6","Q7","Q8","Q9","Q10"]) #使用drop函數指定刪除欄位

Tableau 設定—群組

有時候我們拿到資料時,資料的分類方式雜而亂,並非我們所需要的,這時候就需要建立新的群組,做分類繪製圖表,除了美觀外更可以符合我們需要探討的議題,這次我們由上次的長條圖來做設定。 方法一 類別變項 歸類:點選方式設定分組 Step1 :游標指向變項 à 按右鍵 à 按建立 à 按群組 Step2 :按 Ctrl 鍵 à 再將需要歸成一群的變項點出 à 畫面會呈現反藍 à 接著按群組 à 修改欄位名稱改為群組 à 再按確定。 以下可看出經由分類後的北中南部的情況了,由以下圖看來,中部的門診滿意度最高,平均超過 85 分。 方法二 連續變項 歸類: 用公式來設定分組 Step1 :游標指向杜良的空白處 à 按右鍵 à 選「建立計算欄位」 Step2 :修改欄位名稱,改為 滿意度 >85 分 à 將公式打上 à IF AVG([ 門診 ])>85 THEN " 滿意度高 " ELSE " 滿意度低 " END à 按套用 à 按確定 這部分須小心, AVG([ 門診 ])>85  " 滿意度高 "   " 滿意度低 "   ,這三個部分是可以修改的,其他為固定的公式格式,但公式需全部自己打上,固定的公式部分,如 IF ,當打上 IF 它會自動秀出可能需要的公式,這時候就可以用選的了。 Step3 :將滿意度 >85 分 拖曳至 顏色 這時候可以看到滿意度 >85 分為橘色,表示滿意度高,右上角也可以看到標示的圖案了。 以上兩種方式是很常見的群組設定方式,推薦給需要進階使用者,當然我們也可以在原始資料匯入前先,將資料直接做好群組的欄位設定,到時候進入 Tableau 只要設定欄位名稱或顏色即可,看每個人的使用習慣了。 以上