跳到主要內容

發表文章

目前顯示的是 8月, 2020的文章

Python與SAS資料處理入門--累加處理

當資料歸戶需要加總多筆數值或累計次數成為一筆資料時就會需要用到累加的處理。   我們在做資料處理時,經常拿到的資料並非整理完成可直接進行統計分析的檔案。資料的呈現可能是個流水帳的方式,也就是同一個 ID 或是歸戶編號會有多筆資料,而在分析上我們需要將資料整合成 1 筆,才能進行後續的處理。 ²   情境 1 :就診次數 每次的就診紀錄就是 1 筆資料,但每個人可能會有不只一次的就診紀錄,如果我們需要分析每個人的平均就診紀錄時,就會需要累計這段時間的就診次數。   ²   情境 2 :每月支出 另一個簡單好理解的範例是計算每個月的花費支出,每個月都有多次的消費支出紀錄,那如果需要知道每個月支出的總金額,就需要以月為歸戶單位,加總該月的花費。   以簡單例子進行操作 延續之前的資料,以手上這份滿意度調查問卷來操作,累計每個人填答的次數。 在進行累計的操作前必須十分清楚資料需要歸戶的單位。以 情境 1 來說,歸戶的單位是人;情境 2 歸戶的單位是月份。   以 SAS 進行資料累計 proc sort data= y_2019; by id Q_date; run; /*依照ID 跟填寫日期做排序*/ data test; set y_2019; by id Q_date; if first.id then count=0; /*這邊會用到if…then的概念*/ count+1; if last.id; /*保留最後1筆ID的資料*/ keep id count; run; 這邊會需要用到排序的語法,在歸戶之前需要 依照歸戶的單位進行排序 。爾後 使用 if … then 的概念進行累計 ,這部分可理解為,依照 ID 排序後,遇到每個不同 ID 的第一筆資料, count 這個變項的數值就歸零,從新開始累計,每遇到相同的 ID 就加 1 。最後 歸人,保留每個人最後 1 筆的資料 。 執行完成後就可以得到每個人問卷填寫的次數。   以 Python 進行資料累計 y_2019["count"]= y_2019['ID'].groupby(y_2019["ID"]).cumcount()

如何快速註冊統合分析題目~以Cochrane Library為例

  初步檢索心中的愛 當然先要確定題目是否被捷足先登,這時候可以直接在 Cochrane Library 或 PudMed 上直接搜尋,若偵蒐尋到想做的題目也不要氣餒,思考文章中是否還有遺漏了甚麼或是再增加哪方面的資料,就可以更完整,可嘗試轉個彎註冊試試。 什麼是 The Cochrane?? 於 1992 年在英國成立,原本名稱為考科藍合作組織 (Cochrane Collaboration) , 2015 年考科藍合作組織正式更名為 " 考科藍 (The Cochrane)" , The Cochrane Library 是由評論小組蒐集、彙整、 評審關於醫療保健相關資料而發表的實證資料庫,對其感興趣的消費者、臨床醫師、政策制定者、研究人員、教育人員、學生和其他人士皆可使用。全球擁有 14 個區域中心及超過 26 個國家或地區分支中心,台灣在 2015 年正式成為官方認可的單位,除了英文的官網外,也可從 台灣的官網 進入獲取資訊。 步驟流程 Step 1 :檢索主題 進入 Cochrane.org 首頁後點選 Cochrane Library à 進一步點選 Advanced search ,即可輸入關鍵字查詢。 Step 2 :找尋 Cochrane Review Groups 在首頁點選 About 選擇 Cochrane Review Groups. Step 3 :點選適合主題的組別 確認自己的題目適合哪一組,每組分別有次組別,選擇次組別後進入。 Step 4 :找尋聯絡信箱 進入次組別後,點選 Contact ,這時候就可以看見 email 信箱。 Step 5 :寄信至信箱 信件內容可先簡短說明 protocol ,等對方回信後,確認此主題可註冊,會寄正式表格。 Step6 : 等待回應 屆時填答完正式表格,寄回等待審查,至少 2 周,但會依主題不同時間略有不同。   以上完成後,就是勞心勞力的開始了,不管是要做 Systematic Reviews 或 Meta analysis 皆建議可先註冊,若註冊完要對得起自己的研究道德,註冊卻不完成研究,會讓對方對這個國家的申請者有不好印象,對未來想做這方面研究的人不易申請通過,請為自己及別人留個善意,也預祝大家旗開得勝。