跳到主要內容

2019年「台南智慧城市-資料視覺應用挑戰賽」參賽心得



以下想為這次活動做個紀錄,並督促自己下次會更好。



#活動原由
3/23~3/24參加台南市政府,舉辦的「台南智慧城市-資料視覺應用挑戰賽」,活動主要目的是藉由大眾集思廣益,點出民眾的需求,公部門可收集開放數據,對資料做有效的應用,共14組參與。

我們這組的團隊領者是成大公衛所 呂宗學老師(成功大學健康資料加值應用研究中心),主題是:特搜「厝邊好醫師」糖尿病照護品質資訊。藉由網頁,糖尿病親友能搜尋到離家近、品質優良的醫療院所。

#「厝邊好醫師」特色
1.  首創針對糖尿病照護品質需求設計的入口網頁。
2.  宣傳良好照護品質知識:在首頁包含教育功能,說明糖化血色素檢查、微尿蛋尿檢查、眼底檢查、空複血脂檢查的重要性。
3.  搜尋離家近的醫療院所:地圖上可先從地區找起,並選擇醫療層級,或直接打上加以附近的路段,點選院所,可看到實況街景呈現,便於確認位置。
4. 各家醫療院所的品質排序:可察看自己家附近的優良醫療院所。
5.最佳人氣王:從地圖上可看到台南的人氣王所在位置與區域,並藉由地圖搜尋前五名品質的院所,及該院所的實際圖片。

#個人事後復盤
評審問我們以下問題:
1.  競爭對手有誰:當下愣住,努力思考有哪些競爭對手?現在回想,我們的主題其實無關有無競爭對手,並非創業比賽,能讓更多人知道此資訊並去使用品質指標,才是目的。呂老師:「我們一定要讓有價值的資訊傳遞到有需要的人手中」

換個角度思考,有競爭對手反而是好事,會喚起更多人關注且重視,醫療資訊攸關生命,是相對嚴肅的存活議題。雖然這個主題跟其他組比較下,受眾比例不高 (國健署102-104年國民營養健康狀況變遷調查,臺灣18歲以上國人糖尿病盛行率為12.3%,而國人106年主要死因排行版中,糖尿病也是位居5,死亡率5.7%台南市106年十大死因中,糖尿病佔第5,死亡率6.9%,每十萬人口死亡率有29.1%,數字不會說謊,這是糖尿病的品質照護是需具備且重要的資訊)
            
2.  誰會想用我們的系統:雖然報告時有說明是糖尿病患及親友等,但似乎評審們感覺沒什麼有需求的,感覺使用者太少,其他團隊的適用對象比較廣。
3.  怎麼評分照護品質,依四項主要檢查率高低給予醫療院所評分分數(細節部分不在文章多說明,有興趣可看我們的作品)
4.  為什麼要選糖尿病,是因為我們認為台南得糖尿病的機率高嗎?我們回答因為台中也做了糖尿病,故延續這個主題分析台南。
   這裡其實是我們疏忽的地方,沒有呈現具體數據佐證我們的議題值得重視。

#反省
1.我們沒有針對評審的背景多做了解,因此沒有交代市場分析與持續營運的模式。但我認為這並非一定要走入商業營利模式,這需政府主動帶領推廣,讓大家知道運用這個訊息,讓醫療院所醫療品質,病患生活品質都獲得提升,並減輕醫療資源濫用,讓大家至診所追蹤,使大醫院能服務更嚴重須立即救護的病人。這是個三方皆贏的策略。
2.無特別說明糖尿病發生的頻率和風險有多高,導致大家對這主題不夠熟悉,無法勾起認同感。
3. 這個議題值得被重視,比賽沒有得名,是我們簡報架構不夠完整也忽略了背景動機


#其他組別的點子
3組做旅遊,2組做違規停車,1組做長照老人活動需求,2組做偏鄉(一組偏鄉老師資源/一組偏鄉就業)1組做搜尋引擎....其他沒有印象點了。

第一名「KOH(視覺化呈現台南地區有關高齡城市議題之各區資源)
第二名「魚子這樣」(運用市府開放資料平台之旅遊觀光資料,轉化為旅遊視覺化APP)
第三名「Come True(建立平台提供徵才網頁及資源募資圖形化資料,以解決偏鄉資源不足問題)

#給承辦方 胖地 的建議
在這兩天的比賽中吃的好,地點也方便,還有遊戲室等,謝謝胖地的仔細規劃。前三名出來時,我們想知道為什這三組會得名,他們的優點在哪,可惜最後沒有針對這三組做點評說明。

#相關連結


留言

這個網誌中的熱門文章

如何快速註冊統合分析題目~以PROSPERO為例

初步檢索心中的愛 當心目中有一個理想題目時,為避免地球上另一個人也同時跟你想的一樣,而且還比我們早發表,若等我們發表時才發現,當下一定很扼腕,有了註冊系統除了幫自己先占好位子,也可以同時確認這個題目是否已經有人正在做了,不用浪費時間投注在上面。很多人其實不曉得實際上到底要如何註冊,以下一起註冊吧。 什麼是 PROSPERO??   PROSPERO (International prospective register of systematic reviews) 是一個國際前瞻性系統性文獻回顧評價系統,由美國國立衛生研究院 NIHR ( National Institute for Health Research )資助,由英國約克大學 CRD(Centre of Reviews and Dissemination) 創立,針對將已完成的評價或正進行中的計畫做紀錄。 目的:避免重複並減少報告偏見的機會,增加透明性。                 步驟流程 Step 1 :檢索主題 先確認其他人是否對這主題感興趣,有人捷足先登了嗎 ?? 也可以確認目前流行的趨勢是哪類型的研究等。 Step 2 :註冊帳號 ID 先到 PROSPERO 官網 ,填寫基本資料後註冊 ID 。 Step 3 :點選註冊文獻 review 要需先有帳號後才能註冊題目,進入頁面後依指示一步一步操作。 以下是網頁步驟,依研究對象是人群還是動物選擇按鈕點選,一般我們都是人群研究,選紫色。同時須確認以下五步驟是否都經過檢驗了。 第 1 步 檢查納入標準。 第 2 步 確保您的 protocol 處於(接近)最終形式。 第 3 步 搜尋 PROSPERO ,以確保評論尚未被註冊。 第 4 步 搜尋 PROSPERO ,以確保您沒有不必要地重複由另一個團隊進行的審核或先前已註冊的審核 第 5 步 開始註冊 Step 4 :點選相關事前準備工作進度。 這裡有一系列問題須皆回答完,才能進行下一步。 以上填完後,終於可以進入 Stage of review ,這裡依指示點選進度。 Step 5 :填寫註冊表格

Python與SAS資料處理入門-變項合併與名稱修改

將舊有的變項合併創建新變項 在處理大數據時常常會遇到需橫跨多個資料庫間進行資料串連,因此可能會遇到幾個問題 : (1) 不同資料庫間串連的鍵值欄位可能有多個,例如 :ID 與生日相同的資料才可互相串連。 (2) 不同資料庫間串聯的鍵值不盡相同。 (3) 要串聯的檔案之間有名稱相同的欄位,前幾篇文章有提到欄位合併的處理在 SAS 的語法上要注意檔案合併時欄位名稱相同會覆蓋的問題。 針對第 1 跟第 2 個問題,可先依據串聯不同資料庫鍵值的欄位需求先合併成一個 unique id ,後續直接用這個鍵值進行串連。合併後的新鍵值除了做為串檔用外,當資料處理時遇到原先鍵值不 unique 的情況,也會 透過變項合併產生新的 unique id 來取代原先的 id 鍵值 。 對於問題 3 ,檔案合併遇到命名相同的欄位產生 相互覆蓋 的問題,這部分會透過變更名稱的方式來處理。 以簡單例子進行練習 手上有 2 種檔案 : (1) 調查的基本資料,裡面包含 ID 、 Gender 、 Birthday 、 City( 戶籍地 ) 等資訊。 (2) 調查的結果,裡面包含 ID 、 Birthday 、 City( 收案地點 ) 、 Q_date( 受訪日期 ) 以及問卷題項。 問題 1: 鍵值不 unique 觀察第一份資料可以發現 ID 編號為 007 的有兩個且生日不同,因此判定可能是不同的人,編號重複編列,在這樣的情況下如果僅用 ID 串聯結果可能會是這樣。 在基本資料 (A) 的那兩筆 ID 為 007 的資料同時都會與調查結果 (B) 中 ID 為 007 那筆資料串連,但很明顯的是 B 資料的 007 合併生日判斷後可以發現不屬於 A 檔另一筆 007 的數據,因此原本 unique 的 ID 不為 unique ,因此合併 ID 與 Birthday 成為一個新的 unique ID 做為鍵值。 問題 2: 不同檔案有相同的名稱 這兩個檔案中有 2 個欄位名稱相同, Birthday 與 City 。在考量 Birthday 與 ID 將合併為新鍵值後,可暫擱一邊不需特別處理。但 City 部分的問題就比較大了,雖名稱相同但實際上代表的含意不同,如

python與SAS資料處理-歸人與排除重複

  歸人顧名思義就是將一個人多筆的資料整合,每人只留下 1 筆。   通常取得的資料都是原始資料,並未經過整理。例如手上有疑份顧客購物紀錄,裡面有每個顧客在這 1 年內的每筆消費紀錄,這是一份以每次消費紀錄為 1 筆的紀錄形式,所以一個人可以有多筆的消費紀錄。當我們想要知道這些消費紀錄源自於多少顧客的購買時,這時候就需要用到歸人的概念,將資料轉換為每一個人只有 1 筆資料的紀錄形式 ( 如下圖所示 ) 。 以 SAS 進行資料歸人 歸人留 1 筆消費紀錄 proc sort data =cost; by ID time; run ; /* 在規筆前依照 ID 跟消費日期做排序 */ data cost_1; set cost; by ID; if first.id; run ;   /* 保留第一筆資料 */   之前已經有針對 proc sort 的排序語法進行說明,有需要可參考這篇 文章 , SAS 排序的設定值為升冪,也就是說每個人都會從最早那次的紀錄開始往後排序,所以用 first.id 就可以留下每個人最早那次的消費紀錄。 這邊也可以用排除重複的概念保留 1 筆資料 proc sort data =cost out =cost_2 nodupkey ; BY ID; run ; 利用 nodupkey ,將 ID 重複的資料刪除,僅保留每個 ID 第一次出現的該筆紀錄。   歸人累計所有消費金額 proc sort data =cost; by ID time; run ; data cost_1; set cost; by ID; if first.id then count= 0 ;/* 每個人第一筆資料都令 count=0*/ count+NT;/* 同 ID 累計 NT 數值 */ if last.id; run ;   除了要歸人以外,還要累計每個仁所有的消費金額,所以這邊就會創建一個 count 欄位,每一個人的第一筆 ID 令 count=0 ,在同樣 ID 時累加 NT 的數值,最後每個人保留最後一筆 ID ,也就是最後累計的總額。 以 Python 進行資料歸人 歸人留 1 筆消費紀錄 cost.sort_v