2018年5月24日 星期四

[活動紀錄] 4/22 「資料英雄計畫」成果分享 & 夏季班招募

D4SG 資料英雄計畫已經邁入第三年。有感於非營利組織與政府部門在公共議題的倡議與服務中,雖然累積了大量的營運數據,卻無法發揮資料價值,於是由 DSP 智庫驅動開拓文教基金會、「社群運算與巨量資料 – ITSA 教育部資通訊軟體創新人才推升計畫」發起這個長期計畫。主要運作方式為:由「政府機關」或「非營利組織」提案,D4SG 顧問協助規劃資料科學分析專案,在兼具「高度社會影響力」與「再利用性」的前提下,媒合民間熱血的資料英雄,利用三個月的工作時間共同完成。

希望透過協助非政府組織與政府機關提升資料素養,發掘資料價值,並透過資料分析促成跨域對話,進而解決社會問題,並期待激發出各種創新的公共服務。

新一季的夏季班已經開放招募,即日起到6/11接受報名,歡迎有興趣的非營利組織夥伴們一起來提案(詳見官方網頁)——不須費用,但需要你的熱情、時間與專業領域的知識!



本場成果分享會,包含 2018 年1~4月執行的四組專案,包括:

  1. 雙北兒少暴力風險預警管理(新北市 × 臺北市 家庭暴力暨性侵害防治中心)
  2. 脫貧潛客分析(臺北市政府社會局)
  3. 法律扶助資源配置優化(法律扶助基金會)
  4. 外傷醫療功德工程(台灣外傷醫學會)
(下文引用資料來源:成果分享會的報名網頁DSP智庫驅動提供的現場照片

1. 雙北兒少暴力風險預警管理

透過資料分析,找出兒少再受虐案件的危險因子,並針對兒少保護案件之風險程度進行分級,協助社工選擇適當的處遇策略,進而提升組織服務效能。

提案單位:新北市 × 臺北市 家庭暴力暨性侵害防治中心
關鍵詞:兒少暴力、風險預測、危險因子
資料英雄:蔡燕如、傅信穎、郭家諭、賴湘如、林品緯、劉祐瑄、葉憲周、邱詩涵
專案顧問:謝宗震

專案目標希望能「將有限人力充分運用」。透過資料了解到的現況:

  • 通報案件的調查
    • 7成不開案(包含危險客群卻沒開案)
    • 3成會開案
  • 開案輔導到結案
    • 8成新案件(新案件的輔導處遇)
    • 2成舊案件(舊案件的回頭通報)
以2015-2017年的資料來看,3年內雙北兒少接獲通報的相關資料共有2.1萬筆。本次提案希望能增進有效、準確地判斷,並減少案件調查的時間,轉而將時間集中於案件的處遇。

透過資料,將地點做成「不成案的熱區地圖」,並發現時間上4-6月、9-11月的案件量比較多,通報來源多為教育單位,至於「年齡」因素,則沒有太多直接關聯。也針對舊案件的回頭分類,發現各個階段都有可能回頭。



案件通報後,必須在規定的時間內完成調查報告,而「不當對待的行為」和「照護者的狀態」可作為判斷指標,其中歸納出5種回頭的重要關鍵因素:

  1. 兒少曾被通報遭不當對待
  2. 照護者有家暴紀錄
  3. 藥酒毒癮、精神疾患
  4. 照護者有能力、有意願保護兒少安全
  5. 有其他問題需要協助
此外,也透過「家庭功能評估表」的資料來看。最後以「從單一家庭特徵,判斷回頭機率的可能」,製作出預警模型,其中重複通報的家庭約有31%,從這裡面可以進一步分析以提昇處遇的品質。



回饋:

  • 這個專案的過程是把人的工作邏輯化
  • 目前新北市的兒少保護社工約有70位,但每年平均有1萬件的通報,因此期待預警模型可以協助讓有限的資源做更好的配置、運用。
  • 過去從經驗中可知連假會是通報高峰期,但沒想到和回頭客也有關係。
  • 未來更進一步,希望知道處遇結案後,為何還會回頭?
  • 現場詢問:
    • 社工的專業意見是否納入模型的評估中?社工的經驗仍是重要的,希望在這過程中,可以加上數據作為支持性的證據。
    • 為何選擇以模型方式呈現?對預測結果滿意嗎?因為這個方法做的模型解釋度比較高。基本上大於0.5的數值通常會回頭,重點是如何去解釋其中的理由。
2. 脫貧潛客分析

為了協助低收入戶及中低收入戶家庭脫貧自立,擬訂積極性脫離貧窮之服務,找出有迫切服務需求及具有脫貧潛力之對象,擬定對症下藥之脫貧策略,協助其真正自立脫貧,將有限資源發揮最大效用。

提案單位:臺北市政府社會局
關鍵詞:低收入戶、貧窮線、潛客分析
資料英雄:蔡佳淳、陳上峰、李泓旻、楊思、葉子蓁、張哲偉
專案顧問:謝宗震、陳潔寧



這個提案透過檢視北市社會局現行的脫貧方案措施,看看在脫貧的成效上,方案的合適性與內容是否需要調整。脫貧方案的內容包括:

  • 定期儲蓄(按月儲蓄、提撥培育金)
  • 教育課程(自我探索、理財等多元課程,及成長團體工作坊)
  • 團體任務(學習人際互動、建立社會支持網絡)
  • 公共服務(增進分享互助、進行服務時數)
透過資料分析,想了解「家庭特徵 vs 方案內容」的合適性。家庭特徵的資料,包括:
  1. 家戶人口分布(年齡、在學、工作等等)
  2. 居住地
  3. 其他的弱勢身份
通常家戶內有青年人口的脫貧率會上升,因為18歲成年之後,比較有賺錢的生產力,參加專案的比例也較高。

本專案以「決策樹」(可解釋性強)和「隨機森林」二種方法來做分析。



適合參加儲蓄專案的家庭推薦:

  1. 無法自立脫貧,透過儲蓄專案可以能順利脫貧的家庭(以家庭特徵的相似度來分析)
  2. 後續驗證效益:需要更多數據和樣本,才能以不同的維度來做分類。


這次清理了約2,000筆資料,發現在資料上可作進一步改善,包括:

  • 資料的確實性,可作欄位防呆(驗證)的設計
  • 表格欄位的優化
  • 中斷性資料的追蹤
最後產出「專案推薦計算器」,可作預測及推薦。講師 Ning 回饋:

  • 在 D4SG 遇到的多是行政資料,若要看資料可以達到怎樣的效益,會需要改善資料內容,等於也是對行政的文化進行變動
  • 這次的專案是個開始,也許可以影響未來公部門資料蒐集的規劃
其他回饋:
  • 在簡報中,可以看到參加的家庭到達某個時間點,才會開始翻轉、脫貧,為何會這樣?因為社會救助法中,有關於低收入戶資格的規定,為了保持參與者繼續在專案之中,會讓他們先保留低收入戶資格。法規上,要超過貧窮線才算脫貧,所以實際上要看離開專案後的數據比較準確。
3. 法律扶助資源配置優化

法律扶助基金會在全國有22個分會,宣傳資源有限,希望各分會能夠依據在地特性,發掘應該被服務卻尚未觸及的弱勢族群,了解他們較常發生的法律問題,並針對該對象發展適合的推廣方式。

提案單位:法律扶助基金會
關鍵詞:資源配置、精準行銷、個案管理
資料英雄:賽仕電腦軟體 (SAS) 台灣團隊(陳林彣、謝宗翰)
專案顧問:劉嘉凱



這一組比較特別是由 SAS 公司的二名員工組成團隊,協助法扶的提案,也希望未來有更多企業願意以這樣的方式投入公益資料的領域。


法扶的服務對象是:有法律需求、需要專業性幫助,但卻無力負擔的人們。本次專案希望能「找出需要服務的人」,也就是潛在的目標客戶。因此需要全面地就台灣318個鄉鎮的地區和人口組成的特徵,進行資料分析,約有300多個表格及很多的欄位。

法扶和二位資料英雄合作時,開了4-5次會議,每次會議結束的1-2天內,就會產出會議記錄和待辦事項,非常有效率,也是大家進行專案時,值得學習的工作模式。

本次專案重點是「分會健檢」,透過2015-2017年的資料和其他外部資料,進行需求缺口的分析,來看各分會的案件覆蓋率。同時未來也希望進一步去做「案件心力分類分析」,將已結案的案件數據,以「律師回報」和「工作指標」作為未來工作的參考。

法扶共有22個分會,資料包括人、案件和年齡,為了了解全台母體有多大?從人口覆蓋率來看,同時不同的鄉鎮、身份等等,都有影響。

預期成效是:

  1. 分會有考核與目標設定的依據
  2. 在地化設計:依各地不同的特性和需求來做推廣活動和合作案
執行過程中,發現法扶的資料欄位「確實度」有待加強。同時,人口學資料與案件資料是不同的資料來源,因此有先天上的限制。

如果從組織過去的經驗和這次分析的成果來看,可以發現:

  1. 都會區的弱勢族群會比較集中,案件量比較多;非都會區的工作人員比較少,也無力多做宣傳。這樣的經驗認知在過去無法有具體證據來做勾稽,如今有具體的資料數據可供參考。
  2. 宣導對象反而是人口覆蓋率少的地方。


未來,法扶會根據這次的成果產出行動方案,譬如:巡迴車的機動服務;增加和助人工作者及NPO的接觸,因為他們往往就是接觸到法扶潛在當事人的重要接點,希望能形成法律安全網。也希望司法院未來能開放更多資料,才能做勾稽,找出這一群需要服務的人,他們所處的地理位置或案件類型的指標。因為在過去的經驗中,要辨識出有「法律需求」的人是很困難的,因為這樣的對象需要「意識到自己需要法律服務」、「有對的處遇」,同時「又知道自己是無法進入一般法律服務」的需求者。

透過這次專案合作,法扶強調「下一個黃金十年,是以資料治理作為契機。目前正是法扶在積極轉型的階段,未來會讓更多的資料分析進入決策,作為決策判斷的輔助工具」。

4. 外傷醫療功德工程

分析全國外傷病患數據,理解供需之落差,補足台灣外傷現況之資訊透明度,作為相關政策規劃之基礎。

提案單位:台灣外傷醫學會
關鍵詞:急診管理、檢傷計算、外傷危險因子
資料英雄:陳秀嘉、高家祥、黃存宇、姜亭安、劉寶恩、王亮懿、張書豪、趙恩
專案顧問:陳奎銘、劉嘉凱



外傷醫學會的提案初衷,希望能讓公眾更加關注「外傷醫療」的重要性。由於重在宣傳與知識理解,因此本組產出了網站,將數據分析和外傷醫療的入門知識,整理成類似懶人包、即時可查 ISS(外傷嚴重度分數,Injury Severity Score) 和相關實用補助的互動網站形式。


本提案也探討「急診分級的就醫制度有效嗎?」透過驗證危險因子和ISS、醫院等級與存活率等前端的救護和後端健保資料的收集來做分析,進行討論。


目前十大死因中,外傷佔第6位,健保經費則佔1/5,件數最多,其中植物人又佔了28%的比例。外傷往往發生在年輕人身上,使生命的平均年齡少了25年,對少子化日益嚴重的台灣來說,值得注意並改善,譬如車禍和跌到的意外其實都是可以預防或減緩的。

本組在實做過程中,發現資料來源看似完整,但後來仔細挖掘之後,比對初步合理的分析,才找出一些重複的數據。





延伸閱讀:

0 意見:

張貼留言