2018年10月25日 星期四

大數據建構社安網經驗分享與交流(上)@2018雙北社會安全大數據交流論壇

之前的系列文章,〈雙北社會局局長分享〉和〈唐鳳:資料運用與社會創新〉分別從整體的概念和政府的應用操作,進行分享。本篇文章則紀錄了參與 D4SG 資料英雄計畫的四個單位代表,就政府機構和非營利組織的實作角度出發,分享、討論參與英雄之旅的心得和觀察。如果您對參與資料英雄計畫有興趣,千萬別錯過!

(參考資料:[相關紀錄] 2018雙北社會安全大數據交流論壇



(一) 主持人:謝宗震知識長(智庫驅動)

(二) 分享主題/分享人:
  1. 法律扶助資源配置優化 - 林聰賢副執行長(財團法人法律扶助基金會)
  2. 火災風險地圖 - 高文宗科長(高雄市政府消防局火災預防科)
  3. 家暴預警與風險管理 - 陳淑娟主任(臺北市家庭暴力暨性侵害防治中心)
  4. 高風險危機警示模組 - 解佩芳主任(新北市政府高風險家庭服務管理中心)
本場活動的進行方式是四位分享人簡介他們在做的大數據社會安全相關的題目,每人十分鐘。報告結束後,主持人協助問問題,並邀請大家在聆聽分享的過程中,思考想問的問題,舉手發問即可。

D4SG 資料英雄計畫是智庫驅動、開拓文教基金會和教育部共同合作的案子,這次分享的四個組織都是參加這個計畫的成果,所以邀請他們來聊一下,當資料分析跟各領域的工作結合時產生了什麼力量。

一、法律扶助資源配置優化 - 林聰賢副執行長(財團法人法律扶助基金會)



法扶十幾年的服務累積下來,所有申請人的資料大約有 50 萬筆。過去我在英國念犯罪學,當時需要學 SPSS,課程中可以使用英國的犯罪調查資料庫,才發現處理的法律案件不同,不同參數會產生不同結果,犯罪也就有不同的面貌。因此我到法扶之後,不禁思考:每年案件量這麼多,不知道方向是什麼?需要被服務的人有沒有被服務到?是否達到需求?有沒有更好的作法?這是傳統法律體系出身的人,比較不會如此思考的。



正好在這個過程中,有老師提議,因為台北市人口資料的透明度很高,想做車禍相關的研究,我正好在分會當執行秘書,就跟總會要資料、同時聯絡當事人面談的可能,後來有些成果產出,也的確幫助了這些申請人。但法律問題之外,每個案件往往還有很多其他問題,法扶處在這個轉折點上,能否因應其他需求、建立更好的合作?這個目前有做,但不是做的很好,因為不知道需求。所以資料的累積上,不是去比較今年和去年案件量的多寡而已,應該思考如何讓同仁在使用資料庫時有更寬廣的視野,能去發掘更多問題的切入方式和解決方向的可能。

我覺得法扶應該是一個社福單位,和社工一樣,服務的民眾會是重疊的。有了這個願念,嘗試過送同仁去學 SPSS,但效果不是很好。當內部沒有專業人才時,要試著跟外界結合,正好到 D4SG 提案通過了,也和 SAS 公司合作。合作總是會擔心有彼此的專業相互不了解的狀況,所以過程中「雙方如何把自己的立場和專業,全面敞開跟對方溝通」,是很重要的。

基金會就二百多人,可以做到二千多場的宣導活動,同仁們很辛苦,但以行銷為目的來看的話,希望能了解成效為何?透過數據分析,可以看到真正要服務的對象在哪裡?將法扶和外面的資料一起看,看看案件的覆蓋率和人口屬性,什麼人常常遇到的法律問題是什麼?也比較知道原因在哪裡。



簡報裡可以看到我們大概開了十幾次會議的文件紀錄,後面的分析是初步成果,以前都是 Excel 表,比較簡單的圓餅圖、長條圖,可供抓取的資訊很有限。透過進階的參數和分析,可以了解申請人的樣態,例如:中低收入、原住民、身心障礙等等,也能進一步了解這幾個族群,比較常涉及的案件類型為何?可能在哪裡?以及看看每個分會服務的覆蓋率,就有初步的目標要求分會把平均線往上拉,針對對的人、對的地方去做事。

資料建置不是為了統計的需求,像這次合作中遇到很多問題,組織後續會再思考、檢討。重點是化為行動,後續會把報告給各個分會,每一季去檢討,案件率有沒有關連?平均覆蓋率有沒有拉高?這樣才能把有限的預算用在對的地方、對的人身上。

二、火災風險地圖 - 高文宗科長(高雄市政府消防局火災預防科)





從上面的線圖可看到,火災通報和成災火警的數字落差很多,進一步去看消防署的資料,成災第一名是電器、第二名則是縱火,為何縱火的數據那麼高?因為縱火一定會成災。得知資料英雄的計畫之後,就提案北上,跟一群熱血、有資訊統計背景的年輕學子一起參加計畫。

剛開始發想,就是透過地址欄位(區、里),結合了消防局、社會局和稅捐處的資料(如下圖),花很多時間做資料的整理和清洗。



產出 2011-2016 年火警在一天之內容易發生的時段圖,波峰大概是早上十點,晚上七點之後往下降。因為午餐是用火高峰期,凌晨兩點後因為熟睡,所以是低峰,但同時波谷處造成的傷亡會比較大,這跟過往的印象是吻合的。

另一張圖是分析「地點」,一般住宅最多,第二名是工廠,同時找出高雄市前十大火警發生的地區,發現左營區包辦前三名,原因是人口數比較多。也分析了「火災成因」,第一名是原因不明,因為多數出動救災的火警現場,鑑識科不會到,第一線也無法判斷。第二名則是煮食不慎,第三名是電器因素。對照美國的數據,煮食不慎大概就佔了一半。

最後產出「高雄市火災風險地圖」,這張圖和各里人口數的多寡成正比,人口數越多、地圖就越紅。地圖上每個分區點下去,里的內容就會跑出來,包括起火源、場所等統計。有了數據分析,我們就能把所有的區長找來,指出比較危險的地方,請他們協助宣導。因為高雄市有 109 萬戶,依照一年 2 萬戶的速度,至少也要 50 年才能宣導完,所以希望依照風險程度的不同,進行不同的宣導方式,可以透過 Youtube 影片、實體擺攤、課堂宣導,以及更仔細的家戶宣導來做。最後找到綜合風險偏高的鳳山,人口最多,但從高樓到違章建築、各種樣態都有,接下來希望能量畫出建築區每棟建物的風險值,做出視覺化的圖表。



因為有夥伴是房仲業,找到開放出來的建照資料,以及稅捐單位地政社會局的資料,一樣透過地址串接起來,可看到建築物火災風險的五大要素——住家面積、建物總面積、屋齡、建物高度、法定空地——與家戶經濟條件息息相關。譬如:家戶面積較高的風險較高;屋齡會顯示人口結構,也會反映消防法規的新舊、建築法規的演變,族群通常是長者或經濟弱勢。

經濟條件越差、火災風險越高,這與實務經驗相符。以前的宣導是沿街叫賣,但我們不能每次都說風險會貼標籤所以要掩蓋起來,譬如鳳山做出來,最紅的是中崙社區。我們找了風險值大於0.7的,約兩千三百戶,再鎖定透天或公寓,最後集中一千四百戶來加強宣導。去年九月到今年五月,同時間相比,案件量從119件降到91件,下降23.5%,算是滿多,也證明有宣導就有改變行為的可能。

政府都有海量的資料可從不同層面來結合,透過資料專家的分析,讓我們的業務推行上更加智慧、有效能。

(繼續閱讀:大數據建構社安網經驗分享與交流(下)@2018雙北社會安全大數據交流論壇

0 意見:

張貼留言