2018年10月25日 星期四

大數據建構社安網經驗分享與交流(下)@2018雙北社會安全大數據交流論壇



延續上一篇文章的分享,本文聚焦於家暴預警系統的模組和管理,政府單位參與資料英雄計畫的過程。後半段有精彩的 QA 問答!

(參考資料:[相關紀錄] 2018雙北社會安全大數據交流論壇

三、家暴預警與風險管理 - 陳淑娟主任(臺北市家庭暴力暨性侵害防治中心)



開放資料要開放的不只是資料、還有心態。台北市每一百萬戶,每年會發生 1.3 萬件家暴案件,都由台北市家暴防治中心的社工處理,平均每 3.2 天就有一個新案子要立即處理。過去社工建檔的資料都是個案記錄,所以每次長官需要各種統計數字,譬如:家暴案件多少件?未滿 18 歲的多少人?65 歲以上的有多少?親密關係暴力的比重?等等,同仁就得人工、一筆一筆去看才能算出來。市長常說「沒有統計就沒有統治」,如果數字都掌握不清楚、如何做出有效率的工作?

如同許局長之前提到的,有些問題增加再多人手、沒有改變思維和工具,仍舊無法解決。如果可以把海量的個案資料整理成可以運算、統計,一鍵按下去就跑出來,可以節省很多成本。所以 2016 年當我們得知 D4SG 計畫,就覺得計畫內容完全符合剛剛許願的需求,重點是還免費。畢竟對政府部門來說,一件事如果一開始是個實驗,很難取得預算和資源。當時我們也希望產生如同火災的家暴風險預警地圖,過去在鄰里宣導,很多里長都說「我們是幸福社區,怎麼會有家暴?」透過這個家暴案件的地圖,希望可以降低回頭客,特別兒少的部份,發現、處理好後不會再發生。

因為我們處理的都是保密個案,要做個資保護措施,展開一趟奇妙旅程之前要先把安全帶綁好。第一步是「個資模糊化」,參與的資料英雄都要簽保密同意書,同時會排除一些比較極端的個案。原本預計成果只供內部輔助工作和社工作決策使用,後來評估在開放的輿論之下,可以把地圖分享出來,讓社區組織、NGO 或研究單位了解這樣的社區樣態會發生什麼案件,也許有組織可以主動投入,像街訪出招、社區宣導,以往常常是掃街式宣導,可能在兒少受暴風險較高的社區,反而沒有相對應的資源。



開始著手進行資料整理之後,發現很多資料很「髒」、格式紊亂或內容不一,無法分析,三個月的專案時間花了兩個月在清洗資料,剩下一個月處理技術問題。

2016年開始進行資料分析跟智慧輔助工具的開發和討論,最主要的目的是提高社工工作效能,以及降低被害人風險。

合作的過程裡,資料英雄和自願參加的社工每週三晚上,一起討論,最後做出許局長介紹的地圖跟預測模型。當然,這些產出絕對不是、也不能取代社工,只是輔助社工決策的工具——希望藉由資料數據,從過去的經驗知道怎樣做比較有效,哪些類型可能再發生。

跟大家分享這張意外發現的圖,一年十二個月當中,哪一段時間屬於高峰期,要看每個案件處理的發現時間。可看到高峰期主要是三~五月,以及八、九月,因此未來如果要安排教育訓練,最好是六、七月,因為高峰期要專心處理個案。這個發現有助於組織的管理——把日常事務統計之後,最簡單可以告訴我們時間如何安排、人力如何配置。

案件地圖產出後,就可以做社區扎根,讓社區精準參與家暴防制。最後希望分享出來,國內可以知道有這種方法讓工作更流暢,去年局長也讓我們到紐約參與國際交流。

四、高風險危機警示模組 - 解佩芳主任(新北市政府高風險家庭服務管理中心)



高風險家庭服務管理中心的主要業務是做家暴的三級及二級預防,找出十八歲以下家庭、而且有相關風險因素,預防發生危機。風險指標包括「照顧者離家或入監服刑」、「失業無收入」等等。新北市有 70% 是外來人口,遇到很多服務切割的困難。2010年朱市長上任時,案件量是二千多,當時覺得很多需要被協助的孩子沒被找到,所以 2011 年開始推動安全網,也是現在大數據分析的基礎,整併了社會局、教育局、警察局、勞工局等等各局處的服務。2011-2016 年,平均通報數每年有一萬多件,也建立了一套資訊系統來處理。

整合型安全網運作到 2017 年,系統累積了七萬多筆案件,每個案件都有不同局處登錄的資料,共計147萬筆,包含個案家庭從 2011 年至今,所有的通報記錄和各局處的服務及評估。感謝台北市做了領頭羊,我們也想利用這個系統跟資料英雄結合,當時單純期望能得知二級預防體系中,什麼樣的家庭最危險,讓他們不會往三級跑,但這樣的家庭要辨識出來,現在都是透過網絡通報,想知道有沒有更科技的方式可以處理。



剛開始和資料英雄合作時,遇到蠻大的挫折,因為雙方的學術背景養成不同,做了很多觀念的釐清和資料清洗。初步成果也是繪製新北市的高風險熱點地圖,但擔心公佈後鄰里長會跳起來。從這個熱點地圖,我們發現新北市的高風險家庭年齡層開始改變,以前多半是在學的孩子,現在六歲以下、十五歲以上輟學的,案件比例量開始增加,因此展開政策方案讓相關局處主動清查需要被服務的孩子。如果畢業沒有繼續升學,逼迫教育局全面造冊給高風險中心。

另外也發現經濟因素之外,「家庭關係紊亂衝突」及「照顧者失業」的家庭,容易惡化發生兒虐的危機。而「學校老師」的通報案件往往也是情況比較危急的,需要提供相關的教育訓練。我們把通報跟登打內容,做了「關鍵字」文字雲,希望建立高風險文字資料庫,未來能做智慧導引,根據通報內容及時反饋危險的程度;此外,也找出風險最高、尚未接受各單位協助的「高隔離家庭」。

最後,透過「決策森林」法則產出「易成為回頭客」或進入家防的案件,列為優先處理的對象。未來我們會持續下去,現在開始要求社工跟網路人員要綁定資料、且有一致性,未來希望能做成「隨身簡易型風險計算機」,提前預測家庭的風險程度。期待大數據跟兒童保護業務相結合,能讓危機被分析、並預防檢視,讓資訊人和社工人一起走出一條路。

主持人:剛剛大家一直提到 D4SG,這是 DSP 透過志工方式,無償幫非營利組織和政府單位做資料分析。因為我們認為「資料是要拿來運用的」,但政府和非營利組織即便累積很多資料,常被業務所困,所以需要人跳出來做這件事。

社會上有一群有資料分析能力的人,或者學生要畢業、找工作,找好工作之前需要好的履歷或戰績,他們都是很好的種子,願意花很短的時間跟我們共同工作,這是計畫可以形成的原因。當然資料英雄之外,社工或相關專業領域的朋友也要對應投入。每週都有共同工作時間,像夥伴有房仲業的主管,就平日晚上一起撥空工作。兩邊共同學習,等到凝聚共識就會變成能被落實的產出。

座談時間

1. 首先請問陳主任,參加 D4SG 計畫之前要做好什麼準備?

答:要找到願意支持我們實驗跟探索、能夠承擔風險的長官,放手讓我們去做、去嘗試。再來是自願的同仁,利用工作之餘也想改善工作流程、或資訊能力比較好的。雖然沒有經費,個案的資料隱私保護也不能馬虎,做好安全計畫,綁好安全帶就可以上路。

2. 請問解主任,合作時有半年的時間,同仁怎麼看社工夥伴跟資訊背景的人,合作的感覺?

答:一開始跟資料英雄合作的震撼是生活形態的不同,因為每天下班後七點到十點才開始,我就開始疲累,隔天八點又要上班,但資料英雄多是科技業的責任制,十點時他們就極度清醒(笑)

另外討論高風險家庭時,他們一直想用邏輯分析找出答案,我們本來就有紅黃綠燈的設計,危險是紅燈、不危險黃燈,他們做出紅燈91天時,容易被送進家防,謝博士就建議以後紅燈31天就轉介到家防中心,我們覺得是非常好的建議。舉例是讓大家知道這是價值觀的交流,因為他們嘗試找答案,把分析結果盡量找到歸因,例如:學校老師的通報容易找出高危家庭,他們一直問為什麼,我也不知道答案。整個經驗很有趣,很鼓勵社政同仁多跟不同思維、背景的人交流,可以看到工作領域看不到的特徵。

3. 請問林大哥,法扶這組比較特別的是,合作的資料英雄是SAS公司,是專門以資料分析為主軸的公司,有很好的軟體跟人才。請問怎麼看待法扶的同仁和專長資料分析的企業,合作的經驗?

答:一開始遇到的難題是把內部流程規定讓 2 位 SAS 的分析師知道,了解我們在做什麼,才知道欄位和參數如何運用,很幸運,他們吸收能力很快,開了兩、三次會就能抓到。我們不只正式會議,私底下也時常花時間互相溝通,例如:看我們在做什麼?業務、軟體如何運行?等等,合作上滿愉快的。

如同前面幾位貴賓提到的,例如紅燈警示,他們也有設計,哪些分會處在哪些燈的狀態,但我們會怕,會問「黃燈的標準是什麼?」、「你的定義是什麼?」,這裡面有文化的不同,最後發現最好的模式是「我們把需求提得很清楚」,幾次磨和後,發現他們瞭解了,就放手讓他們在資料庫裡探索能做的內容。

除了行銷之外,分析師也想到「律師在案件裡到底花了多少心血?」這也是我們想知道的,因為國家給的預算是固定的,當然希望做的比較辛苦的、質量比較好的,酬金能夠高一點,感謝他們起了個頭開始。

跨域合作時,雙方要給彼此空間思考,不要太本位主義,「討論酬金」對我們來講是一件勇敢的事,他們開了頭,讓我們開始思考很多東西是我們沒學過、看過的,這是參加 D4SG 最大的收穫——針對同一份資料會有不同的視野,使用的目的可能是以前從沒想過的。

4. 高科長講鳳山區讓我印象深刻,想瞭解這個方案導入現場時,消防弟兄心境的轉變?一開始工作跟之後的差別?

答:從 1.0 到 2.0,在局裡有三個影響:

(1)數字化管理。做完 1.0 花了不到十分鐘報告,他們就說不愧是專業的,整個火災樣貌很清晰。

(2)剛才提到「煮食不慎」的比例很高,如果山林野火先不考慮的話,先想辦法管理、降低,就找了一票人來做這件事,譬如:燒焦、發爐、油垢等情況的改善,前兩項可以從爐具著手,不要空燒,標檢局開會強烈建議把這兩項列入爐具標準配備,從源頭管控。

(3)同仁的認同。一開始到鳳山各分隊宣導時,他們覺得吃飽太閒、幹嘛這麼複雜,但我們很堅持,一陣子後,科長發現中崙社區的數量有減少一點。上個月他說好像滿有用的,火災量有降下來。同仁對科學分析越來越認同,推廣就會更順利,長官看到,以後各大隊針對老舊區和經濟弱勢要加強宣導。

現場分享:我在張老師基金會工作三十年了,我聽到淑娟分享「如何引燃同仁熱情」,很有感觸,這我不覺得困難。困難的是,這兩天衝擊很大,譬如「洗資料」,因為張老師快五十年了,話務系統有近一百萬筆個案資料,我們非常重視保密,也有初步的分類,特別是最近看到這麼多情殺問題等等,如何呼籲都覺得好累。台北現在有三百多個協助張老師專線的志工,記錄每天寫、電話每天進來,從十年前進話務系統已經翻轉一次,現在雲端又要翻轉一次,既期待又害怕。我們已經編列預算,雖然 D4SG 是免費的,仍很希望下次可以入選資料英雄計畫,讓已經有的資料能更接近這兩天所學的東西。

陳主任:這心情跟我之前一樣,早上、晚上都在想,看大夜班同仁的狀況也再想一想。即便張老師已經編列預算要做這件事,花錢的東西,大家一定希望又好、又能被接受,才能責信,但在這之前,需求的表達很重要,至少知道要問什麼問題。今年我們編列了正式預算要把這些系統正式化。

進入資料分析的門檻滿低的,只要有勇氣跨進去,對每個人來說是未知的、一個探索的旅程。至於「同仁的認同」,我都來張老師當志工了,還要幫你做這件事嗎?我第一期問同仁,有沒有自願加入的?無人回答,後來只好找幹部、有示範功能。後來第二期、第三期再問,很多同仁就願意來看看,一開始看熱鬧也沒關係,每週三晚上就在這裡,待到晚上九點、十點,但只有三個月。即便後面有預算可花,屆時跟廠商招標會更清楚、得到更好的效果。因為知道能如何設計,就有更多可能,很多電源線就會插上對的插座。

桃園家防中心組長:謝謝四位分享,操作過程學到很多。好奇除了高雄火災預警系統之外,都是用現有資料庫做資料分析和應用,而高雄的部份透過地址串接、跨了很多單位,能否多分享:問題跟需求很具體時,如何說服單位?中間有沒有遇到挑戰或困難?

高科長:高雄市發生過莫拉克風災等問題,溝通上還算OK,發通知單時我是主持人,要資料時,如果擔心個資外洩,就把身份證字號等內容拿掉。我的備案是:如果要不到資料,就簽公文、開個小會,大家就如實把資料光碟送出來了。

林執行長:我們是民間單位,要資料不會那麼順利,所以盡量搜尋公開資料。我們嘗試過跟政府單位要資料,但現在最大的問題是,即便民間、政府都有資料,卻無法串街起來,譬如跟我們關係最深的司法院,完全串不起來,會有侷限性。我的想法是:民間單位先有一套資料建立和串接的機制,現在個資法某程度的取得、使用、銷毀都很嚴格,一開始可能會遭遇困難,譬如:取得資料時,有沒有跟民眾提到這些資料會被拿來做研究?這是法律的精神。這些一開始寫清楚,資料建立好後,才有本錢跟政府單位談合作的可能。

另外剛剛張老師提到,之前我們也沒有預算,但參加 D4SG 跟總統盃之後,我們會用委託的方式,另外也到大學去找統計系統洽談合作,就我所知,很多老師需要升等、有研究題材,無論民間或政府單位都可以做研究,他們做研究的深度可能比我們更好,目前嘗試去談,意願都滿高的,只是後續設計如何能開放資料庫,做研究之外,也開放給學術單位合作,這樣成本不是很高、成果卻很大,這是法扶目前思考、著手進行的方向。

5. 之前合作都是中心主任,像陳主任提到資料英雄合作三個月之後,有些成果,但三個月結束後,資料英雄也會回到各自生活的工作或學業裡,營運上無法接續。中心能得到的是很好的經驗跟後續規劃,想請教佩芳,有很好的體驗後,後續要延續或發酵過程,你們怎麼看待這件事?

答:其實做了三個月的分析後,我們加碼開了很多專家會議,邀請不同領域,包含統計學者、社政老師來詮釋這些資料,資料英雄會給你數字、畫圖,但無法進一步詮釋為什麼,例如:為何藥癮家庭很容易跑到兒虐?過程中也把一線同仁拉進來,看看詮釋過的資料,如何跟工作產生連結,今年才希望接下來能做更多。

數據分析的三個月裡,前兩個月都在洗資料,希望能應用於實務操作,把跨局處網路的夥伴拉進來,才能推動下一步的具體化,期待未來發展成隨身型計算機。關於留下資料英雄這一塊,我們預見先機,他們第一次來就加入 Line 群組,一直有網路上的溝通和合作,他們發現資料分析能保護兒少,我也時常發兒虐或家暴新聞,讓他們知道做了有意義的事——這就是串起網路的互動

0 意見:

張貼留言