2016年1月20日 星期三

活動紀錄:「公益加值」資料工作坊-成果分享會

由開拓和 DSP 主辦的「公益加值」資料工作坊,已於 11/28-29,圓滿結束。這次活動共有 7 個非營利組織,提案參與,包括兒童醫療補助、視障工作、環境議題、銀髮課程等不同領域;並有 20 多位資料人,共襄盛舉。透過 NGO 和資料人的跨領域合作,可以一起為組織面臨到的問題或倡議議題,提供解決方案或更好的數據基礎。

為這場工作坊,我們進行了演講說明會資料人社群聚會等前置作業,也希望 NPO 伙伴必須事先準備好資料、想好要解答的問題等等,因此參與到最後的 NPO 伙伴們,都有不錯的收穫。

而這次成果分享會,邀請提案與實作的 NPO 夥伴們,一起來談談參與的經驗與心得;主辦單位也以資料科學的流程,協助回顧整合,希望讓參與和未參與工作坊的 NPO,有再次互相觀摩的機會,讓這系列的活動與學習更紮實,並且也共同發想,新的一年的活動規劃。

提案組織的分享

分享會上,共有 3 組 NPO 夥伴——瑞信兒童醫療基金會、雙連視障關懷基金會和台灣環境資訊協會——帶來經驗心得,以及後續組織未來在資料蒐集、規劃與應用上的想法。

1. 雙連視障關懷基金會

想要解決的問題是:
  • 按摩小站工作排班
    • 10個按摩小站,100個以上工作機會。
    • 讓排班能夠更公平,使按摩師有相近的收入
  • 希望可以透過資料分析,達到:
    • 更公平合理的安排按摩師工作
    • 了解按摩師收入高低與據點安排是否相關連
    • 找出其他相關因子
參加工作坊黑客松的過程中,發現大家雖是第一次見面、自發參與,但資料人討論過後,可以很快分工、動手作,印象深刻。其中有一位特教老師是 Excel 高手,透過 Excel 的功能與設定,可以一鍵生成所需要的各種個案紀錄,這對也有相同需求的 NGO 來說,覺得好厲害。他協助基金會將十個小站的月報表,轉換成長資料(long form data),讓後續接手的工程師,可以快速使用 Python 和 R 語言等常用的資料分析工具,繼續挖掘。

執行長駱安玲分享,在 NGO 與非 NGO 的合作中,一直以來,NGO 伙伴們會覺得與工程師共事有困難,因為雙方的專業領域差異大,但其實這次的活動經驗,可以看到資料人為 NGO 帶來很多刺激,讓 NGO 可以從不同的思考方式中,學習不少。

透過討論,發現組織一開始在蒐集資料時,就缺失了一些應該蒐集和考慮的重點。同時工作坊的成果,也產出原本沒有預期、沒有事先提出問題的成果。駱執行長小結:如果抱持著傳統的外包思維——只把問題丟給別人解決,卻沒有一起參與其中討論,是很可惜的,因為過程中會有很多交流的火花與學習。



CK 點評:雙連視障關懷基金會 ‪“資料開竅”‬ 之後的心得:

  1. 從資料蒐集面,發現原本忽略的地方其實很重要;
  2. 從資料運用面,了解資料不是死的紀錄;
  3. 從資料分析面,看到以前沒思考過的地方。

2. 瑞信兒童醫療基金會

瑞信提案的題目是「兒童醫療補助分析」,想瞭解:

  • 為何每年補助總人次降低?101年起,補助人次驟降。
  • 瞭解 10 年來兒童醫療補助需求的變化
在準備資料的過程中,發現補助申請書的文件,很多文字的敘述與記錄,沒有一致標準,是很質化的內容;並且有許多紙本資料蒐集後,如果沒有整理,容易只堆放在倉庫中,束之高閣。

在黑客松的過程中,基金會需要的幫助是:

  • 如何從網路公開資料庫找到有用的資料,與瑞信資料,做交叉分析?
  • 如何從既有資料中,透過資料特徵組合方式,發現基金會沒有發現的事情?
後來在政府公開資料的比對中,發現各地政府補助條件的不同與改變,會影響補助數量的多寡,包括:

  • 中低收入戶增加
  • 健保給付範圍變多,例如白血病標靶藥物
  • 少子化:台灣兒童總數持續減少
所以在後續的研究方向上,會進行以下的調整:
  • 其他組織的補助是否改變?
  • 注意政府中低收入戶標準
  • 健保給付項目
3. 台灣環境資訊協會

環資的主要服務是關注環境議題的獨立媒體。正在從事的「守護農地計畫」,關注食安與農安,希望揭露相關問題,並且可以開放資料給民眾,一方面督促政府針對這些問題的處理期程,二方面也讓民眾共同來監督。

參加工作坊是「資料科學口譯」的過程,在釐清問題之中,發現問題可以被轉化成一條條數學公式。並且透過政府的開放資料,可以推估出一些問題的答案,譬如農地的整治期和所需要的整治經費,透過縣市政府的每月統計,對比中央所給的經費,來算出總體整治所需要的時間。

透過資料視覺化,讓上萬筆資料轉化成地圖上的精確地點,將不同來源資料使用地圖圖層的堆疊,可以快速看到「受污染農地 vs 整治中的土地」,彼此之間的關係,並且發現政府整治政策的問題。

工作坊結束後,發現原本使用的資料有誤,想要修改,所以後續還需要資料人的協助。

從資料分析流程檢視大家的經驗--DSP(劉嘉凱)
(本圖摘自 DSP 講師 Johnson 的介紹簡報,可見:http://www.slideshare.net/TechSoupTW/15-56895040

資料分析的流程,可以幫助組織把服務上遇到的問題(business problem)資料化(data problem),透過資料來回答已經發現的問題;也可以透過資料發現還未被察覺的問題。流程如下:
  1. 定義目標
  2. 資料盤點(抓出資料動線)
    a. 內部資源:如營運、調查的數據
    b. 外部資料:來自政府或群眾的數據
  3. 分析
  4. 行動
以最近與高雄消防局和急診室的案子為例,一開始花了不少時間「聚焦」,透過資料分析師的引導,針對雙方都有的癥結問題,可以找出對的環節與資料。在這次的工作坊中,同樣也與環資花了一點時間,把問題範圍縮小,最後找出具體可用的資料,以及可以回答的問題。

案例與示範

在美國的案例中,可以看到紐約市政府,透過與 Yelp(一個線上餐廳蒐集與評論的社群)合作,蒐集了可能是食物中毒的文字描述,經過篩選,進行訪談,最後很精準地找出幾家衛生不合格的餐廳。透過這樣的方式,可以讓有限的人力,增加查訪的效率,也是上述資料分析流程中,透過外部資料解決問題的方式。
以遊民問題為例,英國的 Citizen Advice 提供市民一般性的生活諮商服務,而 St. Mungo's Broadway 則專注於提供遊民協助。結合這兩間組織的個案資料,分析出有相當高比例的遊民都是先向 Citizen Advice 求助過失業救濟的相關問題之後,才進入 St. Mungo's Broadway 的服務系統。(更多討論可見 http://on.fb.me/1ZfFRli

CK 以遊民問題為例,講解專案規劃的流程:
  1. 專案定義(Project Definition):提出問題與現象
  2. 分析的目標及方法(Methodology):
    a. 列舉相關的利害關係人,包括 NPO、政府和商業單位等等
    b. 考慮用何種資料視覺化的工具呈現,比較合適
  3. 呈現因果關聯(Vision of Success)
  4. 績效衡量/資料共享(Expected Impacts)
現場 Q&A

Q1. 雙連視障關懷基金會各個按摩小站的報表,為何不使用數位化的輸入,還要使用紙本再進行整理?

因為每個小站都有管理員,但這些管理員通常是中高齡婦女,使用手機輸入對她們有難度;加上輸入後看不到表單的結果,也會讓她們更緊張。

Q2. 黑客松的成果,對組織未來會有什麼影響或改變?

雙連:原本的工作是透過人腦來安排,現在有資料分析作為參考,可以重新考慮大家的工作調度;也對資源如何更公平分配,有更好的依據。

環資:資料可作為與政府溝通的準備,讓政府知道有人在關注這類議題,同時也能有效監督政策。

開放資料地圖可提供民眾查詢使用,譬如食品可作為產地履歷的一環;同時,農地污染會隨空氣移動。透過民眾的監督,也能給政府壓力。

瑞信:對未來的補助政策做調整

Q3. 很多 NPO 在定義需求或問對問題的過程中,會有困難,該如何解決?


建議可以先參加線上社群的討論,透過共學或黑客松的方式,增加這方面的能力。

雙連困境很重要,因為有困境就是找到問題的契機。

Johnson:動手做的過程中,一定會遇到大大小小的問題,但這些問題正是不斷繼續前進的動機。

Q4. 資料要如何校正?怎樣確認資料的正確程度?

可以先規劃專案,再探討要使用的資料,過程裡就會進行修正和微調。


更多「公益加值」資料工作坊及 D4SG 文章,可見 http://bit.ly/d4sg-list

0 意見:

張貼留言