2014年11月24日 星期一

[網二] Data for Social Good - 由資料驅動的公益新浪潮

(photo credit: https://www.flickr.com/photos/smemon/4478876573

在數位時代中,非營利組織及其相關業務,所產生/可利用的數位資料,越來越多。在國際上,不論是公共服務或公益計畫,有越來越多案例顯示,成功的關鍵在於「善用資料、跨域合作」。11月的網路星期二邀請了 CK 劉嘉凱(專職企業資料分析顧問服務),告訴我們:
  1. Data for Social Good 是什麼? 
  2. 國內外共 12 個「用資料行公益」的案例分享
  3. 透過模組化的資料經驗,邀請大家參與


首先,CK 先介紹目前所參與的「DSP 智庫驅動公司」。這是一家「以資料力改變社會」的社會企業,致力於運用商業模式,串連世界各地的資料科學家,共同協助社會、政府和企業培養資料人才。該公司的前身是由 Code for Tomorrow 和 SYSTEX/Etu 共同發起的《DSP 資料科學計畫》,透過對開放的生活資料收集、處理、分析、視覺化呈現、故事形塑、擬定行動的過程,分門規劃,引發社會各界對資料科學的興趣,從中培養對應人才,最終回饋社會。該計畫舉辦過 5 次訓練課程,更主辦、協辦、參與及贊助眾多有意義的社會性活動,例如《SmartGov 政府開竅會議》和《Code for Healthcare 工作坊》。


D4SG(Data for Social Good)是什麼?

Social Good 是指「能以最多可能的方法、利益最多人的一種善行或服務」,傳統的例子是對乾淨的空氣、乾淨的水、教育、社會福利和人權等的服務,比較現代的例子則是針對健康照護和網際網路方面,其他相關的概念還包括:社會共好(Common good)、公共服務、企業
社會責任等等。

而 D4SG 的理念,正是以資料、巨量資料(big data)和資料科學,來促進以上所談的 Social Good。

目前 D4SG的發展趨勢,包括最近很夯的巨量資料和開放資料(open data),其中包括企業/政府/個人的資料,目前大家比較關注政府開放資料這一塊。目前發展趨勢朝向公共服務與創新。

D4SG 的工作目標,希望能用資料解決資源有限、需求無窮的問題,所以要:

  1. 辨先後、抓重點→找對象、找方向。例如服務來自於人,可能是外藉或移工,先決定對象再找重點。
  2. 找出成功模式→複製成功經驗
目前歸納出來的最佳的合作模式是:
  1. BYOD : 帶你的資料來(Bring your own data),沒有資料的話,至少要「帶你的問題來」(Bring your own question),聊聊組織目前的資料、或是想要解決的問題。
  2. 配對(公益人+資料人):如果這個問題有其他領域的專業人士,可以加入做一兩天的討論。
  3. 初步成果:回到組織內進行討論,可能可以「問對問題、初步發現、做出系統雛形」。
  4. 對應行動:有了初步成果後,可以深入研究、爭取資源,或改變現在的作法。
摘自講者簡報

國際案例

CAMBA:這是美國紐約的一個小組織,幫助一些團體解決經濟自主問題。

  • 背景2013 年 11 月時,紐約的庇護所收容了 53,000 人,其中包括超過 12,000 個家庭以及 22,000 以上的孩童,而造成這個現象的主因是「被驅逐」。
  • 問題: 可否預期哪些家庭正處於被驅逐的高風險,達到「早期警告、早期干預」的可能? 
  • 初步成果後來發現透過法院張貼驅逐公告的資料,可預期哪些人可能會被趕出來,藉此提供社工和倡議者工具,讓他們可以找到會導致驅逐的公告,並發展出可以預防的時間準備。通常接到通知的 3~5 個月是關鍵。
  • 對應行動:協助 NGO 運用這個預測工具,提早和高風險家庭進行溝通。 
  • 從 2009-2013 年,可以看到透過資料蒐集的預警系統,進入庇護所的家庭降低了約 8 倍。 
iCouldBe
  • 背景:這是一個線上學習專案,服務 19,000 名以上的高風險青少年,透過線上社群的培力,讓這些國、高中孩子可以繼續待在學校並規劃他們的未來。
  • 問題
    a. 針對這個組織的目標和評量方法,需要更進一步的界定。
    b. 對線上的輔導老師來說,怎樣的參與才是成功的?
  • 初步成果
    a. 設計出評估輔導者/受輔導者的標準:3個月內,至少完成 3 個要求或學習模組。
    b. 找出參與和互動的特性
    c.
    發現怎麼樣的說法能留人下來:「我就在這裡。」("I’m here for you.")
    d. 可用來辨識關鍵預告指標的可預期模式
    e. 可用做文字分析的架構
  • 對應行動: 找出更多成功和失敗的指標,並且評估進行中的專案。
Cultural Data Project (CDP)
  • 背景蒐集全美超過 11,000 個藝文組織的財務報告與專案資料,累計超過 50,000 筆記錄,同時也回饋給這些組織、他們的贊助者、相關的倡議者及政策制定者使用。
  • 問題
    a.什麼樣的因素使得一個藝文組織得以成功?
    b. 如何創造更多有效率的工具和訓練?
  • 初步成果
    a. 將藝文組織進行分類
    b. 從 5 個分類的組織群中,相互比較財務為何成功
    c.  其中一個分類的藝文組織,在財務上是失敗的,結果顯示這個分類是一個混合的群組,並非是哪一個特定類型的組織所致。
  • 對應行動
    a. 改善藝文組織的分類。
    b. 發展出標準檢查程式,讓藝文組織得以比較和同儕組織的表現,並去除不重要的指標。

Globalgiving
  • 背景:這是全世界第一個也是最大的為 NGO 進行群眾募資的社群。從 2002 年開始,從 160 個國家,超過 400,000 的捐款人,資助了 1 億 5,000 萬以上的美金,給超過 10,500 個專案。同時,他們也協助 NGO 學習募款和好的營運例子,來發揮更大的影響力。
  • 問題
    a. 透過過往的專案或募款活動,找出之所以成功募資的元素
    b. 專案是否有成功的模式可循? 
  • 初步成果
    a. 成功募資的元素包含:專案標題、募款的金額、照片、募款的速度?
    b. 關注飢餓的專案會比關注經濟開發的專案成功;超過 50 % 的捐款者會忽略預先設定好的捐款金額,反而輸入自己要捐的數字。
    c.
    使用明確具體的語言描述,效果比較好
    d. 藝術的效果 < 攝影展
  • 對應行動:對資料進行更深度的挖掘、分析,同時改善資料的品質。
Power of Poetry
  • 背景青少年寫詩的社交平台,他們覺得語言能力低落是一個社會問題,寫詩有助於提升語言能力
  • 問題:是否能透過詩歌來評估語言的使用能力? 
  • 初步成果
    a. 在平台上發表超過 10 首詩歌的使用者,他們的語言成績會有顯著的進步。
    b. 可以把詩歌和語言成績,以及他們所在地區的貧富,顯示出來。
    c. 從平台的使用者資料來看,高收入與低收入地區的語言落差,約為 10 %。
    d. 活躍的平台使用者,在語言成績的進步上比較大。
  • 對應行動:產出評量工具,讓父母、教育者及政策制定者可獲得通知,並做出更好的決定。
CCLBA 土地銀行
  • 背景解決過多閒置空屋造成社區發展不平衡,有助於當地社區重整再造。
  • 問題
    a.  取得閒置房產,讓它們可以再被利用
    b. 有數以千計的閒置房產,但該銀行預算有限
    c. 銀行的仲介人員,要如何從中挑選?並且該做什麼處置?
  • 初步成果
    a. 一個可以搜尋和分析閒置房產的資料庫
    b. 可用來評比社區好壞的模組
  • 對應行動
    a. 將利益相關人聚集起來,找出彼此可以接受的判斷標準。
    b. 一個明確而公平的行動計畫,讓這些閒置房產可以再生利用。
HURIDOCS 國際人權資訊及文獻系統
  • 背景這是一個專門協助各國人權組織,就組織資料進行開放、闡明和管理的國際 NGO,進而改善各地的人權狀況。他們已經從歐洲人權法院蒐集了超過 40,000 筆判決,希望能依此建立人權判決標準。
  • 問題
    a. 如何透過這些資料,改善歐洲的人權狀況,並進而展示國家責信的混亂?
    b. 法官為何將某些案子視為重要的?有無潛在規則可循?
    c. 連結到另一個歐洲人權法院的資料庫,來檢視這些判決是否被具體執行?
  • 初步成果
    a. 從部長會議的網站,將各地執行法案的資料蒐集起來
    b. 更多能將判決和執行結果連結起來的資料
    c. 成為人權法案案例的集中地
  • 對應行動
    a. 加強政府的責信
    b. 研究近年法案的趨勢
另外還有其他國際案例,包括:
  • DonorsChoose.org:這是一個募資平台,要找出訂定績效的方式,所以把歷史資料開放出來,舉辦預測比賽。
  • DC ACTION For Children:是幫社區孩童服務的組織。他們找出政府資料,了解各區域孩童可用資源的狀況,做盤點順序的整理。
  • MESA:為地區經濟條件較差的公共學校,提供高中生最佳的大學選校選擇。
  • CRISIS TEXT LINE: 用簡訊做生命線的求救服務。透過分析簡訊的文字,可以看出不同原因之間的關聯,例如霸凌的原因還有哪些? 是教育或健康?

國內案例

Code for Healthcare

透過天馬行空的研討會,進行議題的發散,激發想像力,再動手做。例如:用地理時空看救護車的資料、Xbox 做護健的資料等等。由
醫療網、醫學會、衛生局等單位發起,由這些單位提供轉診、外傷、急診等資料。而在法律方面,關於資料授權的模式 ,會保護個資,並且僅限本次活動使用,日後若要再使用、需重新申請。

透過黑客松的方式,由各個小組輪流簡單報告想要做的主題,然後開始各自討論、規劃、實作初步原型。幾次活動的參加者,來自醫療領域者、資料分析師、工程師、研究員、設計師(視覺、UX)和政府人員。

最後討論出了:

  • 消防員跟醫師建立的救災用 app
  • 心力指標:在操作員身體狀況差之前做出警告的配備
  • ISS 全國外傷登錄統計
    • 外傷分析 : 年齡,發現年輕跟老人有兩個族群最多
    • 全台六區跟死亡率的關係,發現許多資料品質不夠
  • 轉診流程、系統流程
    • 從病人入院到出院的所有流程,每個點都是一個資料單位
  • 搖滾吧!爺奶
    • 社區老人資料分流平台
    • 試圖讓老人都有照護
  • 醫院轉診資料
    • 發現兩間醫院彼此轉診的資料,時間差異極大。
    • 對系統的建議及教育訓練
  • 氣爆與地震
    • 如何合理分配大量傷患,看急診室最大乘載量
    • 從氣爆經驗找出模式
    • 估計每間醫院平常的承載量,來計算最大承載量
  • 簡報似顏繪
    • 將討論過程圖像化,轉換成關係圖或流程圖

提案

最後 CK 分享他的提案,關於「如何改善公共服務提供者的資料辨識能力」,來進行「資料掃盲運動」,讓資料不再只是每年堆積在系統或電腦裡,而能作為相關問題進一步的辨識與利用。

並且再次提醒前面提到的最佳化流程:BYOD → 配對 → 初步成果 → 對應行動。

要達到一定規模的影響力的話,得用資料思考,做事的方法才會改變。

Q&A

Q1: 遇到個資怎麼辦?
A: 如果組織沒能力做遮蔽,找有能力的組織來,簽約、先試著限定一次性使用,不用急著一步登天。

Q2: 討論會是先有資料,再討論出成果,還是先設定成果,再去找資料?
A: 兩者都有

Q3: 社區發展的部分,CK 這邊的需要是要資料嗎?
A: 我們是想要解決問題,不是要資料,所以希望能找到資料志工。我們這邊有在做社區營造、盤點,我們的理想是跟你這邊很像,有六個診所、就醫資料。

Q4: 所謂的 social good,非營利組織想知道教育訓練有沒有效果?要提供什麼樣的資料?
A: 找出過去的記錄。把每一次的活動、課程做橫向比對。組織內要討論問什麼問題?要討論績效的話,要想用什麼資料?也常常有帶來的資料沒辦法分析的情況。所以理想的模式是先做工作坊,激發大家想像力,並凝聚大家的想法;或者有一個主題,讓專案有帶狀發展的效果。前提是:知道資料長什麼樣子、問題是什麼。

不要害羞,愈快把資料丟出來愈好。不用限定主題。

很多倡議型的團體可能多用外部的資料,而服務型的主要會用內部資料

Q5: 在個人資料的蒐集上,有沒有碰到什麼困難?
A: 以 iPhone 為例,你的行動軌跡記錄可能會外洩。就有國外網站請大家捐個人軌跡資料。

人權團體覺得健保侵犯個資,但如果重症病患想把病歷捐出來也是不行的。

美國有藍色按鈕(Blue Button)的機制 ,因為退伍軍人健保資料攜帶很麻煩,有了這個藍色按鈕,按了就能下載使用。

Q6: 剛剛那些案例後續怎樣被運用?
A: 我們有成立一個網站集結各個成果,試圖對外公開;也去了外商研討會做經驗分享。下個月會去高雄衛生局做經驗分享。

其中有兩個討論成國有後續:社區關懷有實作,有人申請了明年的研究預算。

Q7: 有好幾個主辦單位的話,一開始邀請要怎麼說服組織?
A: 重點在人和,醫療單位彼此互動良好,會互相信任

(說服組織好像蠻難的。)


這裡有一個很長的建立默契的過程,從四月到八月。像NGO 彼此也是有一起做的,可以串連。

北京的經驗分享,他們做了空汙、河川汙染的 App 。這個 App 沒辦法迫使政府改變決策。另一個經驗是聯勸的專案、與 
5% Design Action 多位設計師合作
,很多設計師的提案沒辦法銜接在實務上面。

重點應該是找出解法,而不是享受過程。

Q8: 資料怎麼用都可以嗎?
A: 資料是你們的,要怎麼做都OK。

0 意見:

張貼留言