2014年10月29日 星期三

慈善捐款與個案故事——相關案例與數據分析

活動現場

活動主題:陳昇瑋:當電腦科學家遇上社會學──從計算社會學來看慈善募款(2014/10/14)
活動網址:http://nettuesday.tw/events/2014/10/477

(本篇記錄感謝病後人生│一站式服務網站長,分享線上筆記供筆者參酌)

陳昇瑋博士任職於中研院資訊研究所,專長領域是多媒體系統及使用者經驗的量測及管理,過去多跟線上遊戲的業者合作。有感於學術研究和現實社會的交集較少,所以這一次他和學生們一起挑戰量化方式(data-driven)的計算社會學,來研究慈善募款的數據資料。他也強調,因為社會科學的問題大多很難,資料取得不易,所以這次以網路上有比較完整資料的「蘋果日報慈善基金會」的報導數據為例,來分析、說明。




一、關於計算社會學

這是一種把「社會科學+電腦科學+量化方法」整合的新興領域,於 2009 年開始蓬勃發展。以電腦科學家的觀點來看,社會學研究的困難在於:(1) 因果關係複雜,容易混在一起 (2) 數據資料難以取得,所以在「計算社會學」中,目前採取的方法是:
  • 網路規模的語料庫資料(Web-Scale Observation Data):例如使用 Facebook 或 Twitter 的資料來分析這個人的行為,可預知憂鬱症的發作。
  • 把網路當作虛擬實驗室(Virtual Lab Experiments):過去難以實現的實驗,現在可以透過網路來進行分析。例如:排行榜的排名可能透過金錢買賣來操控,而較前面的排名的確會影響消費者的購買意願。
  • 用統計分析來建立模型(Computational Modeling)

案例1:KIVA

Kiva 是一個世界性的非營利組織(NPO),它的使命是:透過減緩貧窮的借貸來連結人們(connect people through lending to alleviate poverty)。利用網路、並和世界各地的微型貸款(microfinance)機構合作,kiva 讓每個人借出最少 25 美元的金額,來為世界另一端的人創造機會。⋯⋯更多詳細中文介紹





陳博士觀察了這個平台七、八年的表現,只有 1% 的借貸沒被償還。從這裡面可以觀察到:
  • 擠出效應(Crowding Out Effect):當捐款人覺得大家都會幫他的時候,就比較不會去幫忙。大家比較會借款給不常見的國家或有特殊性的使用方式。 
  • 男女性別在不同產業會獲得不同的群眾借貸,例如男生若要開工廠,會比女生做這件事,容易拿到借款。 
案例2:直接捐助的模式(Direct Charitable Giving Modeling)

以蘋果日報慈善基金會為例,每一天會在蘋果日報刊登一個需要受助的個案,讓閱報者可以直接捐款資助,設限自由募款 30 天,金額無上限。目前已經累積了十年、超過三千筆的報導資料。而從這些報導的標題、約一千字的內文與照片,可以獲得許多資訊,包括受助者的家庭狀況、性別、所遭受的疾病或意外等等,從這些資料中可以建立系統性的模組、比對分析,藉以了解什麼樣的用字遣詞(包裝)與受助個案(事實),比較會吸引閱報者的捐款,進而達到這些目標:

  1. 找出寫文案的規則 
  2. 判斷潛在捐助者忍受訊息的騷擾程度,推對的訊息 
  3. 讓平常沒有捐款習慣的人,願意掏出錢 
本案數據資料的取得:
  1. 直接將網頁資料抓下來。 
  2. 進行文字挖掘(text mining):切割文字詞組,並招募受訪者接受調查,了解大家看到的感受(annotation),共募集四百多人花了 200 個小時。 
  3. 得到詞組欄位的 csv 檔。 
  4. 矯正隨時間成長的捐贈趨勢變因,避免時間因素對模組正確性的干擾。 
整體資料統計

  • 從 2008-2013 共六年,有 1,500 篇報導,全部報導由 8 位記者完成(從中也可以看出哪一位記者的報導,可以吸引比較多的捐款) 
  • 共有 100 萬名捐款者,每個個案約 600 人捐款,平均每個個案可得 50 萬元捐助 
發現五大特色

  1. 受助人:婚姻關係、疾病的類型,與是否有不良習慣,會有所影響。一般來說,單身、有不可歸因於自己責任的重大傷病,比較會引起同情。
    1) 性別:男生低於女生。
    2) 年齡:集中於年幼或年老二極。
    3) 婚姻狀態:失婚或單身者較高。
    4) 疾病:心血管、肝、腎、癌症等。
    5) 天然災害、家暴、喪偶者,會獲得比較多捐款;若可歸因于自身的因素,如吸毒、抽煙等等,捐款較少。
    6) 看護或肢體殘障者,比較不會吸引捐款(可能因為捐贈慈善是捐贈給「希望」);而身障者中視覺障礙者會獲得比較多捐款。
  2. 家庭結構:家庭成員、有無兄弟姊妹、有沒有離婚等等。
    1) 家庭人口數:越多男生或年輕的女人、壯丁等,會減少。老人和小孩較吸引捐款者。
  3. 財務狀況:是否有常規收入、是否列入低收入戶的補助。
    1) 捐款者多表現出「救急不救窮」,有債務者會扣分。
  4. 整體形象:以標題和照片,讓受訪者針對這些文字和影像感受,來做程度排行的判別。(目前影像技術還無法直接處理)
    1) 照片:看起來有「生活艱苦、急需幫助」感覺的,獲得捐款較多。
    2) 體型較胖的,比較不吸引捐款者。
  5. 其他後設資料(meta info):有些資訊跟受助者無直接關係,卻和報導者的文字與上架時間有關。
    1) 報導上線的時間很重要,通常週二、週三表現較好。
    2) 報導的前 15 天,獲得的捐款表現較好。
    3) 一年之中,12月~4月的捐款表現較好,特別 1-2 月最多,5月繳稅後捐款瞬間減少。
以上這些發現來自 290 個變數,透過 C-LIWC 所下載的詞幹來分析用字遣詞的方式,準確率約八成,小結如下:

  • 家庭、死亡、健康詞,會獲得比較多捐款;工作、成就、金錢詞,會較少得到捐款。
  • 文章字數越長,捐款越多
  • 引號:如果一直引用受訪者的話,反而會減分
  • 副詞越多越不好
  • 目前仍需要更多心理學的分析解釋

在場回應

  • 一般 NGO 選擇報導的個案,往往和記者的選擇不同。很多時候,NGO 看到媒體報導是不認同的,因為看不到受助者自身復原的力量,所以 NGO 的個案報導不會寫得太煽情,會拿捏分際。另外,蘋果的報導和捐贈是傳統的慈善捐助方式,有可能造成「受助家庭只需要50萬、結果拿到500萬」的狀況,資源分配不均、過剩,這些都是讓 NGO 在意的問題。
  • Q:東海大學在鄭杰事件後,收到大量捐款,這些是否可用於分析?
    A:資料分析一定要是長期的資料,單一事件比較像是突發性危機。量化分析至少要一百筆資料以上。
  • 蘋果日報的閱聽人屬於特定族群,所以要把閱聽人的脈絡放進來,不同市場族群的側寫(profile)會不同,例如:蘋果日報就是想吸引正在吃早餐的中產階級,因為罪惡感而決定捐款,所以筆路就會比較煽情。講者也回應,希望能跟蘋果日報有進一步接觸,因為目前不知道閱聽者有多少來源是從網路、多少是因實體報紙而捐款。

    0 意見:

    張貼留言