今(104)年8月6-14日,由智庫驅動、國家發展委員會及開拓文教基金會,聯合主辦為期 4天的「公共政策與治理 – 資料思考工作坊」,在班主任行政院副院長張善政引領之下,有來自 20 個中央部會、30 多名公務員伙伴。
活動過程:講課+黑客松
為期 4 天的工作坊,每天上午會有資料科學專業的講師上課,講師們會從「資料是什麼?」這類最基礎的概念,並分享國內他們所操作過的、以及國外領域相仿的各種實作案例,也會提到資料工具、與資料可以呈現的方式。因為用資料說故事的方式有很多,但重點都是:如何透過整理後的資料來問問題、解答問題,最後讓問題的關鍵點,清楚呈現。
每天下午則是大家實作的黑客松。30 多位伙伴分成 6 個小組,每個小組的成員經過事先挑選組合、各有不同專長,每個小組裡會有統計、資訊背景的伙伴,也有提供資料的領域專家,小組成員可以依各自不同的專長背景,共同討論、相互協助。
黑客松的精神就是「做中學」,如同張副院長在結業致詞中所說:「大數據重視實作、講究經驗,因為目前的理論也不完整。」工作坊邀請大家攜帶自己部門的資料、或感興趣的政府開放資料,從這些資料中,發想所要解決的問題。剛開始,各組都花蠻多時間在清理資料,把手邊的數據整理成可用的欄位、判斷資料的可用程度;同時也進行問題的釐清,尋找可用來輔助或綜合分析的其他相關數據。在這個過程中,伙伴們也學習如何解讀資料,講師們也不時穿梭各組,瞭解大家遭遇的問題、提點可能的不足或盲點。
每天的黑客松結束後,各組需要在 3 分鐘內,簡單報告、呈現當天的工作進度,也接受其他小組的提問和講師的建議。過程裡,會看見各式各樣的狀況發生:有些資料找不到、有些資料無法用來解釋太大的問題、有時做著做著就卡住了,但這些狀況都是好的,也正是實作過程的意義。
透過這個工作坊,可以對時下熱門的大數據、資料探勘等詞彙,有更多具體的想像和感受。特別是以下幾點:
資料累積的重要。都說書到用時方恨少,資料也是,有時想解決或探索某個問題,卻發現無資料可用的窘境,或者資料的品質是否確實可用?透過這個過程,可以慢慢改善組織如何預先準備好、留意平時蒐集資料的品質。甚至最後發展成:有一個小組,一起思考、並蒐集各種跨領域的資料,來面對組織會遇到的各種問題或倡議。
從資料中滾動出更多問題。過去傳統的調查或統計方式,大多是設定好問卷發送,獲得的答案無法再做其他問題的延伸,但現在的大數據模式,卻是透過更豐富、全面的資料,來分類、關聯和集群,找出資料的特徵與關聯,加以評估,甚至做出未來的預測模組。大數據無法一蹴可及,不管是資料視覺化或資料詮釋,都是一步一步慢慢累積、清理、統整,從數字進展到有意義內容的過程。
此外,目前更進階的發展是:透過原始資料(Raw Data)、進行資料倉儲化,藉由系統的開發和建立,讓使用者能直接透過業務儀表版操作,生成各種所需要的報表,而不需特定人員再整理、產生。而這類資訊系統的開發過程,勢必須要資料科學家的加入,搭配領域專家的密切合作,才能生成好用的系統;一旦這樣的系統建置好,對組織未來的發展、可能面對的問題,都有很大幫助。
去年11月的網路星期二,邀請了智庫驅動的劉嘉凱(專職企業資料分析顧問服務),分享「 Data for Social Good - 由資料驅動的公益新浪潮」。今年的「非營利組織資訊科技運用座談會」會後問卷中,與會者也對資料工作坊的舉辦與籌備,表示有興趣參加。接下來,開拓將與智庫驅動繼續合作,規劃進行資料工作坊,但這也需要 NPO 的伙伴們,覺得這是重要的、且願意一起帶著資料來、動手做。
最後邀請大家一起:先想一想手邊處理過、或組織內部可能有的資料?如果有,看看是否能蒐集好、最好有電子檔可用。然後,我們再繼續往下一步走。
延伸閱讀:DSP 智庫驅動 | 與中央部會攜手合作,資料跨界思考助決策
0 意見:
張貼留言