資料自動化整合統計
合作組織:社團法人臺灣千里步道協會 (組織官網連結)
專案負責人:呂明真|參與志工:張沛詠、尹崇安、邱思嘉|資料科學領域:資料整合
問題描述
組織希望活動資料能夠自動化整合統計,詳細內容包含歷年講師助教人數統計、手作步道數量統計、及志工時數統計。
解決方案
第一階段:蒐集原始資料 & 資料評估
整理各類可用資料,包括千里步道人力需求表、步道手作場次等,並與組織進行訪談,透過回饋給予成果可調整之考量方向。
第二階段:資料分析與程式開發
和組織確認過報表各欄位的格式後,以報表作為主要資料來源,利用 Google Colab 上 Python 撰寫自動化程式,抓取所需資料欄位並進行統計,最後匯出三份獨立報表,分別紀錄
- 歷年活動名稱、年度、類別、參與活動總講師與助教數
- 歷年國內和國外手作步道的位置紀錄
- 個別志工總實習時數統計
程式範例-1
程式範例-2
第三階段:模型/分析結果檢核
進行簡單教育訓練和撰寫說明文件供組織學習使用程式之參考,未來組織只需更新 Google sheet 上的步道相關資料,再執行程式即可獲得最新的統計資料。
建議與未來展望
固定輸入資料的格式
完整文件說明方便下一位接手的人理解與使用
當累積一定數量的資料,可進行進階統計分析