想要了解全台各鄉鎮罹癌的狀況與分佈, 不過政府資料並不容易使用 (cris.hpa.gov.tw 以5~7個步驟才能索取單個鄉鎮的歷年資料), 萌生了爬取所有資料的念頭. 日前已有其他的嘗試, 例如 http://github.com/hcchien/doh-cancer 使用 phantomjs 爬取, http://github.com/g0v/cancer/ 存有全民健保癌症相關統計資料, (其中就診人數值得深入探討)
5/10 CCSP Hackathon team goog1er (from g0v) 決定來把資料爬到 github 上順便視覺化, 因此此專案便加速進行了.
Crawler repo: https://github.com/yhsiang/cris-cancer
資料欄位說明
分率=某特定癌症數÷總癌症數×100
粗率=(某特定癌症新診斷或死亡人數÷總人口數)×100000
年齡別率=(某年齡層癌症新診斷或死亡人數÷某年齡層人口數)×100000
標準化率=Σ(某特定年齡別率×該年齡層標準人口數)÷Σ(某特定年齡層標準人口數)×100000
資料抓取參數
[資料類型] 指標-發生率
[統計值] 年齡別率
[性別] 男性及女性
[年齡] 全部
[鄉鎮] 各鄉鎮區
[癌症部位] 全部
視覺化網址
http://g0v.github.io/cancer/viz/
資料及視覺化等若有問題或建議請留在這邊