開放資料新聞產生器

最後編輯:2016-03-05 建立:2015-12-24 歷史紀錄

 

    Poga Po感謝 whisky 提供「開放資料新聞產生器」這個新專案名稱 XD

 

    IPA C專案簡介

 

POGA P*

https://speakerdeck.com/poga/xin-wen-chan-sheng-qi

 

ET B預定使用者

POGA P資料提供者、資料分析者

 

IPA C預定功能

POGA P自動分析資料內容,抓出可以簡單呈現的部分:

  • 排序:最新、最大、最多
  • 地圖:地點、地址、座標
  • 推論資料型態/欄位規則:哪些欄位可能是 tag、可能是 pkey、可能是 ISO-3316-1(?)
  • STARDOGparse utility:
    • time parser
    • what is pkey?
      • Poga Poprimary key XD
        stardog哈, 不是啦, 我是說可以寫個功能是找出pkey
          Poga Po喔喔~ :+1:
    stardog

 

CHIA-LIANG K現有類似專案

POGA Pgoogle fusion table

https://support.google.com/docs/answer/6280499?hl=en

http://sheethub.com

 

ET B相關專案

POGA Phttps://g0v.github.io/color/

dbpedia

schema.org

 

IPA C授權方式

POGA P程式:MIT

其他:CC-BY?

 

IPA C使用資料

 

ET B專案目前狀態

POGA Phttp://github.com/gv/datasmith

ptoolchain:

https://github.com/poga/postabular

    ET B細節(非技術背景可跳填)

 

ET B協作工具

  • github repo:http://github.com/gv/datasmith
  • hackfoldr 工作資料夾網址:
  • google drive 共用資料夾網址:

 

進度與 to-do

    Poga Po處理資料囉唆到腦羞,所以跑去先做了方便處理 tabula

 

POGA Pr data 的 https://github.com/poga/postabular

    ET B*過去討論紀錄位類型判斷方式

 

POGA P台灣地區名稱

  • 判斷方式:判斷欄位內容是否出現台灣縣市名,或是地區名
  • 參考資料集:
    • https://github.com/gv/datasmith/blob/master/cities.csv
    • https://github.com/gv/datasmith/blob/master/areas.csv
    • STARDOG
  • POGA P原始資料來源:
    • http://www.post.gov.tw/post/internet/Download/all_list.jsp?ID=2201#dl_txt_s_A0206

 

甲殼類名稱

  • 判斷方式:判斷欄位內容是否出現甲殼類名稱
  • 參考資料集:
    • https://sheethub.com/cloud.culture.tw/%E5%85%B8%E8%97%8F%E7%9B%AE%E9%8C%84-%E7%94%B2%E6%AE%BC%E9%A1%9E