Data.g0v.tw ng
緣由:
基礎建設松,發覺不少人都想要來處理一下五顆星議題
政府開放資料品質檢驗機制,對開放資料的現況有些想法
6/21 hacking:
參與人員: meisheep 、 consonant1999 、 justine
- 現有功能展示
- 原坑型、如何評比五顆星等等方向討論(如果有人要討論的話)
程式組:
- 與 local.data.g0v.tw 串接
- 解bug
文字組:
- 蒐羅 g0v 社群產出資料 ,可以從專案成果取得
- 修改現有文案
設計師:
- 首頁底圖置換
關於:
gov不收錄 g0v來收錄
gov沒資料 g0v建資料
為何有了data.gov.tw,還要有data.g0v.tw?
data.gov.tw 跟 data.g0v.tw 都用同一套Open Source軟體DKAN製作。這個計畫的開始,是希望patch政府在data.gov.tw上未竟之事,例如:
- 更容易辨識資料的可運用度,加入五顆星評等
- 更美觀大方的介面
- 更原汁原味的資料索引目錄,依照 CKAN / DKAN 的設計
- 更佳的社群支援、討論
何謂五星資料?
五顆星資料,是一種對開放資料可重複應用的評估方式,由提姆.柏納-李 (Tim Berners-Lee) -- 網頁發明者和鏈結資料的創始者在 w3 提出。
簡單來講,推動五顆星資料的目標,是希望讓好不容易開放出來的資料,最大化其重複運用性,以增加最好的效益。
資料達到五顆星需要有開放的授權、機器可讀的格式、資料存在網路上可隨時被存取、資料之間彼此可交換串連。
更多五顆星資料的知識,可參閱 五顆星資料 (5 star Open Data) 網站。
2014/11/26 patch to gov update
今天到行政院蔡玉玲政委辦公室 demo 了 data g0v ng(即此 hackpad 所提到的網站),現場對 data.gov.tw 改版的具體建議及參考網頁之紀錄如下:
0. 平台各項「元資料」
包含現有資料集之目錄(目前可結構化下載),預計開放資料集之清單(目前只有 Excel 格式),以及資料請求之處理情況(目前未結構化)、應用展示(目前未結構化)等,建議都以結構化方式釋出,並提供檢索。簡易檢索界面可參考:http://data.g0v.ronny.tw/
國發會回覆(2015/01/07):
- 目前平臺已提供「政府資料開放平臺資料集清單」資料集,每日更新。
- 「預計開放資料集清單」已列入104年辦理項目,規劃提供各部會於後臺登錄預計開放資料集清單。
- 在系統功能未建置完成前,將先以人工方式彙整各部會提報資料,並以結構化方式開放。
- 「資料請求的處理情形」目前係由民眾由平臺提問,請機關透過後臺系統進行回應。
- 目前系統並無法完全對應提問及回復內容,將以填寫類型(提問/回復)及時間序方式提供結構化格式。
- 將提供欄位內容如下:
- 「我有話要說」:資料集名稱、內容類型(提問/回復)、時間、內容。
- 「我還想要」:資料集建議標題、內容類型(提問/回復)、時間、內容。
1. 「預計開放資料集清單」 ( http://data.gov.tw/node/1477 )建議可擴充,以包含「尚未結構化之資料(如網頁表格、PDF 檔,或授權不明確)」鏈結清單,以俾社群協助。
可參考:http://local.data.g0v.tw/ ,特別是清單中的九項資料可用性欄位:http://local.data.g0v.tw/entry/tpq/g0v%3A984924b6-74cd-4d63-be60-b40a78448a68
國發會回覆(2015/01/07):
- 有關預計開放資料集清單,目前未請各機關就非結構化之資料類型提供清單資訊。
- 但目前已請各部會就資料庫及收費情形,進行盤點作業。
- 依「行政院所屬各級機關政府資料開放作業原則」規定,各機關開放資料以開放格式對外提供,目前於政府資料開放平臺所開放之資料集內容符合Tim Berners-Lee 所提開放資料3顆星資料標準。
2. 「我還想要」(http://data.gov.tw/suggest_page)頁面,建議開放 API 界接。
使社群的資料請求區可以定期以社群窗口人員之 eGov 帳號自動匯入,並追蹤處理進度。
欄位可參考:http://data.gov.uk/odug-roadmap
以上視覺化部份不一定要由 data.gov.tw 建置,只需要提供必要的欄位及雙向 API 即可。例如 jaclyn 提到的「活化應用展示」,如果有 API 可以新增、顯示的話,社群現有的專案展示平台即可套用。
國發會回覆(2015/01/07):
- 有關建議政府資料開放平臺提供API匯入意見,可由平臺開發API,提供其他平臺將所匯集之民眾意見以API方式匯入政府資料開放平臺。
- 惟避免API遭有心人寫入垃圾訊息,建議此功能應請需要使用之單位提出線上申請,並對來源IP 位址進行反向查詢及認證,以確認意見來源之正確性。
專案櫥窗可參考:https://g0v.github.io/project-hub-mockup/
3. 另外今天也提到「表定更新頻率」與「實際更新頻率」之間的落差
這部份可能比較是文化問題,不是平台系統可以完全處理的。但也許可以在逾期時提醒相關人員更新,並用較為自動化的方式,來同步現有局處自行發佈的資料。
國發會回覆(2015/01/07):
- 目前平臺資料集明細所顯示之最後更新時間,係指詮釋資料之最後更新時間,非資料集內容最後更新時間。
- 「逾期提醒」已納入104年辦理項目,將增加資料集更新提醒功能,提供機關選擇是否需要收到更新通知。
- 依照機關所填寫資料集更新頻率,在即將到期前及逾期後,以電子郵件方式主動通知機關,進行資料內容更新作業。
更新記錄
※2014/12/04處理情形:目前已將上面的建議轉請國發會研究可行性,如有結果,會再更新讓大家了解,也歡迎各位隨時提供建議。
※2015/01/07已收到國發會回應,除了「未結構化之資料(如PDF)盤點」機制尚待設計外,其他機制都已同意採用。
※2015/01/12對於「未結構化之資料機制」再次提出討論,等待回應中。
※2015/01/17國發會簡宏偉處長回應,同意將PDF、DOCX、XLSX 等檔案格式列入資料平台,會把目前各機關列在資訊公開專區,以及統計報表也納為data.gov.tw的一部分。