Data.g0v.tw ng

最後編輯:2018-07-25 建立:2014-06-20 歷史紀錄

 

JIMMY H緣由:

CHANGYAJ基礎建設松,發覺不少人都想要來處理一下五顆星議題

JIMMY H政府開放資料品質檢驗機制,對開放資料的現況有些想法

 

6/21 hacking:

參與人員: meisheep 、 consonant1999 、 justine

  • 現有功能展示
  • 原坑型、如何評比五顆星等等方向討論(如果有人要討論的話)

 

程式組:

 

文字組:

 

 

設計師:

  • 首頁底圖置換

 

關於:

gov不收錄 g0v來收錄

gov沒資料 g0v建資料

 

    為何有了data.gov.tw,還要有data.g0v.tw?

data.gov.tw 跟 data.g0v.tw 都用同一套Open Source軟體DKAN製作。這個計畫的開始,是希望patch政府在data.gov.tw上未竟之事,例如:

  • 更容易辨識資料的可運用度,加入五顆星評等
  • 更美觀大方的介面
  • 更原汁原味的資料索引目錄,依照 CKAN / DKAN 的設計
  • 更佳的社群支援、討論

 

    何謂五星資料?

五顆星資料,是一種對開放資料可重複應用的評估方式,由提姆.柏納-李 (Tim Berners-Lee) -- 網頁發明者和鏈結資料的創始者在 w3 提出。

簡單來講,推動五顆星資料的目標,是希望讓好不容易開放出來的資料,最大化其重複運用性,以增加最好的效益。

資料達到五顆星需要有開放的授權、機器可讀的格式、資料存在網路上可隨時被存取、資料之間彼此可交換串連。

更多五顆星資料的知識,可參閱 五顆星資料 (5 star Open Data) 網站。

 

    AUDREY T2014/11/26 patch to gov update

AUDREY T今天到行政院蔡玉玲政委辦公室 demo 了 data g0v ng(即此 hackpad 所提到的網站),現場對 data.gov.tw 改版的具體建議及參考網頁之紀錄如下:

 

0. 平台各項「元資料」

包含現有資料集之目錄(目前可結構化下載),預計開放資料集之清單(目前只有 Excel 格式),以及資料請求之處理情況(目前未結構化)、應用展示(目前未結構化)等,建議都以結構化方式釋出,並提供檢索。簡易檢索界面可參考:http://data.g0v.ronny.tw/

 

    國發會回覆(2015/01/07):

  • 目前平臺已提供「政府資料開放平臺資料集清單」資料集,每日更新。
  • 「預計開放資料集清單」已列入104年辦理項目,規劃提供各部會於後臺登錄預計開放資料集清單。
    • 在系統功能未建置完成前,將先以人工方式彙整各部會提報資料,並以結構化方式開放。
  • 「資料請求的處理情形」目前係由民眾由平臺提問,請機關透過後臺系統進行回應。
    • 目前系統並無法完全對應提問及回復內容,將以填寫類型(提問/回復)及時間序方式提供結構化格式。
    • 將提供欄位內容如下:
      • 「我有話要說」:資料集名稱、內容類型(提問/回復)、時間、內容。
      • 
「我還想要」:資料集建議標題、內容類型(提問/回復)、時間、內容。

 

1. 「預計開放資料集清單」 ( http://data.gov.tw/node/1477 )建議可擴充,以包含「尚未結構化之資料(如網頁表格、PDF 檔,或授權不明確)」鏈結清單,以俾社群協助。

可參考:http://local.data.g0v.tw/ ,特別是清單中的九項資料可用性欄位:http://local.data.g0v.tw/entry/tpq/g0v%3A984924b6-74cd-4d63-be60-b40a78448a68

 

    國發會回覆(2015/01/07):

  • 有關預計開放資料集清單,目前未請各機關就非結構化之資料類型提供清單資訊。
  • 但目前已請各部會就資料庫及收費情形,進行盤點作業。
    • 依「行政院所屬各級機關政府資料開放作業原則」規定,各機關開放資料以開放格式對外提供,目前於政府資料開放平臺所開放之資料集內容符合Tim Berners-Lee 所提開放資料3顆星資料標準。

 

2. 「我還想要」(http://data.gov.tw/suggest_page)頁面,建議開放 API 界接。

使社群的資料請求區可以定期以社群窗口人員之 eGov 帳號自動匯入,並追蹤處理進度。

欄位可參考:http://data.gov.uk/odug-roadmap

以上視覺化部份不一定要由 data.gov.tw 建置,只需要提供必要的欄位及雙向 API 即可。例如 jaclyn 提到的「活化應用展示」,如果有 API 可以新增、顯示的話,社群現有的專案展示平台即可套用。

 

    國發會回覆(2015/01/07):

  • 有關建議政府資料開放平臺提供API匯入意見,可由平臺開發API,提供其他平臺將所匯集之民眾意見以API方式匯入政府資料開放平臺。
  • 惟避免API遭有心人寫入垃圾訊息,建議此功能應請需要使用之單位提出線上申請,並對來源IP 位址進行反向查詢及認證,以確認意見來源之正確性。

 

專案櫥窗可參考:https://g0v.github.io/project-hub-mockup/

 

3. 另外今天也提到「表定更新頻率」與「實際更新頻率」之間的落差

這部份可能比較是文化問題,不是平台系統可以完全處理的。但也許可以在逾期時提醒相關人員更新,並用較為自動化的方式,來同步現有局處自行發佈的資料。

 

    國發會回覆(2015/01/07):

  • 目前平臺資料集明細所顯示之最後更新時間,係指詮釋資料之最後更新時間,非資料集內容最後更新時間。
  • 「逾期提醒」已納入104年辦理項目,將增加資料集更新提醒功能,提供機關選擇是否需要收到更新通知。
    • 依照機關所填寫資料集更新頻率,在即將到期前及逾期後,以電子郵件方式主動通知機關,進行資料內容更新作業。

 

    AUDREY T更新記錄

ANDERSCH※2014/12/04處理情形:目前已將上面的建議轉請國發會研究可行性,如有結果,會再更新讓大家了解,也歡迎各位隨時提供建議。

AUDREY T※2015/01/07已收到國發會回應,除了「未結構化之資料(如PDF)盤點」機制尚待設計外,其他機制都已同意採用。

※2015/01/12對於「未結構化之資料機制」再次提出討論,等待回應中。

※2015/01/17國發會簡宏偉處長回應,同意將PDF、DOCX、XLSX 等檔案格式列入資料平台,會把目前各機關列在資訊公開專區,以及統計報表也納為data.gov.tw的一部分。

    Audrey Tang感謝 data.gov.tw 對所有建議都予正面回應。尤其是 XLSX,我想是「公務人員作業習慣」和「社群資料處理需求」之間,目前結構化程度的最大公約數了。