【共筆意見+發言稿】政府資料開放的價值與管理-品質與責任

最後編輯:2014-11-13 建立:2014-09-25 歷史紀錄

    NCHILD背景

NCHILD資策會科法所將在11/07(五)舉辦【2014科技法制前瞻論壇】,邀請 g0v 參與【政府資料開放的價值與管理-品質與責任】議題與談,因時間上緊鄰 g0v summit,村長不克出席,故於此匯集意見,屆時預計將nchild 出席論壇,代傳達社群意見。

 

    NCHILD問題與討論

HUEI-YING H為強化政府開放資料的信賴與使用,政府開放資料之品質為我國Open Data政策推動所需重視的議題。

本次意見蒐集目的係為使【2014科技法制前瞻論壇:資料跨界領航.產學多元鏈結】之「政府資料開放之價值與管理」議題在資料品質的與談更符合Open Data及實務運作所需。敬請關心Open Data的夥伴,不吝給予寶貴的建議。

同時,誠摯地邀請各位夥伴報名參加2014年11月7日【2014科技法制前瞻論壇:資料跨界領航.產學多元鏈結】(https://stli.iii.org.tw/p2-2.aspx?i=756)。

 

I. 為什麼談政府開放資料的資料品質,時候到了~

我國在Open Data政策以先在各界形成Open的共識與文化為目標進行推動,接下來,除了資料的「量」外,資料的「質」,亦為使用者所關心的議題;而在政府機關則是關心,如何open 具「質量」的data,及品質是否會有相關責任。

 

II. 那…到底什麼是政府開放資料的資料品質?

品質其實是一個相對期待的概念~ 請問,

o 您認為政府開放資料的品質所需具備的要件、標準為何?

  • 衷嵐焜這要從兩個方面看,一個是資料owner,一個是資料user。過去由於不透明,user可能會對owner所掌握的資料期待過高,而現在慢慢開放的資料其品質的出發點卻是為了要符合政府施政需求的,通常不會是user想像的那樣符合user的需求,因為資料建置時的目的就不同了。
  • 因此,所謂政府開放資料的品質在現在看來,user和owner應該是沒有辦法談的,資料品質至少包含時間和空間的精度和準度,但恐怕連user和owner對於某特定資料的ontology認知都不一樣(例如政府講的道路,和你我講的道路,在雙方腦子裡的想像都不同)。但我想有一個方式可以慢慢拉近owner和user的距離,就是資料標準。資料標準(或任何形式的標準)是由owner和user一起訂的。對於特定的資料,標準制訂者不但可以律定資料的樣子,亦可率定資料的品質。當然,既然是標準,通常都是妥協下的產物,也必須與時俱進慢慢進化,並拉出testbed讓其他人來測試找問題,這是拉近owner與user不同的一個做法。

HUEI-YING Ho 您是基於或參考何基礎形成這些要件與標準?

 

III. 政府開放資料之資料品質確認機制的設計

政府開放資料之資料品質更需要公私部門協力合作才得更臻完善~ 請問,

o 您認為政府機關進行開放資料時,是否需要資料品質(機關內部)決策與審核流程?

o 承上,若是,您認為政府機關開放資料品質(機關內部)決策與審核流程應該有哪些內容與項目?

o 您認為政府開放資料品質檢測機制(外部)是否有助於品質?

o 承上,若是,您認為政府開放資料品質檢測機制(外部)應該有哪些內容與項目?

 

IV. 政府開放資料之資料品質與責任、費用收取的關係

o 承III,若未完成政府開放資料之資料品質流程,或不符合開放資料之資料品質檢測機制,是否應課與責任?反之,若完成政府開放資料之資料品質流程,或符合開放資料之資料品質檢測機制,是否能夠減免相關責任?

o 承上,政府開放資料之資料品質與費用收取與否,是否影響責任程度之要求?

  • 衷嵐焜建議要釐清一個比較上位的問題,就是政府資料可以收費嗎?不同的政府資料收費的基礎與法源是什麼?我常聽到政府對於資料收錢這件事是用使用者付費這個說法,使用者付費的意義在於減少公共財在使用上的擁擠與損害,達到以價制量的目的,如果政府因執行其職務所產生的資料可以用使用者付費的觀念來收費,那麼依使用者付費的精神,我是否可以推論出,政府對於其資料收費的意義在於減少各界對於政府資料在使用上的擁擠與損害?以免大家資料用太多產生太多知識?(誤)
  • 我個人的看法是,現階段政府因其執行職務所產生的資料是不應該收費的,更遑論用使用者付費這種說法合理化,原因之一是因為這些資料本來就是執行公務所需,也不似道路、停車格這種具有稀少性的公共財可以用使用者付費的觀念收費,原因之二是資料的再製與傳播成本低到不行,若以規費來說也可以朝向免徵,原因之三是資料的普遍使用就代表知識的創造,越多人可以使用自己過去所無法擁有的知識,這個社會就會越進步,哪有用收費這種門檻來限制文明的進步呢?
  • 因此這個問題,應該先確立政府資料的經濟意義與社會意義,建議讓政府資料朝向不收費的方向前進。若要收費,也不應由政府來做,應另外思考法人或其他方式來經營(公共財未必只能由政府提供)。

 

    NCHILD非逐字發言稿

    nchild與談進行方式是當天才得知。Panel 與談是每人約10~15分鐘,故事前沒有先將發言稿放上。

 

NCHILD與談議題

    0. (為什麼談政府開放資料的資料品質)

  1. 政府資料之資料品質
  2. 政府開放資料之資料品質確認/檢證關係
  3. 政府開放資料之資料品質與責任的關係

 

    nchild以下根據筆記與記憶整理當日發言。

 

(開場問候語略)

今天來參與座談,是代表資料使用者社群傳達意見,由於我也是社群參與者,其中也會有我的意見,之前曾請研究員許小姐於線上協作文件編輯議題以便匯集社群意見,另外我這邊也曾在開放資料社團中貼文徵詢意見。

 

線上協作文件中的議題總共有四項,剛剛螢幕上與談議題則列出三項,還有一項是「為什麼談政府開放資料的資料品質」,其中已經有答案提到「我國在 Open Data 政策以先在各界形成 Open 的共識與文化為目標進行推動」,但社群的意見是這些議題在目前是很難討論的,原因即在於共識與文化實際上並未形成,今天同一時間在中研院資科所舉行的「2014 開放資料工作坊」就還在討論「誰來決定?開放給誰?如何開放?」,所以我主要的意見將會回到這個部分來談。

 

首先,以「開放」一詞來說,全球共同參與編輯的「開放定義」已經進入2.0版,中文部分是社群內中研院的朋友所翻譯,其中提到「開放授權」、「近用」、「開放格式」等要件,政府所談的開放資料是否應該要符合呢?

 

再來,所謂的共識應該要有客觀的檢驗,調查是一個可能的方式,像是推動開放資料的 Socrata 公司,最近發佈了一份對美國各級公務人員或相關人士的開放資料調查報告(見這裡這裡),舉例來說,其中有幾個數據是這樣,53%政策決策者具有單純資料共享外的使命或目標,91%政策決策者相信開放資料能促進與選民間的互動,90%政策決策者相信開放資料能增進選民的信任,31%的城市將在明年增加開放資料預算,44%的城市將盡可能開放更多的資料。當政府在談共識的時候,是不是也能參考這樣的方式來檢驗?

 

為什麼我們認為還沒有普遍的共識與文化?(可參考這裡)因為除了行政院所屬的部分部會,五院其他單位乃至於地方政府,對於開放資料的態度是分歧的,像是政治獻金法規定政治獻金要公開,但監察院內規是只能院內查詢,雖然建立了數位檔案,卻連上網都沒有,也就是在網際網路發明人 Tim Berners-Lee 所倡議的開放資料五星檢驗標準中,連最基本的一星標準都到不了,所以開放資料政策並非現有的規範所能涵蓋。

 

再舉個例子,對於開放資料的態度,即使同樣認為開放資料能夠促進經濟效益,也至少有接受業務委託廠商獲益,像剛才黃副會長簡報時所舉報導,抑或是開放資料產業的建立,以及因開放資料進而帶動經濟活動這兩種角度,從事開放資料的政府機關,其人員應該要能夠輕易地說出,具有一致性的開放資料理由,才能算是建立共識與文化。

 

那麼,為什麼共識未建立前不適合談資料品質?因為即使以最多數人,包括剛剛與談人也提到,會同意的時效與正確性來看,都會因為角度不同而有差異,以政府施政運作的角度來看,每年、或大不了每月更新一次就夠快了,但是以實際使用這些資料的角度來看,應該要能達到即時更新,這時,要以什麼角度來衡量資料具有時效?

 

儘管認為現階段品質難以衡量,我們還是認為可以先從制訂標準著手,以標準制訂為客觀依歸,減少人為介入的價值判斷。而這些標準應該是浮動、會演化的,必須時時反映使用者需求而做調整,這麼做的一個可參照作法,是幾個月前國發會送行政院、關於政策形成前公共參與的草案(事後發現已經生效)。其實,下下週也有一場國發會活動,將進行開放資料詮釋資料(metadata)與應用程式介面(API)規範的溝通討論,這些都是形成開放資料共識時可以參照的做法。

 

剛才許研究員簡報曾提到透過要件清單問卷評量的做法,但並非每一個使用者都是專家,所以不適合以這樣的方式搜集使用者意見,比較有機會的是,在使用情境中融入意見搜集,現在政府資料開放網站已經做到一些評分、意見的功能,但仍有進步的空間,例如用某些方式,自動串連運用該項資料集的應用,而不是靠人力維護的應用推薦與展示,剛剛點進去第一筆應用展示就是不能用的也不能註冊。

 

來座談之前進入英國政府開放資料網站,發現他們又升級了,在反映意見的同時也會有一個表單可以填寫,由使用者來提此資料集帶來的經濟發展、社會發展、公共服務效能、以及其他方面的影響,另一方面,也藉由使用者建議可以相連的資料集,或許因為 Tim Berners-Lee 也是英國政府開放資料的顧問,資料間互連,剛好是其五星標準中的第五星。

 

問答階段(同樣是非逐字的印象簡述)

問:開放什麼資料的項目是否可藉由使用者回饋產生?

答:可以,但需要注意的是,不是使用者說什麼就做什麼,而是要從使用者意見中產生洞見(insights),例如使用者提到一項資料及開放,但實際上牽連的資料集應一併開放,或是其實使用者要求的以另一項資料集來滿足更為合適等等。

另一方面,有些時候透過資料採礦,能挖掘出一些人們原本想像不到的價值,所以各國常常在量的方面是盡可能地多開放。

 

問:(其中一部分)⋯⋯是否可由政府、廠商、使用者三方合作來完善資料開放?

答:大致是這樣,實際執行時有一些具體作法,比如說政府委託執行的單位,將討論的標的放在網路上共同編輯,比如說前一陣子參與的政府網站準則座談,在事前即透過 wiki 的方式將準則草案放上網讓大家共同編輯。