草擬提供行政院 張副院長建言

最後編輯:2017-09-14 建立:2017-09-14 歷史紀錄

KEN T(1/16會議當天紀錄:LINK)

 

    引言

Dear Partners,

在昨天 (12/11) 會長精彩的分享還有大家熱絡的交流下,相信大家一定意猶未盡。

為了讓 Open Data 政策在台灣能更有效地推動,符合民間期待,請大家一起共筆,提供意見給科技會報辦公室參考匯整並提交給張副院長,請大家在這段期間踴躍提出建議及想法。

 

目前會議時間訂在 1/16 11:00-14:00,地點在行政院,我希望在 1/12日前可以完成整合成一個訴求,每個人或許有不同意見,但方向大概一致就可。

 

另外我會思考 把這裡面內容,找一些重點,寫成一篇新聞稿或背景說明,也請大家踴躍提供意見。

 

目前已經整理完成一份重點摘要,明天會議前會正式公開,也請大家保持對本事情的關心

 

    前言

開放資料可視為政府組織透明改造之政策,也可是為政府新世代的基礎建設,故需有權責之主官擔起此責並鞭策下級單位執行。

 

    開放資料的法令與政策

  • 我們需要明確的開放資料政策、法令、權責單位及時間表。
  • 毛治國院長提到的開放資料 2項基本原則,資料方面以「開放為原則,不開放為例外」,收費方面以「不收費為原則,收費為例外」,這兩項原則無法讓各部會積極開放資料。
  • 台灣需要開放資料法,在立法未完成之前,我們需要一個開放資料的明確政策,才能塑造政府各單位的開放資料文化,避免各單位對於開放資料各自解釋。現階段最重要的是訂定開放資料政策方針與推動機制,這是政府這一部大機器能夠運作的必要條件。建議應於三月底前提出我國開放資料行動方案,行政院提出開放資料法草案。
    • 可修改政府資訊公開法、個人資料保護法及檔案法。
    • 可以參考蔡玉玲政委到 g0v 提案的 vTaiwan 作法,將「開放政府資料」作為一個主題放進去。
    • 立法的討論時間較長,變動因素較多,但可以先做的事還有推動全國發展一致的開放資料授權條款,目前也有民間版提案,應該可以在政府對自己外包的授權條款2.0不滿意而遲遲不公佈的狀況下見縫插針。
    • 立法的草案要解決開放政府資料共識的問題,在共識達成前要先有達到共識的共識。
  • 必須重新評估政府服務與民間加值間競合的關係,需要重新做規劃調整。
  • 各機關應建立常態性的開放資料負責單位,設置資料長及編列相關預算員額。
  • 由上到下,建立公務員開放資料素養訓練,並針對各機關開放資料成效近行獎勵及列管。
  • 建立一個民間、政府合作的開放資料常態性組織。
  • 政府內部對於開放資料多頭馬車。
  • 開放資料的不能等,以亞洲的發展歷程來看,估計只有一年的時間,一年內沒有任何建樹,將被東南亞各國趕上。
  • 可否有一個民間版的開放資料藍圖!? 大家一起討論!_
  • 雖然開放資料法的進度很難掌握,但仍應朝此方向訂定那些資料要開放?什麼資料要開放?開放的Road map為何?開放資料什麼情形下收費?
  • 建議由行政院提出一個開放資料政策,條列進行的方式,避免各部會都在觀望,或是規避責任。
    • 目前行政院所屬是有政府資料開放原則,但政府不是只有行政院,還有其他各院跟地方政府,總之,長期來說還是需要以適當的法源依據來要求。
    • 應該將「開放政府資料」作為綱領之一,寫進毛院長要研擬的網路政策白皮書。
  • 英國學校以資料開放為己任 (這個是什麼? 看不懂!)
  • 開放資料翻轉政府採購制度
    • 數字政府是政府轉型的最新階段,涵蓋開放政府及智慧政府階段,基本上,爾後政府計畫的資料均以開放資料格式開放所有資料的;為減少政府資料在開放時需重新製作的成本,目前有些國家已經變更其政府採購制度,將所有政府採購計畫均需以開放資料格式驗收;此外,所有政府計畫或系統在一開始設計時,即以開放資料為基礎來思考及設計。建議:目前我國開放資料政策,除加速開放政府資料數量,增加資料品質,培養開放文化,輔導產業應用外,亦應思考在採購制度及系統設計上有所變更。
    • 公部門在製作應用時(如Web、App、報告、印刷品、新聞稿),其資料來源應以自家單位所釋放的開放資料集為優先使用,如無開放資料集,則必須先建構與釋放其資料,行有餘力再去做應用開發。
  • (是否可以找到韓國的開放資料法,讓大家知道。)
  • 有了政策方針後,再看看要完成政策是否非以立法手段不能完成。在台灣開放資料是否有立法需求應先成立一個研究案進行分析:那些須入法才能推動?現有法規可涵蓋嗎?修改現有法令就可以嗎?新法如何避免與現有法律之競合問題?等等,歐盟也走了10年才完成立法,台灣除求快以外,還要兼顧立法品質。
  • 要讓政府部門了解開放資料對他們帶來的效益,他們才會真心去做,而不用太多的監督,因為他們是為自己的利益去做的(這是我推動政府機關導入知識管理的經驗)。上位者應該幫有心推動的政府部門解決想做卻不敢做的問題。
  • 透過立法是解決基本問題,但是過程冗長,對立法院委員們沒有利益關係,推動有困難。我的建議要從政府組織做調整,增設一級資訊單位(CIO),行政院科技部都無法主管資訊業務,如何有專責單位與預算推動資訊業務,甚且是更進階的開放資料業務 。
  • 目前國發會非常勇敢的主導Open Data,即便個部會開始動了,但是他無法整合個部會間的資料標準與關聯,甚至只開放無價值的資料(如衛福部開放醫事機構的住址,比Google上的還低階)。
  • 思考如何讓公務員動腦、開創、負責與主動積極,是乎也是的討論方向。
  • 推動政府開放資料政策,有涉及科技與其他國家政策的發展,Road Map除了往下看以外,且要往上看上層掛起來的國家政策與脈絡是什麼?釐清可以更清楚為什麼要推動政府開放資料政策。
  • 可能相關的法律:
    • 政府資訊公開法
    • 個人資料保護法
    • 檔案法
    • 規費法
    • 著作權法
    • 公務人員任用法
    • 公務人員考績法
    • —— 新訂定——開放資料法

 

    論述與智庫:

我國推 Open Data 的目的為何?戰略如何?

  • 我國開放資料政策,太過著重於「執行」,在「目的」論述方面極為缺乏,若有論述仍僅停留在談論如何執行,與預計可能的成效,卻不管「目的」為何,但是對於我國為何要推行開放資料的論述,極為缺乏,務必補足此塊,可交由中研院、各大學、各官方或民間智庫強化其論述。 但目前看來,熟悉開放資料的運作人才在民間與社群,也可交由民間的領先者 pioneer 協助建立論述。
  • 不可以國外如何推行,則我國就在後跟隨其作法,各國民情、文化組織均有不同,不可同一而論,需找出最適合我國的方向與步調前進,在地植根,如此才可在亞洲與國際站在領先者地位,如失其根,無所立足,遑論國際合作。
  • 堅強的論述,可以讓政府部門在推行政策時,略有所本,知所弛張,可主導國家政策該如何進行,非四下環顧鄰國之作法,再決定如何跟隨。
  • 開放是種精神與文化,推動開放資料政策,將會直接影響政府單位的組織作業方式,將會朝開放、透明、合作的方向前進,故文官體制將會逐漸有所變革,應及早規劃與適應。
  • 開放資料應視為下個世代會使用的基礎建設,使用者、受益者,是下一個世代的人們,我們這個世代必須將基礎建設蓋起來,這種新世代的建設,仍需以開放的精神進行,不可以封閉的方式運作,如指定特定的廠商建立特定的開放資料平台,是以老方法在建構新世代所需的建設。

 

 

 

    認知推動與廠商培育

  • 認知推動很重要:持續開辦廠商認知座談會,以形成公民文化為終極目標。
  • 開放資料推動近兩年,大家對開放資料與資訊公開仍模糊,對開放資料也無一致的定義,持續開辦開放資料研討會,結合 ODA 圓桌論壇,依有興趣領域辦理一整天的研討會,分三部分進行:開放資料定義理論、國外實例、圓桌討論,可以較實際的整合觀念,並運用國外既有案例或商業模式,來刺激我國廠商或公民的創意,並提出確切想要政府開放的資料集。
  • 開放資料的最大獲益者應是政府本身,除透明化外,運用民間創意來幫助政府當責 (accountability) 的提升更重要。因此,政府可以先提出自己的需求,來誘導民眾發揮創意;而不是辯稱,已經開放3千筆資料集,但民間沒有產品及需求。或許用小額計畫來培養政府的需求及開放。
    沒有產品是因為關鍵的資料集並未開放,以食藥署最近開放的藥證資料為例,立刻就可以衍生許多應用
    孫阿蒼廣告一下, 衛福部放出的資料馬上就被 kiang 整合了 : http://drugs.olc.tw
  • 競賽的檢視,那些創意被忽略了?
    • 兩年來的創新競賽,含大專校院創意競賽,及工業局補助計畫的競賽,應重新檢視,得獎或輔導的廠商目前狀況。工業局計畫得獎的廠商檢視其運營現況,未得獎的前二十名,請社群團體、ODA、創投、或專家再次檢視,看是否有不錯的創意,只是不會表達,或未考慮商業模式等計畫,或許可以重新請社群團體或ODA輔導他們,不要浪費了創意,也可開創年輕創意家成為亮眼的公司。
  • 請社群(如 g0v、張維志、ODA)持續投入意見,您的意見很重要,正反兩面本是常態,都是為了國家的進步!
  • 是否在工業局的補助計畫內,可以有項將開放資料做出更好運用,由現有 ODA 有經驗的人士協助參與,在協調尚未開放資料內容前,可以先將政府資料做更好的運用。
  • 規劃開放資料育成中心,可配合工業局及工研院計畫實施
  • 邀請立法委員了解及共同推動。
  • 培養媒體運用開放資料。
  • 談到要發展新的open data產業,初期應以需求為重(60%),供給並行(40%)。沒有需求,做再多的創意競賽、廠商輔導、人才培育都沒用。但需求方也可能會以供給方廠商能量不足而不願採購或委外,所以兩者須兼顧,只是比重稍為不同。
  • 需求包括來自政府及民間。在政府方面,除了認知宣導以外,我非常同意柴主任的意見,也就是要解決政府採購制度的問題,才會有立竿見影效果。在民間方面,除了也做認知宣導外,還要加上民間user端的應用輔導,建立示範案例,教導民間user端如何使用開放資料來增進企業效益,進而增進採購意願,讓供給端有商機,若能造成正向循環,政府就能因勢利導,事半功倍。
  • 在供給端方面,對學生、soho族、新創公司舉辦競賽及後續輔導,對既有加值業者也進行輔導,辦理人才培訓課程等等,都是可推動的方向。
  • 至於執行方式、過程與細節等,是可以檢討改善的。

 

納民力為己力:

  • 「開放資料委員會」(或推動小組)屬性偏向行政會議或組織,故可聘請產業、學界等熟悉開放資料之先進為顧問,或擔任外部委員,以利政策之推動,因各層級單位面 對的資料屬性不同,故外部顧問、外部委員的屬性可有政策、規格、技術、法規等多種屬性,來協助與解決委會員執行上的問題。
  • 外部顧問可進駐於各單位,協助其開放資料之推展,可以用多種形式推動,如標案、專案、補助案、聘僱人員、顧問、執行秘書、志工形式均可,以各單位的資源與需求而定。 也可開放其組織架構,與民間組織進行協作。
  • 政府各單位的網站資料極為豐富,可視為直接開放資料的來源與窗口,僅需由最高院級單位提供一份:「政府網站資料開放授權」,則可往下遍及所有單位的網站資 料,全列為開放資料。許多單位有製作網站的能力,但沒有資源可以建構「開放資料平台」。也可以脫離資料格式與品質五顆星的迷思中,並促進各種應用的開發, 資料中介處理的產業發展。
  • 官方舉辦的比賽、或專案計畫在開放資料的發展,很容易淪為煙花一幕,對於前期整體的開放政策發展,重要性並不高,前期該資源投注於基礎建設,與文官施政的開放透明制度的建立。不可期待短暫的比賽所帶來大量的應用充數,此為假象。

 

開放資料政策與整體政府組織改造有關,不可將僅交於單一單位規劃與執行,以行政院為例,僅交由科技部或國發會規劃,再交由經濟部工業局執行,將會遇到許多窒礙難行之處,且開放資料政策非一個科技專案,也不可僅交給各單位的資訊部門處理,或再設立CIO/CDO擔任,因其行政權責與其他單位平行,甚至低一個位階,難以推動開放政策。

開放資料政策的執行:

  • 首長、主官、文官與業務人員,務必在執行開放資料政策前,完全理解、認知、清楚明白何謂「開放資料」的涵義、精神與信仰,要執行「開放資料」政策,則該組織單位,必須有 Open 的精神,如此才能執行到位,故文官必須將「開放」的精神與文化內化,故上段所述的「開放論述」極為重要,在此可用上。
  • 委員會應定期檢視所屬單位推行的績效,並將對開放資料有功或怠惰人員送予獎懲。
  • 考試院需在公務人員銓敘、任免、考績、級俸、升遷、褒獎等法制事項,訂定公務人員執行「開放資料」的相關制度,以利提高推行之力。
  • 審計與會計部門的人員,務必教育知道何謂「開放資料」,以利行政單位編列預算,以及執行前後無後顧之憂。
  • 行政主官在對部屬進行任免、獎懲、升遷、調動、等時,需考慮有無開放資料之能力、政績。並以有執行開放資料之經驗為升遷的優先條件之一。

 

 

 

 

    開放資料集

  • 三個月內公布我國盤點的資料集,並提出開放資料進度方案。
  • 以韓國、日本等經驗,台灣至少有三萬個資料集以上可以開放,現在的三千多個,至少有一千個可能是濫竽充數資料,真的還有進步空間。
  • 對於不開放、機密的資料理由,必須透過與民間協商方式進行。
  • 如果可以將法令完備,應該可以加速開放資料集。
  • 對於敏感資料有疑慮的釋出,應該有民間正式參與,並非政府片面決定給學術界或某些特定團底使用。
  • 科技部的學術資料開放宜加速,美國歐洲都有明確的例子。(如果有明確開放,蔣偉寧部長就不會被學生騙了.....也不用下台了。)
  • 開放資料如侷限於「開放資料平台」所釋放的資料集,則資料有限,速度也慢,官方的「網站」本就含有大量有資料,研擬適宜的「網站資料開放授權」,允許直接使用網站資料,則開放資料集數量可大增,應用也會更為蓬勃,也就是官方可直接將網站的資料,逐漸轉為開放資料屬性釋放,而非龜速建置開放資料平台,畢竟某些單位的能力,很難建構平台。如可直接以開放授權,取得網站資料,定有民間或商業公司,建立資料集平台。
  • 各單位在行政、施政、報告、開發應用時,需以開放資料為優先,有開放資料後,行有餘力再作衍生品。例如:
  • 公部門在發佈新聞稿、公開報告、網站應用、App時,必須同時開放其資料來源。
  • 製作資料的衍生物,如網站應用、App開發,與民間相同,必須使用該單位的開放資料,不可將資料列於私密,僅可由官方製作。
  • 開放為優先,格式品質為後:
    • 能開放的資料,raw data,不論何種格式,何種品質均可開放,不需拘泥於指定的格式,不需要求資料品質完善才開放。資料的格式、資料的品質五顆星追求,屬於有資源的單位, 行有餘力再做之事。 資料格式不易讀、資料混亂、品質不佳,開放的生態中自然有人會將資料整理好。
    • 不執著建立開放資料平台是最快的方式,是以開放為優先的作法,將開放資料平台當成一個索引。(可參考美日兩國目前的作法)
    • 日本:可從政府網站著手,資料仍存放於各單位網站上,再從開放資料平台設置連結引導過去,被定址的資料應即屬於開放資料範疇。(www.data.go.jp)
    • 美國:同日本一樣,在原本網站上,將要發布的開放資料,直接放至於網站上,行有餘力再建構其延伸物(Web、App、印刷品),提供給民眾使用與下載。(www.data.gov)
  • 臺灣政府資料開放授權條款(民間建議版本)
  • 應該要有一個單一平台去跟所有既有資料平台做資料同步,理想上是 http://data.gov.tw/ 包含了所有平台上的資料集資訊,避免想要找資料的人還得在多個平台間尋覓。 meta data 的交換目前根本沒有在做,建立了大量只為了迎合 KPI 的資料平台
  • YUTAIWAN延續上點,目前政府的開放資料平台分為:中央、地方(新北、台北)、主管單位(食藥署 http://data.fda.gov.tw/、中選會),另外再加上社群以及民間針對還沒有開放(諸如政治獻金)的資料爬出來的資料(http://data.g0v.tw/)。以中央的角度,要整合每一個平台,對他們作資料的驗證除了技術上的困難,或許更是政治上的困難。
  • 所有住址資訊應該要透過類似 http://maps.nlsc.gov.tw/ 的技術將它轉為適當的座標資訊,座標格式也應該使用最普遍的 WGS 84 (aka WGS 1984, EPSG:4326) ,這樣子可以提高被運用的意願。或甚至請將完整的住址轉座標資料對應表以開放格式釋出,相信光是這個資料集就會衍生大量的應用,現在大多只能倚賴 Google 地圖的 API 進行檢索。
  • 先由各單位提供所有使用到的資訊系統資料庫 meta data ,像是 table schema or ER 圖表等,組織一個審查委員會去檢視這些資料有哪些欄位涉及敏感資訊進行過濾,然後將這些資訊公開,由民間依據這些資訊提出資料集的需求,相信會比現在這樣自由心證的方式實際些。
  • SheetDB.com 由商業公司所建立的開放資料平台,把國內、國外各政府機關以及民間( http://company.g0v.ronny.tw/ )的 Open Data 平台彙整為單一入口網站的平台。這一個平台上可以做地理資訊的轉檔轉換、視覺化、資料清理、以及針對每一個 cell 都自動產生 unique url,讓現在三星、四星的 open data 變成五星。
    • yutaiwang@gmail.com資訊揭露:我自己是其中的開發者,現在把我們在比賽的企劃書 po 出來,希望提供會議的與會者參考。想法是說假如跨部會的統整對於政府來說比較困難的話,或許這一塊也可以由民間來做。政府可以注重在先讓資料 available ,由民間協助清理到可以使用的程度

 

 

將各政府網站流量列為 Open Data

    現狀:

各個部門有不同的網頁,絕大部份首頁似乎並未使用 Google 網站流量分析工具,(判斷方式:在首頁原始碼搜尋 ga.js,有可能有遺漏,或使用的是非 Google 工具):

- 內政部:有

- 科技部:無

- 交通部:無

- 衛福部:無

- data.gov.tw:無

- data.fda.gov.tw:有

    為什麼這很重要:

假如政府是一家網路公司的話,這一家公司其中一個重要的任務是要透過不同管道,對其客戶進行溝通,包含網站、關鍵字、Facebook 粉絲團。這些數據很重要,因為這些數據可以用來判斷不同廣告的成效。政府花費了許多預算進行對外宣傳,應該有義務將廣告的成效數據加以記錄。使用這些數據,應該是可以讓政府在有效的預算增進對外溝通,也是一個很好的指標檢視各個活動是否真有成效。我個人猜測這樣至少可以讓政府的網站績效增加 300% 以上,而且這些績效成長是真的可以以數字檢視的。

 

    要求開放政府網站流量數據,和要求使用「特定網站流量監控服務廠商」的規格與工具,這兩件事應該要切割處理。不然會重演「特定瀏覽器限定」的悲劇。
    會議中有聊到,其實直接將機房的流量統計資料(raw data)丟出來即可,倒不一定要丟 GA 的結果

 

    香港怎麼做:

西九文化區 (http://www.westkowloon.hk/tc )有累積網站、關鍵字、Facebook 粉絲團的數據。Google 香港以及西九文化區進行合作,當時我被邀請擔任一個資料工作坊的講者,工作坊的目標就是使用這些數據,可以改善他們線上網站 (http://www.neonsigns.hk/)的廣告投遞策略,在有限的預算做更有效的溝通。

或著很可能民眾急著要從政府的網站上找某一個資訊,但數據顯示因為頁面的介面可能沒有設計好,所以民眾到了某一個頁面就流失了。

以 Open Data Portal 為例,現在上面都是各式各樣的資訊,假如某一個頁面的資訊(比方說「登革熱的防治專區」)最近非常熱門,這一個本身應該也是相當重要的訊息。

 

    建議:

儘早針對所有的網頁都加上流量監測工具,並將流量資訊以 Open Data 的方式公開。假如可以每一個網站都是有埋統一的追蹤碼,還可以做到跨站追蹤,會有更大的效益。同樣,Facebook 上政府的粉絲團,雖由不同的地方單位經營,但應該可以把中央的一個帳號加為管理者,讓這一個帳號可以下載各個粉絲團的成效。

 

提供統一的檔案命名、儲存格式,以及儲存地點

    現狀:

  • 依敝公司去年底幫某政府部門作資料加值的經驗為例:
  • 單一部門的資料分散在多個承辦人的電腦裡,大家以不同的命名、儲存方式在保留這些檔案
  • 。出現同一個檔案,居然對同一個單位有不同的稱呼,如:
    • 財團法人台灣文學發展基金會 vs. 財團法人臺灣文學發展基金會 vs. 臺灣文學發展基金會
    • 一心戲劇團 vs. —心劇團
  • 最後使用多 20 幾隻小程式以及大量人工,單一 excel 檔案進行了萬次以上的修改。
  • 有保存的資料沒有統一的歸檔方式,每一個承辦人儲存檔案的方式都不同。
  • 檔案本身應該需要更好的管理系統,不然資料龐大(40 GB),難以加以利用。此單位後來運用了大量人力來手動標記檔案類型,但事後再進行分類相當困難。
  • 資料沒有保存,絕大部份的資料集散落在不同單位承辦人的電腦裡面。當承辦人離開的時候,資料也會不見。大概只有近兩年的資料保存的比較完整,要搜集兩年以上的檔案非常困難。
  • 原始檔沒有被保存,包含廠商所製作的輸出物的原始檔,以及照片的原始檔。很可惜是每一次不同活動的的內容物需要一直重複製作。另外照片則只有結案報告上有保存,以致於最後這一個活動的唯一照片來源是結案報告中 pdf 中已經被壓縮,品質非常差的檔案。
  • 除了數值資料,政府還有很多非文字 / 數值類型的資料,像是:
    • 照片
    • 輸出物
    • 影片
    • 簡報檔
    • 結案報告LINK
    • 網站,沒有收錄相同活動過去的網站網址,抑或網站網址下線後就全部遺失了
  • 資料沒有保存,絕大部份的資料集散落在不同單位承辦人的電腦裡面。當承辦人離開的時候,資料也會不見。大概只有近兩年的資料保存的比較完整,要搜集兩年以上檔案非常困難

    建議:

  • 針對檔案的命名方式建立起一份命名的 Style Guide,統一大家對於多媒體檔案的命名方式。另外,也可以建議每一個單位有任何輸出品的時候,跟廠商要求將原始檔也提供。針對不同的資料來源建立一個統一的上傳平台,讓大家可以有地方可以統一管理,而非在承辦人的桌機裡面。或許一個最簡單的方法,是比方:
  • 一種資料集開一個線上線上試算表,然後大家每次有每一個月最新的參觀人數的數據,就依照先前人的格式填入這一個表單中
  • 多媒體的話,開一個 dropbox,並說清楚命名規則,一樣也是一有發生,就可以把輸出物以及原始檔依照規則上傳
  • 假如有一個更好的平台可以搜集這些資料,並針對不同的資料做 type checking 最理想,但我覺得光是用免費的工具可以做到的事情就非常的多了
    關於上述建議,我的想法是政府單位可能比較難去使用我們覺得很理所當然的免費工具,例如 Google Docs 或 Dropbox,所以可能會碰到問題,可能要另外腦力激盪想想比較可能被採納的方法。而您所提到的這些問題,感覺很像是期待政府單位通過 ISO 標準,從一般公務執行階段就力求良好的文件管理、標準管理以及知識管理。我也覺得這很重要,而且也是所有資料產生前的基礎建設。

 

    SERENAYA資料分析人才培育

  • SERENAYA國內當前缺乏資料科學家人才,政府初期應鼓勵產業具統計能量、domain know-how與商業運作之業者組成團隊合作進行發展。
  • 應針對不同背景的族群分別開設不同課程(可考慮與學校結合)培育資料科學家。
  • 直接邀請歐美知名應用開發者來台灣多開幾場演講或工作坊,其實華人圈有很多這類人才吧,只是台灣的薪資水平過低難以吸引他們,國內有能力的也大多傾向往國外跑
  • YUTAIWAN新加坡政府 + 世界銀行針對記者所辦的 databotcamp:http://hackfoldr.org/databootcamp
  • Google Squared Online 針對企業內部:http://www.wearesquared.com/

工研院與資策會應當擔任科研與人才培育的角色,但是依據往例成效不彰,專業能力也受質疑。政府法人與科專的科研成果也需要Open Data一下。

 

    政府負責開放資料的團隊

  • 開放資料成功的國家,都設置有CDO,或一個新的部門或人力來面對此事。我國原先設定都由國發會資訊處來進行,但從這一年來看,已經超乎他們的能量,建議設定一個新的專責單位來進行上位的協調及維護。建議於半年內盡早完成。
  • ODA 的轉型與否?是否可以有一個新的單位,能藉由工業局的補助,發揮更大功效,或許可以討論看看。
  • 資料品質的要求應區分政府要的品質及企業要的品質不同,開放資料是現成因應政府施政需求所收集資料的開放,並不是依企業需求所整理出來的資料,因此,應有資料收集整理的中介公司,或許可以培養國內資服廠商,依不同興趣團隊收集政府資料,依巨資技術清潔重整資料,或許還可以部分收費營運,這樣可以減少政府及企業資源的浪費。早期或許可以是政府補助,但長期應自主營運。
  • 如開放資料格式不強求五顆星,以追求開放精神所釋放的各種格式與品質的資料,則必定會有處理、清理、收集資料的中游公司出現,但如果開放資料僅能從開放資料平台,以最乾淨與最高等級品質的方式釋出,則會抹煞部分公司的生機。
  • SERENAYA政府重要資料蒐集與產出單位應設立資料長(CDO),包含:主計處、科技部、衛福部、農委會、環保署...等。負責單位之資料蒐集、管理、開放產出、分析、應用。
  • 開放資料政策應由主官領導推動執行,例如,某一部會要推行開放資料的政策,而成立了某開放資料委員會,則該部會的部長必須擔任主任委員一職,所轄之各單位主管擔任當然委員,如此才能有跨部門的推動。資訊ICT、公關、業務、行政等各部門才會進行開放政策的推行,資料才放的出來,並能有效的跨單位合作。不該僅交由所轄的資訊單位主導。以行政院而言,應由院長擔任主任委員,各部會首長擔任委員。以台北市而言,市長擔任主任委員,各單位局處首長擔任委員,依此類推。雖需要CDO、CIO,但更需要CEO之力,從上位以及跨部門處理
  • 先有CIO,才有可能有CDO。

 

政府開放資料的組織:

成立各層級的「開放資料委員會」或「開放資料推動小組」

需 應合本國民情、文化與政府組織體制,推動開放資料政策,應由單位最高行政主官負責與主導,或可設置「開放資料委員會」,由最高行政主官派兼任當然主任委員 (或召集人),其他各部門首長或副首長擔任委員,對所屬上層單位負責,並指導下級組織成立次級之開放資料委員會。該委員會可為虛擬但強連結之組織,附掛於 例行行政會議之中,進行討論與政策制定。

其組織架構範例如下:

  • 由總統宣示我國積極推動開放資料之目標與決心,並指導各院成立「院級 開放資料委員會」,推動開放資料之政策。
  • 行政院下設立「院級 開放資料委員會」,行政院長擔任主委,各部、會、處之首長擔任委員,以發展行政機關開放資料為最高指導與負責之委員會。 該院級委員會向總統負責,並指導所屬各單位成立部級委員會。
  • 行 政院往下的各部、會、處,再設立該部會處之「部級 開放資料委員會」,由各部會之內閣首長擔任主任委員,其所屬之各單位主管擔任委員。該部級委員會 向 院級 委員會負責,並指導所屬下級單位成立開放資料委員會。如內政部成立「內政部 開放資料委員會」,內政部長為主任委員,內政部所屬之各司、處、會、署、室、中心等主管擔任委員。

 

 

    國際投入與合作

  • 泰國ega (電子化政府局)11月來台,他們在兩年前聽我提open data後,也開始在泰國如火如荼的進行open data推動;回程前告知,想與我方簽署MOU,也想藉我方之力帶他們進ODI/UK的合作loop裡;明年他們正規劃辦理一open data day活動,有可能會邀請我方參與(我週一12/15飛泰國,將與他們洽談這事,屆時也將依實際情形邀請我方代表前往-明年2月);
  • 泰國是東南亞國協的重要領導角色,而明年(2015)東南亞國協即將合併成為一個國家(東協經濟共同體),在泰國取得領先或合作的角色,也就等於進入東南亞國協市場。
  • 另一方面,我建議明年下半年由工業局規劃辦理的亞洲open data高峰會,除了邀請日、韓、英國來台外,也邀請泰方前來,共同就亞洲地區的open data發展研商,以確立我國於亞洲open data的標竿地位。
  • 韓國想和台灣一起建立亞洲的開放資料夥伴關係,共同推廣亞洲的開放資料。
  • 申請世界銀行計畫幫別的國家作開放資料
  • 以政治經濟上考量,台灣與香港、新加坡、日、韓合作比較有效益。但是就政府的結構性,師法英國與美國政府的做法接受度會高些。源頭還是在白皮書,但又緩不濟急。

 

    開放資料 vs. Big Data?

  • 這兩個息息相關,雖在定義上不同,但目前大數據的政府補助計畫分散,多個團隊都在做類似工作,宜整合成上下游關係,避免多重浪費。
    把兩者混在一起說,是危險的。甚至讓我們直接問好了,政府到底有多少東西可以稱為 big data?而這些 big data 又有多少是可以真的直接開放不經過匿名等處理?
    如果以我在業界處理大資料的朋友所言,50 TB 等級的一口就吞下去(如果沒記錯),現在政府開放資料應該很少稱得上是大資料的,至少 g0v 那邊運用到的還沒看到過。
  • NORACAMI超越科技部,政府的 Big Data 應該 Open 為全民所用。政府的 Big Data,應該一開始就要與 Open Data 運動匯流,朝開放給民間使用去努力,不該只侷限於科技部學研的使用。因為民間、企業會比「政府+學研」更有效率。不管 Big or Small,應該一開始就將「開放」擺在首位,先突破民間使用政府資料的障礙,而非又生使用壁壘,離開放的目標越行越遠。請參閱這則新聞:公共大數據 擬開放挖寶公共大數據 擬開放挖寶 (2015-01-05 工商時報 記者呂雪彗)
    • Q1: 「...都有意在一定合法範圍,提供學研機構研究分析...」,何謂「合法範圍」?
    • Q2: 這個合法範圍,為何僅限學研機構?除了學研機構,為何民間不能也來參與「找出政府政策方向,並作為提高行政效能的新利器」?
    • Q3: 政府在 Open Data 上的使命為何?不是應該致力於找出「開放讓民間也可以合法使用這些 Big Data,歡迎一起來找出提高行政效能的新利器」的道路,並且努力排除路上的障礙?藏智於民用於民,如此方為提昇國家競爭力之道。
      我猜政府會特別強調合法的原因是, 當初朱敬一博士說要商業化健保資料庫的時候, 嚇到太多人, 所以台權會跑去告健保局, 然後政府可能也嚇到, 所以縮回去, 只有合法+學術研究才可以
      所以我下面才寫了一個簡圖, 先把 Raw data 和 Open data 切開來
      朱敬一博士推廣 open data 是正確的, 但是他選了剛好是最困難的兩個題目 : 醫療雲 => 健保資料庫資釋出有隱私 , 文創雲 => 故宮資料 => 故宮消費合作社不願意放出嘴邊的肥肉 . 然後 觀光雲 好像不錯, 但是沒看到具體成果
      2012/01/19 經濟日報 "行政院科技會報副召集人暨科技政委朱敬一昨(18)日表示,行政院將在第二季完成「醫療雲」、「觀光雲」、「文創雲」三大規畫,透過政府將可公開的資料釋出到民間,協助創造數兆元雲端市場商機。"
  • Big Data 講的是一般單機電腦難以處理的大量資料,開放資料只是 Big Data 的一個子集合
    用子集合來談真是很奇怪。因為這是在講不同概念的兩個東西。唯一有交集的,可能是他們都在談「資料」
    實務上 Big Data 經常是將開放的資料與自身擁有的資料進行交叉分析,在這個情況下可以將開放資料視為 Big Data 下的一個資料集;也事實上許多處理 Big Data 的技術也常常被拿來分析開放資料( ex. R (programming language) ),開放資料可以說是 Big Data 相關技術的入門練習課題。
    這樣說真的是大誤了。開放資料不表示就會有巨量資料可以玩。巨量資料常見的也不是開放資料。所謂處理巨量資料的技術常拿來分析開放資料?這更是超極大的謬誤了!很簡單,把巨量資料的四個 V 拿來檢驗一下目前絕大部分的開放資料,就可以知道你把全部混在一起說了。
    狹義的定義兩者會有明顯的不同,但廣義來說彼此還是會有很多交集。 Linked Open Data 就是 Tim Berners-Lee 5 ★ Open Data 的終極目標,資料間的連結完整實現後就是一種 Big Data ,而且隨著更多資料的加入這個連結的數量會快速膨脹。
    資料連結(Linked Data)的背後隱含發展語意網的目的,連結的基礎是在於資料語意關係的等同,資料都連結就會有大資料產生?資料連結並不是在生產資料,而且把資料結連在一起,資料的量是一樣的,只是語意關係強化了,資料被解讀的面向(facets)增加了,可利用的深度就增加。千萬不要被LOD cloud的那圖泡泡圖所影響了,那個圖要強調的是資料開放愈多,可被連結的資料就愈多。
    用最明確的屬性來說就不會是子集合,大資料不一定開放,開放資料不一定大(常常)。
    如果侷限在單一資料集的確如此,但我以為大資料強調的是處理量,而不是資料類型的單一。連結資料需要的處理量基本上就可以是大資料的範疇裡。 g0v 裡面關於 OCR 的研究,像是政治獻金、選舉公報等等都會衍生出大量的運算處理,進一步的再做歷史資料分析、歷史新聞連結等等,產出的結果不知道該認定為開放資料或大資料?我的想法是大資料能夠涵蓋所有的資料,只是過去很少處理複雜的連結,或甚至只有進行抽樣處理,但隨著技術的演進可以做更大規模、更全面的嘗試;而開放資料只是所有資料的一部分而已。
    大資料時代需要的是想像,而不是侷限在少數看似大量的資料集上面,因為能夠從各種不同的連結裡找到有價值的資訊才是大資料要做的事情,在這個前提下,所有能夠取得的資料都是一個子集合罷了。
  • 兩個底層都是一樣,舉貨幣為例,紙鈔是傳統Data,不易流通,電子貨幣為Open Data,跨國流通。Big Data就是達到經濟規模後所產生的效益。但是兩者都需要一定規範與管理,方能符合公平與正義原則。
    Big data 只是資料運用的一個 buzz word。要讓資料產生效益,不是只有 big data,而是知道如何讓資料與需求被 match 起來,透過不同點的連結,讓效益與應用出現。small data 也可以有他的經濟效應

 

 

    例外

  • 如果牴觸法令,窒礙難行,需公開清楚列出牴觸何法令,並於該單位主管負責。如人民認為應公開,卻不公開,需與人民有座談、公聽、協調之行為,或由人民可對其上級機關提出申訴(如上級之開放資料委員會),或對法院提起行政訴訟,如該單位有需開放而故意不開放行為,或敗訴,主官應負有被懲處或負政治之責。
  • 如有國安之疑慮,可交由其上級之開放資料委員會閉門審議,需有外部委員參與會議,因國安層級,外部委員的身分與背景需事先徵信與篩選。

 

 

    政府開放資料語錄!

  • 不開放資料是為你們好,因為如果開放了,國外公司就進來,你們就慘了,所以我為你們好,不開放資料。
  • 我們十幾年前就開放資料了!
  • 只要是公益用途,我們都願意開放資料。
  • 除健保資料應用在生技研究外,財稅、交通、內政等資料,都有意在一定合法範圍,提供學研機構研究分析,找出政府政策方向,並作為提高行政效能的新利器。(只有學術界可以用,叫開放資料)
  • 科技部代理部長林一平強調,大數據是個寶藏,就看會不會挖掘,若會應用國家競爭力可望更強大,若沒有好好利用,恐怕翻不了身,尤其市場商機爭取對象,絕不只在國內,更大的是利用海外客戶進行巨量數據分析。林一平表示,擁有全國巨量資料部會,包括財政部財稅資料中心、衛福部國民健康署、交通部運研所、內政部警政署,及金管會聯徵中心等,科技部利用國網中心介入,以去識別化供研究,暫不作商業營利用途
  • 為珍藏台灣珍貴的地科資料,國家實驗研究院國網中心打造台灣首座千兆級的地科資料庫,保存來自太空、大氣、地底、海洋等珍貴的觀測記錄,為首座完整擁有台灣的地球與環境科學基礎數據庫,未來主要提供學研界研究使用,並做為政府永續環境及防災政策重要參考,但不提供一般民眾使用。國網中心指出,地科資料庫目前僅提供學者研究與政府單位使用,使用者必須提出申請才能擁有帳號,通過審核可免費使用,預估申請時間約1周。
  • 地圖及影像資料,須專人保管,列入移交、不得複製,非經國防部同意,不得攜出國外。
  • 即時犯罪資料!? 刑事偵查中不公開!
  • 你為什麼用我們單位的資料,沒有事先申請,也沒有告知我們?
  • 政府資料不願意公開的的理由:
    • 1.資料涉及國防、社會安全議題敏感
    • 2.資料涉及個人隱私
    • 3.擔心資料品質不好,怕開放後被質疑
    • 4.擔心資料被外國公司使用,有資訊外洩之嫌
    • 5.擔心被外界誤用,如石虎出現的資料用在台13線拓寬工程(誤)
    • 6.主張智慧財產權,例如資料生產單位有著作人格權
    • 7.資料為財產,怎麼可以隨便給你用
    • 8.因為規費法,要付費後才可以拿到資料
    • 9.沒有適宜的法令讓我們的資料公開
    • 10.你就用嘛! 不要問這麼多
    • 11. 先寫公文來申請,個人不行,最好是法人或是研究單位。
    • 12.我們非常認同開放資料,但是行文至法務部尋求解釋,卻得到要單位依政府資料公開法原則自行認定及評估.
  • 引自「 開放資料(Open Data) 常見的問題與謬論
    • 什麼是開放資料?
    • 開放資料就是叫政府吐資料出來!?
    • 政府已經公開資訊了,為什麼還要開放資料?
    • 我們公司是既得利益者,掌握了政府資料,為什麼要協助政府開放資料?這樣不是製造更多競爭對手?
    • 資料開放出去後,隨時可以終止別人使用!
    • 我們是商業公司,為什麼要把資料開放出來,那可是商業機密啊!
    • 我拿到開放資料了,該怎麼應用?(該怎麼賺錢?)
    • 我是政府業務單位,事情已經夠忙了,為什麼還要開放資料?很麻煩!
    • 這些資料有個資疑慮,這些資料有國安疑慮,這些資料沒有價值,不需要開放!!
    • 使用資料的人,要付規費!?
    • 使用資料的人,要先透過書面申請,審核後才能使用!?
    • 這些資料只能學術研究使用,不允許商業使用!!
    • 這些資料是有版權的,不能隨意使用!!
    • 不是機器可讀的資料,不是開放資料!! PDF、圖檔、WORD檔案都不是開放資料。
    • 一定要建構一個開放資料平台或是網站,才是開放資料。
    • Open Data 就是要作 Big Data、雲端、App、網站!!
    • 開放資料只是政府的標案,跟我們公司沒關係。
    • 我們公司不會資料處理,開放資料對我們沒有幫助。
    • 政府開放資料,資料只放出來就是給民眾使用。
    • 我們公司資料很多,想要開放資料,該怎麼作?
    • 我們公司想要開放資料,該怎麼作?有什麼幫助?可以得到什麼?
    • 政府問民眾:你們到底要什麼資料?
    • 民眾問政府:你們到底有什麼資料?

 

 

參考文章:政府開放資料十一問

 

 

 

亂入一下, 腦力激盪

 

Open Data Check point

Raw Data ====> Open Data ====> Public Open Data Server (portal)

(R) (O) (P)

 

Raw Data (R)

  • 整理維護 Raw Data 的主管單位 (管理權)?
  • Raw Data 著作權 (所有權) 歸屬 ? ( public domain or 主管單位 )
  • 可以讀取 Raw Data 的單位 ? (使用權)
  • 整理維護 Raw Data 的經費來源 ?
  • 其他單位將 Raw Data 產製成 Open Data 的法源依據
  • 是否有鼓勵整理 Raw Data 釋出的相關規定 ?

( eg: 政府資訊公開法, 地圖資料不能拿到國外 , 健保資料庫釋出 => 專法 )

  • 是否有 API 介接 ?

 

R=>O Raw Data to Open Data

  • 監督產製成 Open Data 的主管單位是 ?
  • Raw Data 產製成 Open Data 的經費來源 ?
  • 那些欄位要刪掉或加密或統計模糊化 ? ( eg: 用藥紀錄, 房價, 犯罪紀錄 )
  • 是否有鼓勵產製 Open Data 釋出的相關規定 ?
  • 是否有 API 介接 ?

( PS: 2, 3 個 raw data set , 有可能產生出 10 餘組 open data set )

 

Public Open Data Server (portal)

  • 監督維護 server 的主管單位 ?
  • 維護 server 的經費來源 ?
  • 是否有 API 介接 ?

( 真的需要每個單位都來一個 portal 嗎 ??? )

 

我對於資料開放在台灣的發展觀察

潛伏期(~2010):開放資料有聽過,但不清楚那是什麼

萌芽期(2010~2012):台北市開砲,新北市跟進,研考會將Open Data定義為「公開資料加值」

發展期(2012~2013):研考會領軍,先衝量,再求質,定義「開放資料/資料開放平台」,並提出管理作業要項及授權規範

茁壯期(2013~2014):國發會改制,強化參與協作概念

質變期(2015~):柯P強打開放政府,將資料開放平台的使用者從開發人員擴展到媒體及一般使用者

 

 

民間版提案