逐字稿
高仙桂:
105年度第一次會議,我想國發會作為行政院資料開放的統籌運作單位,雖然這一次是國發會資料開放諮詢小組,可是我們今天也把大概過去幾個在行政院開放資料的進度跟各位委員報告,因為中間在這邊也幫我們很多的忙,要謝謝大家;第二部分我們再報告我們本會有關於資料開放相關的進程。
第二點,抱歉的是我11點鐘在院裡面臨時插了一個會議,所以我中間如果要離席的話,我就會請簡宏偉代為主持。
唐鳳:
OK,我應該先提一下,對不對?不是,我想說的是這一次有一個動議想問一下大家,因為以前都是我即時打逐字稿,事後也都有送給各位委員,我想詢問說今天有沒有可能至少我們在開場簡報的時候,可能前45分鐘或之類的,透過虛擬實境錄影的方式,讓網友們看一下說我們開會是怎麼樣,但實質討論的時候…
高仙桂:
所以剛才已經開始?
唐鳳:
要先問過大家同意,如果大家覺得討論的時候有覺得不方便錄或怎麼樣,隨時說一聲,我就把它關掉。
賴委員:
你可能要說明一下,因為它是720度環場,所以每一個人都會錄到。
高仙桂:
真的喔?
唐鳳:
對,這個需要特別說明,這跟一般逐字稿不一樣。
高仙桂:
不要打瞌睡。
唐鳳:
謝謝。
高仙桂:
我想諸位委員有沒有什麼意見?如果要環場錄影,那我們就上線。
唐鳳:
不是直播。
高仙桂:
我想大家沒什麼意見。
唐鳳:
謝謝。
高仙桂:
我想我們會議開始,請同仁先作簡報。
國發會報告者:
國家發展委員會資料開放諮詢小組105年第一次會議,以下是本次會議議程請參閱。
首先是前次會議事項辦理情形:
一、開放資料之價值運用:本會於3月31日召開環境應用主題座談會,邀集民間及相關政府部門進行座談,後續將持續辦理其他應用主題座談會。
二、個人資料去識別化、匿名化:財政部已完成識別化的實作案例,本會辦理多場說明會,並請其分享實作經驗。
三、網站朝資料結構化、標準化方式開發:預定7月由本會全球資訊網及政府資料開放平台進行實作,並將相關的資料提供其他機關參考。
四、擴大推動資料開放作業:政府資料開放平台與完成跨平台的介接,將新北市、台北市、立法院、經濟部的資料集中列示於政府資料開放平台,俾利外界加值運用。以上前次決議事項說明。
高仙桂:
上次會議決議事項有沒有委員要作詢問的?
我想第二項個人資料去識別化、匿名化我覺得院裡面有很大的進展,不只是經濟部設立一個標準,財政部做了一些實作也得到認證,接下來我們會做的就是衛福部跟內政部,他們今年年底前就會完成他們所有的去識別化的一些相關作業,我想這二個部會的資料其實對Open Data是很大的運用,所以這一部分在過去院長的領導之下積極進展。
如果委員沒有針對上次辦理情形有異議,我們就備查。
國發會報告者:
二、行政院資料開放成果。
行政院訂定政府資料分類及授權利用收費原則,因為資料再利用屬於司法關係,亦即與民事契約約定授權利用,另外訂定政府資料的分類方式,分為甲、乙、丙三類。此外,規範機關擬訂資料收費基準必須遵循一定的相關程序。
政府資料分類有三,甲類為開放資料,以開放格式提供,並以無償不可撤回並得再展授權方式授權利用,也就是甲類資料是不收費的;乙類為有限度的利用資料,以開放格式提供,符合下類三種條件之一,有償提供、保留撤回權或是其他限制,例如限制使用人、使用方式,或人、事、時、地、物等限制;丙類資料為不開放資料。
剛剛提到甲類資料為不收費,各機關將政府資料認定為甲類資料前,應整體考量及使用之公益性是否涉及個人隱私、是否具備完整權利,以得否再轉授權等因素。另外,資料的建置或取得成本達一定金額者應提報行政院資料開放諮詢小組審核後始得列為資料。前項一定金額認定為資料的建置或取得總投入成本合計加計近三年的更新及維護費用達5,000萬元以上者,也就是5,000萬元以上的系統所產製的資料集是否列為甲類資料,必須提報行政院審核之後始得列為甲類資料。
乙類資料以有償方式提供授權利用者,其收費的基準擬訂依下列程序辦理。首先是公開徵詢各界意見,徵詢期間不得少於14日,彙整各界意見之後提報諮詢小組審核,諮詢小組審核通過後提報行政院備查,會後公開審查結果於機關網站及政府資料開放平台。
資料開放三部曲說明如下:首先就系統及資料庫進行就公共利益、經濟發展、政府透明等資料優先開放,並檢視各項資料全面的完整性及法規限制,將上開資料加以分類,甲類資料統一使用政府資料開放授權條款,乙類有限度利用資料,擇一妥適的授權條款,以上為資料開放相關政策。
報告民間關注議題:個資去識別化。
財政資訊中心已完成102年綜合所得稅核定資料個資去識別化實作驗證,成為國內第一個示範案例,後續內政部及衛福部將進行第二波示範案例實作。
另外,土壤液化潛勢查詢系統於14日上線,分為民眾版及專業版,民眾版使用內政部的圖資雲平台,專業版使用中央地調所的地質雲。這張圖是民眾版的查詢結果,紅色區塊屬於土壤液化區高顯示圖,表示的是如果發生強烈地震的時候,較有可能造成中度致嚴重的影響,目前以開放土壤液化顯示區的縣市有台北市、新北市、宜蘭縣、新竹縣、新竹市、台南市、高雄市及屏東縣等八個縣市。環境敏感資料為維護民眾生命財產的安全至關重要,因此政府也積極盤點開放各項災防資訊,以利外界加值運用,目前公開於政府資料開放平台的環境敏感資料如下,請各位委員參閱。
接下來要播放Open Data懶人包,這則影片在4月6日於國發會FB公布之後獲得廣泛地迴響,短短一週其總觸及率達7萬6,000人次,超過1萬6,000人閱讀這則影片。(播放影片)以上為行政院資料開放成果。
高仙桂:
我想這份跟大家報告,搞不好很多委員都很熟悉,搞不好我們會裡面的委員,其他不是主管資料開放業務的相關同仁還不是非常清楚,所以第一跟第二部分基本上最近行政院在做資料開放一些相關的進程跟大家報告,第三個部分就是我們會裡面針對我們現在在推的重大政策都會有一些懶人包,我覺得這個懶人包基本上我們剛剛討論的是,如果從處裡面做就會從技術觀點講這個事情,懶人包跟人民的生活做連結,當然我不知道懶人包後續在FB上面的留言及評語為何,唐委員要不要幫我們指正一下。
唐鳳:
(笑)沒有啦!
其實這個懶人包真的拍得滿好的,因為剛才有提到觸及率1萬多或2萬多的次數,其實我們看的是分享,其實在118個分享裡面,可能九成多都是持正面的觀點。有一些當然少數的一些想法是因為一般我們在製作懶人包的時候是會附上來源,有一點像你看網頁可以看原始碼,但是這裡面因為提到的說明欄只有一個網址,就是政府資料開放平台,裡面其實有提到非常多的應用,那一些應用的網址,其實我覺得網友看完之後會很關心到底要點到哪裡才可以看到,所以如果可以附上來源的話,其實是比較完整的,所以網友不是批評這個懶人包本身,而是要有連結資料的想法,大概是這樣。
高仙桂:
裡面有很多是各部會的資料,所以真的是可以把網址放進去,就是我講到每一個供應的時候,可以放進去。
唐鳳:
就在FB的說明欄寫一下就好。
高仙桂:
好,你有要補充的嗎?
(唐鳳左側約第四位):
因為整個製作懶人包的過程,其實在會內的新聞小組其實幫了很多的忙,一個人一天的生活起床之後,出門前看一下氣象,他可能之後要去搭公車,公車相關的一些資訊他一手掌握,由一個人的生活來貫穿。
這個懶人包上網在FB粉絲頁的時候,如唐鳳委員所說的,其實民間對懶人包呈現的方式跟對它所產生的印象,其實是很正面的表達,以上報告。
高仙桂:
如果我們講到Open Data,大家就覺得政策硬逼的,跟我們沒有關係,但事實上我們生活中已經運用到非常多的Open Data,像現在坐公車我一定先看公車到底到了沒有,尤其是只有半個小時會有的公車。(笑)
行政院資料開放成果的報告,不知道委員有沒有什麼意見或建議的?如果沒有的話,我們就進行本會的資料開放。
國發會報告人:
接下來報告本會資料開放的推動進程。
本會第一季辦理二場次的教育訓練,協助各單位辨理資料維護作業,並進行相關系統及資料庫的盤點,截至3月31日止,已累計開放196項,其中國土處、資管處、主計室、國發基金已達年度開放目標值。另外,民眾在政府資料開放平台互動專區所反應事項皆已處理完畢。
在本會1月27日召開之國發會資訊業務推動小組會議決議,在年度開放資料總數不變的原則下調整部分單位的開放數量,其中中規處調整後為20項、法協中心調整後為15項、國土處調整後為41項,提報本資訊小組確認。
依前述會議,各年度開放資料指標滾動修正如下,請各位委員參閱。
另外,本次盤點與開放項目總計96項,詳細內容詳會議紀錄。
本次開放的重點有後施計畫、研究報告、研討報告等等,截至目前為止已開放資料項數加計預計開放資料項數,距離年度目標值350項,還有54項的缺口,與指標的差距,各單位的現行數字如圖所示。目前加計開放資料項目之後,設發處、國土處、資管處、秘書室、主計室、國發基金等六個單位已達到年度目標值。
在盤點的過程當中,建議後續的注意事項如下:一、為了提升資料的再利用性,優先提供品質較佳的開放格式文件以利外界加值運用;二、配合政策的推行,應主動適時的修改之相關政策;三、重要統計數據如人口推計相關資料更正等等,應優先開放;四、計畫類型的資料,比方說政府計畫資訊解釋平台,以資訊流向化的方式呈現預算的資料,建議優化格式之後開放。
高仙桂:
我想請簡處長補充一下剛剛報告的內容。
簡宏偉:
麻煩回到第21頁,在這邊跟各位委員作報告,第21頁中其實是我們在資料開放平台裡面讓民眾對於國發會所提供的資料提出一些建議或是一些問題,其中我們我們分為四個部分,我們作為四個部分的類別:
第一部分是使用的疑問,針對檔案局及資管處有關於全字庫的字體在哪裡下載、公文地址簿最近更新日期等等,這些在原來的資料上標示並不是那麼清楚,所以在民眾反應以後,我們已經在這二個資料集把它加上去,所以這二個部分是已經處理的。
第二個類別是有關民眾建議改善的部分,包括全字庫的資料原來是必須下載後才知道有沒有更新,民眾覺得這樣子不方便,因此後來民眾反應以後,我們也將此部分改善,也就是會在「data.gov.tw」上標示最近的更新日期讓民眾可以很快知道,這樣也符合民眾的使用,並包括資料集清單要提供標籤,這也有很多民眾在反應資料集的Metadata能夠更清楚,這是在改版的過程中納進去。
第三個建議改善的部分,是有關於全字庫的檔案可以分開下載,這部分我們比較建議還是維持原來整個的下載,由民眾依照需要來調整,這樣對民眾來講也比較方便。第三個類別是有關於錯誤修正的部分,這個部分就包括檔案局、經濟處、人力處、資管處,有些資料代碼不一致或是比數不一致的部分,這部分我們都已經作修正。其中經濟處的部分,在景氣指標中的指數部分資料小數點後的位數比較多的部分,我們除了原來的資料以外,也新增二種檔案格式讓民眾下載,不同的使用人有不同的使用需求,對專業的人也許還需要後面的小數點比較多位,針對一般民眾可能只是需要比較短的部分,這部分我們新增二種檔案格式的部分來協助。
最後一個類別是新增需求,民眾希望我們能夠提供機關名錄雙語詞彙,這個需求在於他希望知道我們政府機關英文的名稱,這部分目前也已經有下載,所以在第一季裡面,民間經由「data.gov.tw」對本會資料開放需求部分,目前都已經處理完畢,這部分我們還是有持續改善,除了對於本會以外,如果有對於其他部會也有追蹤,並且要部會再回應,這是在第21頁需要做補充的部分。
第22頁的部分,依照本會原定的資料開放行動策略,各單位分級開放指標的情況,可是在1月27日的時候,我們在內部資訊業務推動小組上,有包括中規處、法協中心及國土處希望就原定指標調整,中規處希望從原來的27調整為20、法協中心從原來22轉為15,及國土處從原來27增加到41,這部分因為中規處跟法協中心是以處理跟計畫方案為主,國土處除了計畫方案之外還有資料,因此我們在國發會資訊業務推動小組上有通過此決議,因此提報在我們這一個小組上確認,如果確認以後,我們就把這個指標修正到國發會各處室的資料開放指標,這個部分要麻煩各位委員。
修正過以後的如同下一頁的部分(第23頁),等一下要麻煩各位委員提供意見參考。
最後要說明的是第26頁,這部分因為現在是第一季,因此跟指標的確會有所差距,這只是提供參考,也是要讓各位委員知道目前在會內推動的情形,也作為各處室在後續三季推動的參考,以上是針對第一項的報告事項說明,謝謝。
高仙桂:
我想國發會有很多的部門負責的是一些政策或者計畫的業務,因為我們的國發會很多業務不涉及跟民眾執行的業務,所以很多資料蒐集及資料開放這一塊,事實上因為資管處是作資料開放的單位以外,其他的業務單位對於開放民眾使用資料的類型其實比較不是數據型,而是有一點政策計畫方案型,因此中規跟法協基本上大概是有這樣的屬性,所以我們就往下調。
國土處因為有NGIS一些相關的規劃,所以也會有資料,可能比較多的是檔案局,因為檔案局管很多檔案資料,因此我們今天在案例分享特別就檔案局就他們資料開放裡面做了一些示範,順便也可以作為各處在運用他們資料開放裡面可藉機參考,也是可以供本會各個處室如何思考他們的資料要如何落實民眾運用端。
我可能下次要有個建議,現在其實各部會各單位的資料單位開放只有項數,並沒有內容,所以就委員來說只知道幾項,但並不知道開放什麼,所以我不知道現在是否來得及?有清單嗎?有提供給委員嗎?
其他人:
有。
高仙桂:
在桌上,可以請委員參考我們各個處室開放清單的有哪一些。
針對105年度第一季本會資料開放推動情形,不知道委員有沒有可以給我們一些建議?
劉正千:
主席、各位同仁大家好,我想就這一份報告,看起來有一個意見跟四個問題。
一個是個資去識別化標準制定真的很好,我們開放到這個程度就會碰到這個問題,真的領世界潮流。提到會由國發會的平台來示範施作,而且是今年7月要做,只是剛才聽完簡報,看起來到後面也不會說這個實作打算的主題是什麼,可以先讓我們知道一下嗎?還是要到7月才公布這個答案?這個是第一個問題。
第二,這個簡報裡面有提到新規定分成甲、乙及丙三類,但整個說明起來,我自己的感覺比較傾向於變成是乙類,也就是有限度的開放,因為要達到甲類的門檻還滿高的,這個門檻又仔細去看,其實好幾條裡面,前面提到有一些正式在努力的,比如投影片第7頁,是否使用了公益性,是不是涉及個人隱私或營業秘密,建置或取得的成本額外的客製化費用,有沒有權利、可否再轉讓等等,它不能被歸為甲類有這一些限制在,但前面講的個資去識別化,其實就是努力在排除這些限制,其實最後的限制是「成本達一定金額」,5,000萬的門檻一定下來之後,很多資料可能就是用這個條件從甲類會變成乙類。所以,我不瞭解,有一點傾向於資料變成儘量是有限度的開放才有這樣的規定,因為這看起來是今年2月多就通過了,還是實質上有那一些困難在,所以把它變成是乙類,但那一些困難不是正在排除嗎?到底這5,000萬元的門檻是如何精算出來?如果是4,900萬或是1,500萬元?而且我覺得今天走到這個地步,錢不應該是問題,不應該訂一個錢的門檻在,如果不能開放是別的原因,這個原因如果存在,我們努力去克服;但如果已經不存在了,我們就儘量讓它開放。這是第二個比較複雜敏感的問題。
第三,剛才有提到今年土壤液化資料公布,大家都很關注,從二個單位來提供。但我們也知道在開放的過程中出了一些問題,我們沒有說要去追究,我知道這個資料量很大、流量很大,但是不是作一點事後檢討其原因為何,對於我們未來要進行大量資料開放是否學到一些功課,未來如何可以避免問題再發生或者是已經有一些克服的方法。
第四,最後一個問題是,報告裡面也列出來,其實民眾很關心的是環境敏感議題的資料,所以一旦有土壤液化的資料開放,大家就守在電腦旁邊,因此可以感受到Open Data了半天,這一類的資料是民眾最有感的。
我們自己一路走來,政府排除了很多困難、觀念做了很大的改變,才能走到今天這一步,因此我們也是抱持著稱許、肯定的態度。但投影片上連結出來的資料,如果連結去看,現在都有WMS介接的方式來提供了,很奇怪,也許別的資料也是這樣,至少我今天看到這些環境敏感的資料都是中央地質調查所提供的,他變成用WMS,雖然他說可以跟Google套疊,但這種開放並不是真正的開放,比如這一次液化公布之後,我們馬上就想算跟斷層間的距離,或是想要用斷層來做一個Buffer,100公尺、1,000公尺、2,000公尺這一些是要有數字的,但只給我WMS的圖,我沒有辦法做這一件事。
以前我其實是可以從中央地質調查所去下載shap file,因為斷層本來就應該公開的,這個資料應該可以公開,但現在反而卻說是用WMS提供給你,然後就沒有了,這樣有一點開倒車耶!也就是本來可以有更詳細資料去作分析的,但結果變成是WMS。
今天最後一張投影片也有提到未來建議開放資料格式,要優化格式開放,到底怎麼樣是最優化的格式?我記得有一個精神是有好幾類的,開放的程度要能夠提供像Shapefile或GeoJSON這種格式才會有幫助的,這個是我第四個問題,也就是目前開放的環境敏感議題資料之格式不夠開放,謝謝。
簡宏偉:
謝謝委員,針對委員提問的部分,我在這邊說明。
第一,有關於個資去識別化的部分,目前除了財政部以外,其實就是內政部及衛福部同時在做,同時也要求不同的方法來做,在今年會有一個成果。對於國發會的部分,剛才有看到前面的簡報,7月是把網站資料化這一件事情,這是我們現在目前正在處理的,因為我們也認為要把資料開放跟網站結合在一起,讓網站本身是資料化,這是國發會的部分。在個資去識別化的部分,國發會負責的是推廣宣導跟協助部會去做這一件事,因為國發會本身的資料比較少有關個人資料的部分,因此這部分也跟委員說明,是網站資料化在7月開放。
第二,有關於甲、乙及丙三類,行政院所提出各機關政府資料分類及授權利用收費原則,其實這一個收費原則我們花了很多的時間在處理,其實最後是跟民間共同達成協議,而民間也接受這一個收費原則,因此這才有辦法出去。這個收費原則的精神,第一個,我們希望從規費法的限制轉變為司法契約,透過司法契約的方式,對於政府機關的資料不受規費法的限制,因為照規費法的限制,政府機關的資料是必須收費的,而且必須報財政部同意,因此並不能作資料開放,尤其是無償開放,因此收費原則是要解決這個問題。
因此解決這個問題時,我們也盤點政府資料的類型,因此有分甲類的完全開放、丙類的不開放,可是在這大二類中間有一類是在游移的,可以往上或往下,因此我們認為在政府資料開放裡面要處理的是這一塊,這個是乙類資料,我們也希望乙類資料是有限制的提供,有限制裡面不只收費這一個,比如包括有限制提供方式或授權不採用開放授權,這都屬於乙類資料,因此並不是只有談收費這一件事。
乙類其中有包括到保留撤回權,甲類其實是不可撤回的,乙類的收費只是其中一項,在整個制度設計上希望如果是乙類資料,希望儘量往甲類資料移動,只不過現在來講,其實對機關需要一些時間盤點跟重新檢視。
以最近的案例是農委會的航測所跟內政部的圖資,原來他們採用不同的計價及計費方式,透過蔡政委的協調,目前我們讓他是同樣的方式,儘量往甲類。
至於一定金額的部分是由財政部所訂定的,我們針對一定金額的部分有很多的討論,後來我們同意一定金額並不是定了以後就不變,其實會有一些調整,我們先從5,000萬元開始讓機關檢視,有些原來是屬於規費法要收費的,透過這一個方式轉成是司法契約,因此在整個檢視過程中會有二個步驟,第一個是機關內部資料開放小組中去作討論,同時也必須在網站上公告限制條件,包括收費方式、計價模式並跟民眾討論,因此不是機關訂了就這樣,其實必須跟民眾討論。
就算機關同意之後,也要報到行政院這個小組去作最後的確認,行政院其實是可以請他調整,因此在整個限制上,我希望藉由乙類,同時讓機關盤點及宣導機關儘量宣導往甲類移動,這是在甲、乙及丙三類的部分。尤其甲、乙及丙三類在目前來講,除了政府機關可以接受、民間可以接受,對產業也可以接受,因此我們認為是一個好的起點,不過我們每年都會再檢視它,這是有關於甲、乙及丙三類的分類方式。
剛剛有提到格式的部分,我們會去追。因為目前在資料開放裡面,我們原則上是遵照ODI五星級的概念,原來我們是從三星開始,後來民間認為其實二星跟一星也可以,一星是沒有授權的問題,二星是屬於特定資料格式,三星是不特定資料格式,所以現在二星跟一星也可以,所以在中央地調所目前用WMS的格式我們會接受是因為雖然是特定格式,但沒有授權的問題,這也符合二星,不過有關於三星部分我們會去追,其他再麻煩找三星部分。
至於GeoJSON或其他向量格式的部分有些部會也已經在做了,這部分我們是採取歡迎、鼓勵,但不強制所有的部會去做到四星或是五 星,因為那涉及的是成本,我們也認為這一段其實如果介於政府的資料開放平台,民間去做四星跟五星,其實我們認為相對會有一個承諾的發生,因此這是在整個「data.gov.tw」上我們界定的推動方式,以上報告,謝謝。
高仙桂:
我想可以理解劉委員的concern,也就是我們開放資料是以開放為原則,收費為例外。其實甲類資料基本上是無償不可撤回,一旦開放就不得撤,所以我們當時定義如果政府還是要保留有撤回權的話,那有可能某個程度上要避免進入甲類。所以剛剛處長講到乙類資料不代表要收回,但我們可以保留撤回的權利,所以其實在行政院裡面,要變成甲類資料這還要報才會通過,這其實在行政院有很多的背景,當時委員有很多不一樣的意見跟concern,基本上蔡政委認為一旦全都變成甲類資料、無可撤回,可能會變成很恐怖的事,所以那時才會有這樣的因素出來,大概有這樣的曲折過程,我其實那時開會跟劉委員的想法某個程度上也滿相似的,但當時很多委員表示有一些concern;不過剛剛處長也有提到其實這一些規定都是滾動的,我們會看資料開放運用的程度再來作一些調適與調整。戴委員。
戴豪君:
主席、各位委員,我要針對這個有二個請教:
第一個請教是在我們目前「data.gov.tw」的網站上,我怎麼知道資料是甲、乙或丙類?我現在要怎麼區別?我現在看上面是沒有辦法去找到的,當然我知道這個剛通過,所以可能需要一段時間處理。
再者,這個問題是屬於細節,也就是這是有追溯的或之後生效的,又或者是往前去做?因為我知道已經有相當大的比數,舊的比數我相信是還沒有分類的,現在進行新的分類,我們的時間點要怎麼設?是向後生效或者是怎麼樣?這可能是第一個要請教的,也就是在目前的網站上之資料,我能夠知道它的分類;第二個要知道分類意義,因為相關的規定目前在我們的網站上是還沒有看到它的出現。
第二個,針對「三」的丙類,這裡有寫是「依法律不得開放」,但我們知道其實政府在政府資訊公開法裡面規定的是「公開」與「限制公開」,理論上本來在Open Data其實已經通過第一關即政府資訊公開法的檢驗,政府資訊公開法其實將政府所有的資訊分三類,一個是「應公開」、第二個是「限制公開」,第三個是在這二個沒有寫的即「得公開」,這是行政機關裁量的問題,通常是通過政府資訊公開法以後,我們再來決定要不要作開放。所以,我看到這邊文字是寫「依法律不得開放」,我們這裡有一個問號出來,因為在法律規定裡面有沒有「不得開放」的字眼,我心裡有一點疑問。
接下來如果我們處理剛剛講的第一類的應公開跟限制公開,還有一個是得公開,是處理得公開的裁量,是不是只有上面講的資料敏感或其他的事情,我們這邊講的行政裁量基準根本不處理政府資訊公開法,已經過了政府資訊公開法的門檻,剩下來的再有一個行政上的裁量,我想這一塊可能要稍微釐清一下,謝謝。
高仙桂:
請簡處長回應。跟委員說抱歉,我可能要離開了,就請簡處長代為主持,不好意思,謝謝。
簡宏偉:
在這邊跟戴委員報告,像「data.gov.tw」如何去判定,目前是以授權的方式,在「data.gov.tw」上採用公版政府資料開放授權條款第一版,其中就是提到無償跟可再授權不可撤回這一個部分,所以現在在「data.gov.tw」都是屬於甲類的資料。
至於未來乙類資料開始出現以後,我們第一個最明顯的地方就是授權方式會調整,如果是採用收費原則,依規定必須要訂定授權條款,包括它的限制條件,所以在授權方式這邊就會有,在授權說明網址跟計費方式也都會有提供,包括到計費方式是免費或是收費,也都會有,這是乙類資料開始出現的時候就會有判別。的確在現階段來講,其實乙類的資料各機關都還在盤點中,因此以目前來講,這部分在「data.gov.tw」平台上的確是沒有的。
第二個有提到效力的部分,依照我們目前的想法,其實原則上效力是不可回溯的,像現在「data.gov.tw」是屬於公開的部分,這就是符合再授權不可撤回,所以以現在開放,並不會因為事後調整為乙類以後去追溯前面,並不會。
第三個,有關丙類所謂依法律不得開放部分,我們這邊可能在法律的用語上不是那麼精準,這部分我們會在下次調整的時候來修訂,我們也會聽法務部的意見,不過這也跟委員報告,法務部現在在修資訊公開法就已經把資料開放納進去,所以這部分國發會也有參與法務部資訊公開法的修法,除了這個以外,在行政程序裡面,法務部也有諮詢過本會的意見,我們之前都有密切的合作,就是希望在法制的架構裡面,資料開放能夠有跟其他法規命令能夠集合,以上跟委員報告,謝謝。
不知道還有沒有委員針對這個地方有什麼指教?
林佳瑩:
簡處長、各位與會的先進,我想就剛才簡報當中第23頁的部分,有一點問題想要請教一下。
所謂各項數據的滾動修正有一個預估每一年度要調整,等於要達到的目標數,我的疑惑是這裡其實是依照105年對於各局處應該要達到的目標作為一個基礎,好像依照每一年要成長的目標去做一個,我剛剛看了一下大概是一種比較是固定的比例式或是量數的調整。我想知道的疑問是,這樣指標的滾動修正之標準到底為何?因為看起來會有多者恒多、少者恒少的趨勢,我們在看初期當然認為305項應該是105年應該達到的目標,到了109年是873項,這樣的數字就我自己的觀點來講,有一點不知道這個基礎到底在哪裡。
另外一部分的考量是一旦定下來這樣的指標,通常現在政府很喜歡算績效指標(KPI),我會覺得這個有點框住國發會各局處室應該要開放的資料量數,也就是從量數的角度來講,這裡是不是要考量一下,因為像秘書室、人事室、政風室、主計處的固定資料都是「7」,其他的部分會隨著年度去作滾動的修正,當然這是滿好的預估,但我另外一個角度會從務實的角度來講,大家會講說我們有沒有達標,這樣會對資料開放本身發展的趨勢來講是有一個限制的可能性,這是第一個提問。
第二,剛剛的簡報當中已經說明現在政府資料開放平台上有哪一些資料,我想要理解一下,特別是很多民眾非常關心液化潛勢的這件事,剛剛劉委員有提到比較專業的部分,也就是資料本身呈現出來的數值形式是不是可以跟其他的資料圖檔套疊,我站在民眾使用者的角度來說,其實不只有套疊這件事,如果今天查閱的是不同來源的資料,比方說內政部的資料跟地調所的是一致,就我的理解是如此,但如果我今天查閱的是台北市政府的資料,實際上所呈現出來土壤潛勢所標示的區域其實是有落差的,而且是有明顯的落差。
台北市政府的解釋是,採樣的距離是比較密的,地調的距離是比較疏的,也就是採樣數是比較少的,但民眾沒有辦法知曉這個部分,因此我的思考是我們在政府資料開放平台上,對於不同資料來源橫向串聯這一件事,似乎是未來可能要去思考的一部分,也就是我今天站在民眾的角度,我打進我家的地質,我希望知道的是這個地方是不是有土壤潛勢的問題、是不是有地質敏感的問題、是不是有噸層的問題、是不是有淹水的問題、是不是可能有其他我們所謂防災上必須要知道的訊息,我們能不能作某種程度橫向的整合,我覺得是在大數據資料的發展趨勢是可以做到的,但橫向的整合其實政府部會有很多必須要做的內部工作,以上。
簡宏偉:
謝謝委員,我在這邊說明。
首先有關於指標的部分,我們在「ide@ Taiwan2020」裡面有關於政府資料開發當中有一個「KPI」,在109年時整個政府必須要達到3萬筆資料的開放,根據這個,這是從數字來講,我們把所有的政府機關分成三級,譬如第一級是本身資料量很大,比如像內政部、衛福部,所以希望可以公開更多的資料。第三級其實像委員會,比如像國發會,坦白來說國發會本身的資料並不多,所以在這樣的情況之下,的確就我們在追蹤管考的角度來講,其實給一個指標,其實對部會有一個必須要達成激勵作用,當然我們會被人家恨得牙癢癢,我們是用這樣的方式先訂下來,讓各部會能夠追隨。根據這樣子,國發會既然本身是作行政院的資料開放,我們本身以身作則,我們就要求這一個目標再分成各處室必須達成的,的確這個是從數字的角度。
同樣的,數字的角度是不是能夠達到品質的角度,二者的確是會有trade off在,因此我們在整個資料開放推動的過程中,我們分成三個階段,第一個階段其實是屬於推廣,讓機關接受Open Data這一件事,因為機關其實常常在問我已經做資訊公開,為什麼要做Open Data,其實二個是不一樣的概念,一個是知、一個是用,因此我們花二年的時間讓部會知道什麼是Open Data,為了要讓部會知道,其實最簡單的方式就是push部會達成數字,用這樣的方式,其實部會就會想盡辦法達成,的確它的品質並不好,這個我們承認。
第二階段深化的過程要回過頭來看品質,這坦白說這也是我們現在面臨最大的困擾,因為品質很難訂定,我們看了一下其他國家,大概有七大類、三十幾種品質訂定的方式,取決於你的目的是什麼,比如有的品質是從國家的階層來看,看透明為導向,有的是從城市的階層來看,要看的是智慧城市這一塊。聯合國在Open Data訂了八個面向,其中有包括透明、經濟,美國商業部來講是從經濟的角度導入,因此對他來講,所有的資料開放如果不賺錢就不能開放,因此他的估算就是從經濟的角度去估算。
其實我們國內跟工業局合作的是看我們的品質指標如何訂定,我們希望能夠堅固透明及產業,因此這一個前提先訂了,接下來指標跟面向才能夠達成,如果沒有一個目的,其實這個目的就會很虛,因此這是我們現在正在做的。我們原來資料開放,我們原來是從數字、從量的角度來切,我們的確發現很多部會做資料只是切割,我們有發現以後都會通知部會請他下架,這的確是一個trade off,但我們也觀察到這二年裡面,由於我們先從量來push的時候,其實現在機關已經開始了,Open Data是有它的意義在,因此現在有很多機關,我們估算現在有六成以上的機關很願意自己去做Open Data,他的訂定指標甚至超過我們的要求,當然也有很多機關開始在做值的部分,這是我們現在在處理的,所以為什麼會有這個量,這其實是我們在整個推動策略上,先從量再從值。同時在值的部分,除了資料本身的品質,我們也希望加強這一個資料的標準,所以像交通部開始訂定出所謂票證的標準,環保署就依照國際系列X的標準來針對環境資料來作標準,這其實就是我們希望的,各部會針對domain data訂標準。
這就回到委員剛剛提到第二個的問題,跨機關的資料就容易作比較,我們當初對「data.gov.tw」的定位上是一個超商的概念,也就是現在有超商,然後各部會把資料放上來,我們依照這個資料的歡迎度,哪一些要放到門口、哪一些要放到後面,所以我們對資料本身,我們目前並沒有做橫向的勾稽,因為我們的定位這是一個資料開放的market,到民間取得不同的資料去做mashup,他可以去發揮他的創意,所以在「data.gov.tw」裡面,基本上我們現階段去檢查的是有沒有做資料集的分割、資料的連結是否正確、資料內容及登載是否相符,至於資料本身的品質跟其他相同資料集的比較,這部分我們在目前的「data.gov.tw」上並沒有作這樣的一件事情,我想這是取決定位。所以,在「data.gov.tw」上我們的服務只有一個,就是資料的存取,讓民眾方便作資料存取,至於資料價值運用與資料promotion部分,原則上就不會在我們這邊,這跟委員說明。
我們也認為這一塊其實現在看到很多的情況是,民間從不同的資料整合以後,他們發現資料有問題會回給我們,我們就會追部會說為什麼資料不一致,目前我們的做法大概會是這樣,以上跟委員報告,不知道委員是不是有其他的建議或指教。唐委員。
唐鳳:
因為我上次講太多了,我這一次簡略一點。
首先我想先請國發會各處的朋友們,因為上次在簡報的時候,國發會的朋友們有說比起法務部或內政部或交通部,這邊作為Open Data的產製部會而言是一個相對小的部會。我有看到你們「data.gov.tw」上有一個data版的視覺化,就是我們很熟悉一個泡泡圖,在泡泡圖上確實就是法務部1,906筆上的資料,國發會是196筆,在旁邊看起來確實是滿小的。但是如果你切換到下載量的話,法務部4萬7,000次跟國發會4萬4,000次其實是一樣大的,所以我的意思是並不是資料產生的多寡,這也是呼應剛剛林委員所說的,而是量的KPI不一定能夠轉換到使用者會不會使用;這裡當然對法務部沒有任何批評的意思,我的意思是「量」本身確實就是作為推廣或像寫習作的功能,到這個階段已經階段性達成,也很感謝各位的努力。
有一個問題是在剛才的簡報裡面有一位朋友說,我具體唸一下,他希望紫外線即時監測裡面能夠加上下述的標籤,就是即時、氣象、監測及紫外線這四個標籤,國發會的回答是說其實因為部會在產生的時候,很少能夠自己給出這種標籤的東西。剛才你們報告是說下一期會加上這一個功能,但我不確定這個意思是以後就會請部會填嗎?因為他們填可能是填不完的,而且也不會像各個學有專精的使用者一樣,那麼知道他們的關聯,因為之前的定位是「Data.gov」不放使用者自行產生或者是有改製資料,那是在外面,但惟有這一個資料的分類或標籤,是不是可以稍微考慮提一個建議標籤,只要不是來亂的,就是稍微大家審一下、看一下沒有問題的話就上架,我想這樣子也有助於如果大家都tag,好比台南或是tag某一次登革熱會形成一個動態分類的效果,也是呼應林委員的想法,謝謝。
簡宏偉:
謝謝唐委員,不知道科長這邊有沒有要回應的?
科長:
有關於標籤的部分我們在下一期,應該基本上在今年9月之前就可以完成,標籤層次的方式其實是dynamic,會從整個資料集本身的特性去推薦這個資料集可能包含哪一些標籤,再由這個資料集的決定owner可以去選擇是不是直接看到那些標籤或是更清楚的方式加強,以上說明。
唐鳳:
謝謝。
簡宏偉:
謝謝,不知道這樣有沒有回答到?
唐鳳:
其實我剛剛的意思比較是現在使用者提意見或是要資料或什麼的,門檻稍微高一點,如果讓使用者自行建議標籤的話,那個門檻是最低的,甚至不需要它登入,等於提高他的參與感,我其實只是這個意思而已。
簡宏偉:
這個部分其實以為看這樣有沒有辦法做,尤其是先前我們有提民間的資料這一塊,我們當初的想法跟政府的資料作分割,但是會有一個專區,也許可以用這樣的方式來處理,謝謝。
針對報告事項一的部分,本會辦理推動的情形,不知道各位委員還有沒有指教?如果沒有的話,接下來是第二個有關收費原則後續配合做法的部分,麻煩時間掌握一下,謝謝。
國發會報告人:
有關於政府資料分配授權收費原則,其中有關於5,000億元以上系統產製之資料集該用什麼方式處理,我們這邊有列了二個:一個是採無償方式提供的時候,必須續明不收費理由,提報行政院核定之後才可以列為甲類資料;第二個是有償方式的提供,也就是列為乙類資料,機關必須經過公開徵詢程序訂定收費基準之後才能報行政院備查。目前初步盤點,本會達預定金額5,000萬元以上的系統,既有「我的E政府」、「e管家Plus網站」、「行政院政府計畫管理資訊網」及「公文電子交換系統」等四個系統,整體成本達5,000萬元的系統如剛剛所說的有四個,至於這一些系統產製的資料及是否該列為甲類資料,我們從以下幾個面向可以知道,包括公益性、競爭性及價值高低等等當作一個評估的面向。
簡宏偉:
這邊跟各位委員報告,後來在委員有一張國發會系統盤點資料,目前在整個國發會大概有43個系統,我們針對作盤點是不是有三年5,000萬元的情況。
這邊列出來的四個是比較大的,包括「我的E政府」、「e管家Plus網站」、「行政院政府計畫管理資訊網」及「公文電子交換系統」,我們先針對這四個會去作如果是乙類的話,它的授權跟利用的情形應該如何,我們初步原則上是以不收費的方式,所以如果以這四個為例,如果委員也都同意這四個是屬於不收費的,我們就會把這四個作一個說明後報到行政院,如果同意以後就屬於甲類,同樣是在三年5,000萬元的限制下,我們認為還是可以屬於甲類。
這就是剛剛跟委員報告的,希望藉由本會的範例、農委會的範例及內政部的範例,希望逐步建立一個讓其他機關知道並不是所有的乙類資料都要收費,其實它是可以切割開來的。同時也希望讓機關放心,也不是所有的資料一定要完全開放,因為有一些畢竟機關有其考量,我們希望透過案例的方式,讓部會知道乙類的做法怎麼樣,這跟各位委員報告。不知道委員針對第二個報告事項有沒有要給我們指教?
唐鳳:
因為之前高召集人提到5,000萬元是採計它的產製跟維護,當時有很多方案,只採計其中一種或5,000萬下修一點或怎麼樣,討論很久以後是用加計5,000萬元的標準,我想說至少作為諮詢委員,應該要知道的是,除了超過5,000萬元事實之外,產製的部分是多少、維護的部分是多少,以及加起來是多少。以後要滾動式檢討這一個東西的話,我們才可以知道是否維護都佔了九成九之類的。
簡宏偉:
謝謝。
我們會以這四個為案例把它再切割,就是它的成本再分析出來,也就是屬於市場性維護是多少、資料本身的蒐集跟處理是多少,我們希望藉由這樣子讓部會知道,也許可以算以資料蒐集跟處理這一塊,不過這在先前跟各部會提的時候,部會有反應這滿細的,我們先從我們這邊做起,謝謝。
不知道各位委員還有沒有其他指教?本會委員有沒有其他指教的部分?
張富林:
這個部分可能要體諒一下資管處,因為這裡面我們打算用「e管家Plus網站」的處理,因為e管家本身涉及到很多是屬於民眾資料的部分,這部分有沒有適度作切割處理,不然到時候這個運用是採無償方式提供,後段如何維護使用者的權益。
簡宏偉:
其實這回到我們剛剛講的,我們把不涉及隱私的部分,尤其是統計性的資料作開放。
第二,其實涉及個資或隱私的部分我們會先評估有沒有開放的必要,如果有開放的必要,我們就會導入去識別化的方式,把資料作一個清洗。不管要怎麼做,原則上涉及個資的部分都不會開放,一定會經過處理,以上跟委員報告。
不曉得有沒有各位委員有沒有建議或者是指教?如果沒有的話,我們接下來就請檔案局針對資訊公開共享跟我們作案例分享,之後就由資管處就「iTaiwan」來作案例分享。
檔案局報告人:
接下來由我跟各位委員就資訊公開全民共享國家檔案加以簡報。這是今天的簡報大綱,請參閱。
首先跟各位委員說明的是,檔案管理局的核心價值是在於提供國家發展見證、創造國家智慧資產,我們的願景是希望能夠提升政府知識管理效能,並且檔案資訊開放運用。
有關國家檔案應用的法規,主要是以檔案法跟施行細則為原則,其他相關的適用法規請參閱。由於檔案法第1條第2條有明定,本法未規定者適用其他法令規定,因此也有政府資訊公開法、個人資料保護法、國家機密保護法等其他相關法令的適用,因此本局就國家檔案開放運用的時候,是以儘量開放最小限制為原則。
什麼是「國家檔案」?簡單來說就是具有永久保存價值而移歸到本局管理的國家就會成為國家檔案,目前本局透過七大徵集方向,現在所典藏的有包括臺灣光復檔案、臺灣民主化檔案、憲政檔案及國營事業檔案,這一些相關的資料都可以上本局網站加以瀏覽。
因此國家檔案的來源還是以機關檔案為主,機關檔案如果具有永久保存價值而且經過本局加以鑑定的話,到了移轉年限就會移轉到本局成為國家檔案;除此之外,對於私人或是團體所持有的珍貴文書,根據檔案法第14條的規定,本局也可以透過捐贈、受託管理或者是架構的方式來加以徵集成為國家檔案。
誰可以來申請應用國家檔案?只要是具有本國國籍而且在我們國內設籍國民、所設立的法人、團體及持有本國護照的僑居國外的國民都可以來申請國家應用檔案。至於外國人的部分,根據政府資訊公開法的規定,是以他國家的法令,並沒有限制中華民國國民申請他們政府資訊的外國人可以來申請國家應用檔案。
接下來跟各位介紹如何來查詢國家檔案及如何申請應用國家檔案。
在畫面上所看到的是本局建置的國家檔案資訊網(Archives Access service,簡稱為A+),可以透過簡易的查詢,也可以透過簡易搜尋及進階搜尋加以查詢國家檔案的目錄。
從91年開始已經累計公布的國家檔案目錄已超過269萬餘筆,也超過890萬人次到這一個網站加以瀏覽,所以透過剛剛A+網站可以查到user所想要國家檔案目錄之後,加以填寫申請書,本局收到這個申請書,只要確認填寫的內容無誤後,我們會在15天內通知這一個應用申請的人如何來取件。所以,從91年開始,本局已經同意提供將近90萬件國家檔案供民眾及機關應用。
表所列的是從102年至104年國家檔案應用的相關統計,包括公布的目錄比數及在A+網站所瀏覽的人次及本局所提供應用的檔案件數,各位可以看到都有成長的趨勢。
目前除了閱覽跟抄錄國家檔案是免費之外,如果要複製國家檔案的話,是必須要按照檔案閱覽、抄錄、複製、收費標準的規定加以規定,這是收費的標準,請參閱。
如何來繳交這一些費用呢?除了表所列的傳統方式之外,本局目前也有提供可以透過ATM或是e動郵局及全家便利商店加以代收,目前我們也正在研議如何透過悠遊卡的方式繳納。
經過核准駁可以應用的這一些國家檔案,如果是A+的會員,而且是以自然人憑證來申請應用的話,就可以在A+網站上去瀏覽經過准駁且是數位化的檔案;此外,民眾也可以和我們約定時間攜帶身分證件到本局的國家檔案閱覽中心閱覽或抄錄,本局也有提供郵寄的服務。
表所列的是國家檔案閱覽中心開放的時間、本局受理案件的時間及取件時間,請參閱。
再來是有關於本局開放資料的辦理情形,我們都是配合本會有關於資料開放規劃的進程加以研擬,目前也都已經如期、如質開放這一些資料,從104年度跟105年度的,105年度目前已經有盤點了28項,也已經提報了,仍有19項正在進行盤點當中。所以未來本局將會持續盤點本局業務跟相關網站資料,同時我們也會規劃系統API介接選擇資料庫適合的欄位合併產生新的資料集,我們將會努力朝向資料開放全民共享檔案的目標來精進,以上,謝謝。
簡宏偉:
謝謝檔案局主秘的說明,接下來請資管處就「iTaiwan」的部分來說明,謝謝。
資管處報告人:
接下來由我來報告「iTaiwan」無線上網服務及手機充電站應用示範案例,目前「iTaiwan」總共無線上網人數約有5,900個,圖上看到的藍色點是每一個基地臺位置,另外黃色區塊是六都的範圍,除此之外我們也公布了手機充電站,紅色點是各個手機充電站的位置,我們公開「iTaiwan」無線熱點及手機充電站的資料集,民眾可利用這二個資料集開放相對應適合的APP,透過在地服務找到最近可以使用的熱點及手機充電站。
目前台北市、台南市、台東縣自辦無線上網服務,與「iTaiwan」完成雙向漫游,其他縣市皆以「iTaiwan」提供無線上網服務,這張圖的右邊是各地方政府服務熱點的數量資訊圖像化表示,熱點數越多,字體就比較大,而左邊這一些區塊,剛剛提到了黃色區塊是屬於六都的範圍,目前「iTaiwan」的資料及記載量排名第六,在Google Play有三項APP的應用、App Store也有一項APP的應用,以上報告。
簡宏偉:
謝謝,跟委員報告,我們接下來在每一次會議的時候,都會針對本會的資料集有哪些應用請相關的處室說明,一方面是跟各位委員報告,另外一方面也是讓會內各處室針對資料本身有什麼樣的應用來提出說明,這樣可以讓大家彼此瞭解。
在「iTaiwan」資料的部分,我們把資料開放出來以後,其實民間就會拿這一些資料作相關的應用,這也是我們希望看到民間的應用。
我們在想的是,可能跟工業局一起,看看有沒有辦法做如何教民眾或民間用資料,我們看到在其他國家,其實現在除了push機關開放資料以外,現在也都push推廣資料的運用,甚至包括訂定內部的盤點程序等等,這也是我們接下來要處理的部分。不知道各位委員針對剛才二個案例有沒有要指教的部分?劉委員,謝謝。
劉正千:
我想剛剛國家檔案局給了一個很好的案例說明,之前林委員提到資料橫向聯繫的問題,像我們瞭解「data.gov.tw」的平台是超商的觀念,但橫向的問題還是存在,我們不能說因為這樣就不去管那一些問題。
另外,我實際接觸Open Data後發現目前國內一些負責在做資料開放比較下級的單位,像二級或者是三級的單位,他們其實一直層級過低,沒有辦法跟人家協調,或是工作量其實很大的這一些問題,我記得在上一次會議的場合有提到,現在資料開放已經是必然的趨勢,國家也很認真看重這個問題,但還沒有一個實際的單位去主管這一件事,現在有一點是任務編組把它湊起來,然後用國發會的高度做這樣的整合工作,長遠的話,可能還是要找一個層級也夠的單位來統合所有的問題,所以我覺得剛才檔案局給的不僅是一個很好的案例,是不是也給我們一個思考的方向?
最後提到這些資料的屬性要怎麼訂、API要怎麼設計及串接,其實這一些問題在所有做資料開放的單位都已經碰到,也都已經有一些解決方式了,這就變成有一點疊床架屋,大家重複在解決同樣的問題,如果都整合起來的話,這一些solution大家就可以一起用了,或是在找solution可以找一次全面性的solution,這樣會比較好的,我這邊提的是一個想法,也許未來作更長遠規劃的時候,我知道組織再造已經很不容易了,是不是透過一個有智慧的做法把這些東西整合好,我自己也覺得國家檔案局可能是一個不管是在層級上或是地位上,因為隸屬於國發會,應該是滿適合的實體機構。
簡宏偉:
非常謝謝劉委員。
先談有關於API及串接的部分,其實我們在去年有公布Metadata及API的規範,也有徵詢社群的意見,所以基本上這一個標準本身是有的。有要再補充說明嗎?
科長:
因為目前不管是在跨平台,因為每一個部會間可能之間平衡部分,或者因為為了讓整個資料本身的描述是一致的,所以我們在去年本身對於Metadata或者是平台間資料交換的介接或者是外界如何透過API直接存取資料本身,其實我們在去年都已經有公布這三個技術規範,大家都可以進行施作。
簡宏偉:
我們公布的時候是有規範,但我們有少了一個機制,就是去檢核,這是我們目前缺少的,也就是檢核機關是不是按照這個標準在做,這是我們會加強的。
剛剛也有提到主管機關,容我用5分鐘的時間分享。我上個月到美國去,大概花六個禮拜的時間,我本來是要study資料品質的做法,可是後來我比較有興趣的是美國聯邦政府資訊組織的推動,我後來發現我們常常會把美國聯邦政府的推動用臺灣的角度去看,其實我先前也是這樣,會以為聯邦政府訂得非常強制性,結果去的時候發現到真正有實權的是county或者是city government,這一個county的預算大概比五十個州裡面的四個州還多,整個county的平均年齡是三十七歲,非常年輕,這個county有三百個資訊人員,比任何聯邦政府都大,其實我後來發現到跟我們想得不太一樣。
接下來我也很好奇整個資訊組織,的確在美國聯邦政府有一個聯邦的CIO,但其實是OMB底下的辦公室主任,其實這個主任一直都有,只是在歐巴馬第一次當總統的時候,把他任命為聯邦CIO,但其實整個聯邦政府的CIO在1986年的時候就要求設立,到2013年的時候整個聯邦有二百五十個CIO,彼此不協調,所以從1986年至1996年,之後到2014年,其實一直要求聯邦的CIO要對部會首長負責,但對各部會首長來講其實都授權營運長來處理這一件事,營運長就有一點類似我們的次長。所以,其實在2014年又通過所謂「聯邦資訊採購改革法案」,又重述一次要求各CIO必須對部會首長負責,但其中改變的一件事是,各部會的CIO其實有分所謂的「大部會」、「小部會」,所謂的「大部會」是十六個部會的CIO是由美國總統提名、任命,不用經過國會,這十六個CIO有權去指派所屬機關的CIO,所以在這十六個的CIO當中,他們是屬於政治任命,再往下是屬於比較常任的任命。
從組織來看,誰來管這一件事?其實原則上是OMB,也就是「美國行政管理和預算局」,它本身也是聯邦政府CIO的辦公室所在,OMB只負責政策,接著是由美國聯邦服務總署去執行,所以在「聯邦資訊採購改革法案」通過以後各部會就必須提報這些資料提供給OMB。透過這樣的方式感覺好像運作得滿好的,結果沒有,我看美國類似審級部(GAO),其實每年都針對美國CIO提出建言,他們一直認為整個制度是無效的,也就是說,其實美國各部會聯邦政府的CIO其實在推動上並沒有預算的決定權,聯邦政府的預算就算是有CFO在管,CIO其實對財務沒有編列權及執行權,這是2014年「聯邦資訊採購改革法案」內要求CIO必須跟CFO討論。
因此,提到橫向聯繫主管這一件事,其實我們看到美國本身推動這一件事上其實並沒有這樣的一個主管,而是由各部會各自推動。
以Open Data來講,其實美國總統要求GSA去推動,其實在剛開始推動的前幾年效果並不好,後來比較好是因為商務部在他的資訊部門之外,在部長辦公室底下設一個「資訊創新辦公室」,然後在裡面設立CDO,CDO跟CIO其實是分立的,所有政府資料的開放是由這個辦公室在處理,並不是由CIO處理,因此從那時開始其實DOC跟GSA大力合作,現在GSA大部分的資訊都是商務部提供,他們的目標明確——賺錢。
其實我發現到的是,是不是要有一個單一主管部會這一件事我覺得可以再思考看看,因為我看過的政府機關裡面,坦白說目前我知道的大概IT部分做的比較好或電子化政府做得比較好,其實沒有一個資訊專責組織,資訊人力也沒有一條鞭的處理、資訊預算也沒有一條鞭的處理,反而透過這樣的方式,彼此間是很蓬勃發展,因此我也一直在想如果以國內,相對於美國來講,中央政府權力比較大,美國聯邦政府相對來講權力是小的,因此我也一直在想國內是不是要有一個集中式的組織,國發會現在也在處理這一塊,整個政府資訊的設計,我們也在想這一件事。
至於,我知道民間有很多人希望我們也設立所謂的CDO(Chief Data Officer,即資料長),可是我在跟美國部會資訊主管在討論時,其實講到最後他們講了一件事,其實是人的問題,不是法律的問題,法律上說要設都會設,可是有沒有辦法做是人的問題;更好玩的是,美國在2014年通過「聯邦資訊採購改革法案」後,其實很多美國聯邦的CIO都辭職了,包括之前OPM是人事管理局也是資料外洩,後來資訊長最後在聽證會前一天辭職,所以像美國聯邦其實缺了很多CIO,現在美國審計部也在看這個衝擊到底是怎麼樣,因此,我覺得要不要有一個集中的資訊主管機關,這一件事真的是要稍微想一下。
同樣以現階段Open Data來講,如果我們把臺灣跟美國對照的話,其實國發會就資訊的部分有點是OMB跟GSA的結合,因此我們處除了做政策上以外,也有做執行面,包括政府的網路、政府資料開放平台等等,所以我們內部其實也在討論是不是這樣推動跟執行上會比較順,這個部分我們還在討論。這部分跟主改的關係其實沒有大到那麼大,因為其實是運作的問題,我們現在其實也在看其他國家,包括英國,其實英國剛開始有設CIO,但三、四年來CIO已經沒了,取而代之的是CDO,但CDO現在是從缺的,因此現在很多國家也都在思考資訊與政府推動運作的關係有無必要設集中的指揮與管理,尤其像現在有民眾參與的這一塊。
我只是分享一個我看到所謂要不要一個集中主管機關這一塊,國發會現在有在想這一件事,但還沒有做決定,大概是這樣跟各位委員報告,謝謝。
不知道各位委員有還沒有針對今天整個議程及我們的報告事項其他指教部分?
唐鳳:
我花1分鐘分享一下,可以嗎?
簡宏偉:
不行。(笑)
唐鳳:
那花30秒?
簡宏偉:
可以。(笑)
唐鳳:
因為剛剛提到英國及美國的例子,我這一次去法國有見到剛上任的CDO,他們CDO這個位置其實並不是為了做Open Data,因為Open Data本來就由Etalab在管了,所以CDO反過來,是拿民間對data的要求,反過來要部會做出evidence-based policy(基於事實的政策),所以其實比較不是我們剛才簡報可能有想像的。從內往外去推資料,他們已經有別的機制在做,現在的重點放在由外往內的參與。
這樣應該沒有用到30秒吧!(笑)
簡宏偉:
謝謝委員。
其實有時候我們也是很擔心,因為我們一直在這個體系會受限,所以很希望委員可以給我們更多的刺激,讓我們想一下怎麼做會比較好,謝謝。
不知道各位委員還有沒有給我們指教的部分?
唐鳳:
感謝各位朋友,現在收播。
逐字稿
主持人高仙桂:
唐委員、林委員、還有我們座談會的代表委員,大家午安,聖誕夜的隔天就是禮拜五的下午,我們真的是非常謝謝大家來參加我們今天國發會「資料開放行動策略」會議。
我想我們知道最近臺灣政府資料開放在二位委員的協助之下,我們今年達到世界第一名,所以其實成果非常輝煌。中間我覺得某個程度來講,有得助於現在我的手寫資料開放的極致,行政部門在副院長的領導之下push的非常用力,所以其實我們整個政府的資料開放的行動策略計畫其實已經報院,現在已經核定,所謂的二級制就是責成各個部會,就是他也要有他部會自己資料開放的行動策略,所以我們今天會議的主軸是在探討國發會。
但國發會被資管處列為A級單位,因為我們的業務比較不是執行面,資料的開放還是有一些參考及運用價值,相對於內政部、交通部還有一些經濟部等等其他部會等資料被民眾運用的等級是沒那麼高,因為作為統籌國家整體資料開放的這些機關,我們也不能把我們國家發展委員會的資料開放,我們應該是非常嚴肅地對待它。我們今天的會議討論很單純,就是單純就國發會的這個資料開放行動策略來作檢討,請各位委員給我們一些意見。現在會議開始。
報告人:
召集人、各位委員好,國家發展委員會「資料開放行動策略」報告,以下是本次報告。(略,如簡報)
主持人高仙桂:
這是我們資管處同仁研擬的國發會資料開放行動策略,所以我們那時候在匯集的時候,我們希望能夠借重外部的委員可以給部會有一些鞭策的力量,我想外部委員更會從外部的角度可以更客觀來看我們這些資料開放的進程及步驟。
當然計畫裡面也牽涉到各相關處室要開放的內容,所以我們到時候也請內部的同仁提供意見或建議。請唐委員或者是劉委員先給我們指導。
委員劉正千:
主席、各位同仁,首先我要肯定國發會對於資料開放所付出的努力,這個不是只是第一名而已,我相信這個成果是有目共睹,雖然民間有時候會有一些很無厘頭的回應,說什麼「重要的東西都被人家看光光了、有什麼好高興」;但實際上的情形並不是這樣,因為這個工作做起來之後,後面所帶出來的那個時候就不是說在嘴巴上說一說,那是實實在在的成果會出來,這是我首先要肯定。
另外,我也要就這一次會議的務實也要再表達肯定,不僅僅只是說開放什麼,我在書面報告裡找出了不足之處,也誠實地交代,而且擬訂了具體做法,我相信這個是非常務實的、非常好的。
我們這邊提一些我看到的建議,特別是最近這幾個月來我也有親自去內政部資料開放的成果發表會瞭解,我自己也承接一些政府機關資料開放的小計畫。我現在看到一些問題是:大家都響應這個開放,各單位也按照它的權責把資料放出來,但實際在運用上可能還是需要一個位階比較高的來作這個統合、整合的工作。
我舉一個比較技術性的例子:比如內政部有做了一個最小統計單元,這個非常好,因為去標籤化,我們可以看到很細的東西又不會有隱私的問題,另也有單位做了國土使用的調查、土地利用的調查,但這三個資料大家都按照權責開放了以後,我們想要知道這一個最小統計區到底是屬於哪一種土地使用、哪一種土地利用?事實上我沒有辦法用;然而每一個單位都跟我說已經開放了,要自己截取、自己用,但這卻並不是很容易的事,第一個是資料量很大,而且牽涉到一些比較高階空間資訊的處理。所以,同樣都是內政部下的單位,同樣都開放了資料,但缺少了一個更高階的把資料作一個統合,因此這一件事我們準備要讓它留給民間有何運用、有何需求自己整合,或者是我們在開放的源頭也會作一個整合?這一個整合其實我會建議是有必要的,因為我們也必須控管品質,所以這一些資料大家都開放,我們看到幾星級不同的資料,我們是不是能夠有一個機制去控管它的品質?
另外,還有一個是監控它的流向,我們上次有提過,就是哪一些人把這一些資料拿去做了何用途,所以大家都會關心也會問,但我們有一點是單方向的資料開放出去,但要等到它作出一個驚天動地運用的時候我才會知道,或者是還在醞釀的過程中掌控比較少,然而我相信現在透過網路,還是有一些可以追蹤如何用的機制。因此,這種種的考量,與其我們放出去讓它自己開放,或者是我們有一點中央品質控管且監控,此「監控」並不是說我不開放,「監控」是指知道跑到哪裡去的用途,這是第一點。
第二點,有關於與民間合作部分,當然這是今天的重點,但我覺得如果真的要雞蛋裡挑骨頭,就是這到底怎麼跟民間合作還是有一點不是那麼具體。如果具體說一件事是人、事、地、時、物,我們先說人,我們到底要跟民間的誰來合作?目前當然已經有很多社群非常積極參與,也常在資料平台回饋一些意見,但我常開玩笑說那一些是武林高手,那一些是真正懂資料的人,那一些恐怕是眾多老百姓裡面很少很少的人,我們這樣子是不是讓大家有感?所以人還是要再劃分清楚一點,當然上面有記載「國內研究人員社群」,如果我們可以更清楚一點,甚至於我們主動去挖掘哪一些民間的人會感興趣。
其實我們一開始的三大構面一個就有提到是「網路經濟」,網路經濟現在也不光是對岸夯得不得了,有哪一些人國內在做網路經濟會對這一些資料感興趣?也許還沒有趕上資料開放的潮流。所以人、時、地、事、物就要訂里程碑,「地」在網路上比較不需要;但我們可以說預期會有什麼?即我們如何與民間合作可以再更具體一點,又或者國發會不是A級,所以責成各部會,但我們就要監督是不是有很具體合作的策略出來。
第三點,其實我們民眾真正需要的是資訊,現在開放的是資料,資訊與資料間還有一點距離。特別是現在資料開放一些JSON、CSV格式,這一些都不是一般人能夠看得懂的,下載下來還是要有特別的處理,才能轉換成看得懂,所以我們現在資料有分成二個層面,一個是原始資料、一個是可判讀的資料,這已經有一點gap了。但從判讀的資料到他有用的information,這中間需要處理,這處理的部分我們全部準備交給民間作處理。但我始終覺得民間都是有利可圖的事會先做,比較辛苦、需要耗資源的不太容易馬上做,但真正對國際名聲有幫助的可能需要做苦工的事情。
當然科技部也有訂了一些,我看第二次proposal也已經出去了,在這裡頭有沒有把這一些資料發揮大數據的優勢處理起來讓我們變成有用的資訊,能夠變成指導二級單位他們未來朝這一個方向去做的一些例子能夠提出來。
最後一點,現在真的每一年都進步,而且這個進步並不是線性,應該是指數的,進步非常快,從開放一直到現在我們期待有各樣的運用出現了。我這邊有一個建議但不一定確實可行,在我們各個領域裡面常常會辦年會,辦年會的意思是讓這一年來了,不管你是provider、不管你是user,不是湊熱鬧而已,而是把那一年最精彩的呈現出來,就一個位階很高,我們制定這些政策,而且又做data provider這樣的角度來看,是不是也可以構思一下?我相信不用花太多經費,但是應該會達到一個很好promotion的效果,這是我最後一個建議,以上。
主持人高仙桂:
非常謝謝劉委員很寶貴及有建設性的建議,等一下會請資管處來回應。
你有講到與民間合作這一塊,雖然這是國發會的計畫,但其實是for所有的部會,因為我們現在跟開放文化基金會的TODC專案,我們會設立一個平台,也不限於開放文化基金會,所有的社群願意做一個平台跟介接我們,其實我們都很歡迎,所以這部分是有的。
你剛剛也有講到比如說中央控管或者是到底政府要扮演什麼樣的角色,說實在如果政府在做資料開放的時候,他在做資料的一些搜集是要for他的業務,我們現在只是因為各個部會業務執行裡面所搜集的資料開放出去,可是至於user端要怎麼用,其實我們是不知道的,所以目前如果user端運用的話,我們推產業化是在工業局那邊,所以工業局其實有針對這一些政府資料如何運用在產業發展那邊,其實有先設定幾個主軸跟面向,並召集業界,如果企業界有這樣的需求,我們政府就會做這樣的事情。
另外,那時候為什麼希望跟民間介接?我們就是希望民間的平台如果用我們資料的時候,其實有一些整合的時候其實可以同時回饋我們行政部門,讓我們知道。我覺得這個很好的是,其實我們大家在問一件事,資料開放的成果真的很不錯,可是有人會問說那我們資料開放到底對臺灣的產值創造了哪一些?這的確我們目前只能比如說實價登錄的時候,就create很多APP等等,所以我們的確沒有做這方面的搜集或歸納。
不過我覺得最後一個建議其實是很好,我們可以用什麼樣的方式,也可以展現我們資料開放真正對國家經濟社會產生的實際效益,讓大家覺得不只是開放,將來應該就是一個資料革命的世代,所有的東西就是要資料,將來是一個資料驅動發展的體系,相關的建議我們都覺得很好,我們會作為將來要陸續規劃的參考。
不過還有一些技術面的問題,不見得有回答到,資管處要不要回應一下?
資管處陳怡君:
謝謝委員的指教,基本上我還是要說明一下,事實上國發會在整個政府資料開放裡面其實是扮演了二個不同的角色,一個等於是行政院的角色,主要是來統籌規劃整個政府的資料開放。另外一個部分,我們今天要聚焦在於國發會本身當一個資料提供者的時候,必須要關照的一個面向,剛剛劉委員提到,所以我們也可以分二個層次來看,第一個部分是有關於資料後續流通應用的部分,我想我們剛剛副主委有說明,事實上跟經濟部工業局是一個合作的角色,國發會以行政院的立場上來push各部會開放出來,加速高品質的資料開放。經濟部工業局運用開放資料去做一些加值的應用,每一年都會定期舉辦大會,刺激民間資料的活用。
在這同時當中,我們也希望於逐步建構過程中,經濟部工業局也能夠找出臺灣一些資料科學家,促進商業的轉型,因此這部分是我們所期盼,我想這一些成果隨著我們資料大量開放及高品質資料的釋出,我想會越來越有成果。
當然在中間過程當中我們也不斷與民間合作,事實上我們與經濟部工業局合作當中,我們有提出幾個類似三、四個主題,我們一方面傾聽民間的需求,同時政府機關也準備一些資料互相媒合,看看過程當中有哪一些是欠缺的、有哪一些是政府本身就沒有的資料,我想做一個良性的溝通,讓大家促成資料開放的理解。前這部分事實上也已具成效,這部分我們會陸陸續續開主題座談會。
另外想補充的是,今年在副院長及高副主委的指導之下,我們今年以政府資料開放平台為一個Hub,就是我們也開放各民間單位本身有需求或有一定技術能力的話,都可以來跟我們data.gov.tw來作一個介接。
事實上在這個平台上,以行政院的角度來看,我們以這樣子的一個平台除了可以跟民間社群介接之外,我們也聯合地方政府,所以我想我們勇奪第一名之後,我想院長對我們的期許是能夠以行政院為典範,加速地方政府資料的開放,這部分我想我們未來也可以來作一個期待。
至於後續的部分,我想回到國發會本身提供資料者的角度來看,我們也push業務單位,透過今天這一份開放資料的行動策略來達到每一年的目標值,以上補充。
主持人高仙桂:
不太懂你剛剛講的資訊與資料的距離...
委員唐鳳:
我待會可以補充。
主持人高仙桂:
因為我們現在資訊,其實因應數位世代,我們有一個公共政策參與平台,其實我們提供了很多政策面的資訊,那就不太像資料,所以其實對於資訊公開與資料開放,其實政府是齊頭併進。唐委員是不是可以幫我們解釋?
委員唐鳳:
可以,本來有一個次序的,我就先講資訊、資料的部分。
首先非常肯定人口推計資料視覺化,在推動長照上不管是從參與平台來看的人還是從開放資料平台來看的人都起了非常大的作用,這真的是非常好。
但我就想要用「人口推計資料」來當資訊與資料中間的一個例子,因為國發會其實應該是自己有一支程式,或者是請了一個廠商把機器可讀的CSV資料匯進某一支程式裡,那支程式會畫出很漂亮的圖,當然這或許並不是一支程式,是替代役或者是同仁,又或者是您?(笑)
資管處陳怡君:
這是人力資源處的科長自己做的。
委員唐鳳:
對。但我想講的是,資訊到資料或者是我們從機器量測的數據到人們看得懂的資訊切換裡面,如果是透過人力來完成的話,我們就會有一個gap,可能就是剛才劉委員提到的,當下一年資料來的時候可能還是要同一個人再多畫一張,或者是如果它的layout有改變的話,自己又要手動再上色等等,這其實非常困難,也容易造成從網頁上看到的資訊,跟產生這些資訊後面的資料中間有斷裂,也就是可能資料先行,或者資訊因為那個人不知道去哪裡了,所以沒有更新;或者反過來,有人先取得了畫成了給人看的資訊,但後面的資料還沒有放到data.gov.tw上。
當然在理想的狀況是這二個中間有一支程式,那支程式可以開放出來、自動產生,就是這邊只要更新了,那邊也跟著更新,我想有一些是這部分的意思。
回到我本來要講的,這一次在OKFN排名第一,我們在其中的每個項目的授權都直接被標成符合國際開放的定義,這是民間社群跟國發會協力寫出來的條款,非常感謝國發會的開放。
我們有另外一個跟社群協力做出來的是11月24日生效的「行政院及所屬各機關政府資料分類及授權利用收費原則」就是甲乙丙類的原則,因為當時是在vTaiwan這個平台上做出來的,所以請貴會有空回vTaiwan稍微回應一下,因為理論上是要回去回應建議,讓我們能有定案。
另外一個是在剛剛行動方案簡報與這一份裡面都有提到使用國家標準「CNS 29191」的架構,來作個人資料的去識別化與鑑定的過程。我想詢問因為貴會大部分都是統計資料,裡面有任何需要或盤點之後,覺得可能會碰到個資的?所以目前沒有任何一筆資料碰到「CNS 29191」?
資管處陳怡君:
沒有。
委員唐鳳:
但我想提的是說,雖然不管是不是隱私資料,但至少國發會自己操作過的那個過程或自己操作過的格式,如果讓會內的同仁比較瞭解的話,在別的部會提出他的資料集而宣稱他有,或者沒有符合什麼格式的時候,貴會才有能力去做鑑定,不然就是他們說了算。
我舉一個具體的例子,就是在「CNS 29191」第7頁有特別講說在智慧型高速公路計費的應用方式上應該要如何使個資去識別化的方案?我們知道交通部推出ETC的資料集,這個資料集並不是用「CNS 29191」裡面已經有圖例的方式來處理的,而是他們自己走了另外一套,透過拿掉車號欄位的方式來去識別化。
我想說的是,我在data.gov.tw上面看到這一份資料的時候,它有連到資料本身的欄位說明,但並沒有連到「CNS 29191」所要求的,就是它有做了哪一些個資影響的評估或分析欄位,所以我具體建議data.gov.tw應該要加上這個欄位,或者至少在data.gov.tw內部審核的時候,就是進「即將開放資料集審核」的時候,應該要求跟「CNS 29191」針對特定操作,例如像第7頁相符合的一個報告。貴會的同仁如果能夠自己操作過一次,看得懂那個報告的話,我覺得會大幅降低民間對個資外洩的憂慮。我又講太快了...
主持人高仙桂:
不會,大概聽得懂。(笑)
委員唐鳳:
第三點是因為貴會的網站改版,我們在上一次的諮詢會議有提到,幾乎在本來網站版本來連得到的網址,後來都連不到,目前好像還是沒有改善,也就是說,我在做相關資料分析的時候,原有的網址全部是失效的。
我在這裡想要提一個具體的建議,就是在網路上有一個叫「Microformats」的技術,可以讓網頁裡面直接標註網頁的哪一些部分是有哪一些開放資料的來源所組成,所以你就可以有雙向的連結,這樣的話,即使你的網頁改版,你仍然可以知道舊網頁與新網頁其實是在講同一個資料集,可以透過搜尋引擎或其他技術把新舊網頁串接,我覺得用資料作為串接比較好、也比較能夠讓人發現的模式。
下一點是,我很高興在即將開放資料集清單裡面看到所有國立大學、所有地方政府及所有各級法院都被列到分類的下拉式選單裡面了,雖然目前看起來還是空的,但是至少表示說這個平台已經準備好要跟地方政府及各級學校與司法系統介接。我比較好奇的是,因為他們自己沒有類似我們這樣各部會二級資訊制度,所以也不太可能跟我們這樣子在他提出資料的要求先出這樣的一份報告,所以我想詢問的是,具體來講這樣的介接會如何進入這個平台?這個是往地方與其他系統介接的詢問。
倒數第二點,我們在做十二年國教課綱時,在2018年會把資料科學正式納入國中的必修學程與小學的選修學程,我會鼓勵國發會,因為這邊所提到具有重大應用價值的這一些資料都是統計資料,非常適合畫成圖、非常適合當成中小學生的教材,剛才劉委員提到其實我們現在中小學生就是未來的資料科學家,如果讓他們及早透過開放資料,並不是廠商給他們的資料當作教材,我覺得會有非常大的幫助,無論是用補充教材或者是什麼樣的方式去制定。
貴會各單位後續應開放資料集的項數,在這邊有規劃接下來各個不同的期程有一個年度的目標值,我想詢問這個具體的計算方式是什麼?因為目前在PPT裡面沒有看到,謝謝。
主持人高仙桂:
非常謝謝唐委員,真的是充分發揮公私協力的精神,我覺得我們的社群真的是協助我們非常非常地多。我想唐委員裡面有很多是教我們怎麼做,就是告訴我們在判別各個單位去識別化等等,國發會很討人厭,每次都監督人家,反正就做一個彙整的單位要管管人家,所以我們就是在各部會,我想去識別化這一塊知道,以後某一個程度上要做一些要求、自己要試驗,包括本會網站的改版,其實唐委員有告訴我們可以用什麼方式來解決。
至於剛剛也有提到下一個階段是地方政府的資料,等一下就請怡君來說明一下。
另外還有一個年度目標,因為我剛剛也在想八百多項怎麼算出來的,不知道是不是擲筊還是什麼樣的方式算出來(笑),我想就請怡君補充說明。
資管處陳怡君:
謝謝,我想就唐委員剛剛的問題我們一一來作說明。
第一,在授權條款及分類原則的部分,我們真的非常感謝vTaiwan的朋友一起來幫忙,我們會再上vTaiwan回應最新的狀態,不好意思,我們再次感謝。
第二,有關於個資的部分,「CNS 29100」與「CNS 29191」,這一個標準其實經濟部標檢局是在今年6月頒訂,頒訂之後其實蔡政委會希望經濟部標檢局再訂一個控制措施,就是細部如何執行,所以目前這一個控制措施也大致成形,我們也召開了二場的各機關說明會。因為國發會本身的資料其實涉及個資的部分較少,所以目前優先是以財政部來試辦,他們在前二個禮拜,財政部應該也有在蔡政委主持的會議上分享他們試辦的概況,所以接下來會有幾個分工,第一個是由法務部就政府機關依照「CNS 29100」與「CNS 29191」實做之後的控制措施,未來在法院上面對如果有人訴訟的時候,是不是具有免責、必須研擬相關的說帖。
第二個部分我們會就財政部現在這樣子的一個案例,對各機關作教育訓練,也就是讓財政部的案例讓各機關瞭解在實做的過程中可能遇到的問題及標準,當然這部分必須有相關的驗證機關一起加入。
第三個,其實大家很關心ETC,我想ETC是在控制措施頒布前先行了,所以目前的做法雖然沒有完全符合「CNS 29100」,畢竟頒布在後,但後續我們會希望財政部實施過程的SOP定案之後,再請各機關重新作一個調整,不然ETC可能會做很多遍。
第四個,網站改版的部分,我想細節會再跟委員瞭解,我們會持續改善,而且我們現在明年度也有要研議網站的資料如何讓它結構化,便利各機關將來的網站能夠在上稿的時候具有資料結構化的概念,不管是應用或者是Open data上都會越來越便利。
第五個,其他各級的部分,包含學校及地方政府等等,學校目前有上來的原因是因為我們透過主計總處的部分就預算、決算也有一個SOP,要求中央各級機關都必須將預、決算的資料將發布的程序要變成Open Data,而且是以XML格式,學校也在這個涵括的範圍內,所以學校都上來做一個開放,但他們目前優先會做的事情是預算。
地方政府的部分我們可以看到地方政府的發展確實不一,但是有資源的部分、有能力的部分,其實發展得還不錯,我們現在已經核定了介接行動方案,我們在近期就會轉發給各機關的時候,我們同時也會函給各地方政府,請他們參照,參照介接方案裡面所提的相關具體做法,讓地方政府來實做,如果各機關有自介平台,我們目前也已經有跨平台介接API的標準規範,我們會希望地方可以自己就他的部分開放,然後跟我們做Metadata的同步就好,讓大家在同一個平台可以查到不同縣市政府相關的data set。
在十二年國教的部分,其實我們也非常希望,我們看到美國確實從小已經在培養所謂的資料科學家,後續我們再跟委員瞭解一下教育部的窗口,我們未來可能會考慮幾個部分,包含教育部,從教育體系也許從小、大學資訊管理學系都希望將資料科學的學程一起納入,另外一個部分也希望勞動部這邊職訓的課程當中也希望做相關的培訓。
第六個項次的部分,項次大家看到的是國發會本身的項目數,這部分先從院的整體到2020年達成三萬項的時候,我們從各個部會來分A、B、C級,A級的部分我們考量到會有相關雲端的計畫或者是整體像內政、經濟所屬機關業務範圍確實較多,對於民眾來講需求度較高,所以會寫A級,因此我們在A級會有一個項目數的分配。
國發會目前是B級,B級也是民眾非常關切,且會影響整體國家發展,當然這一個項目數我們只能說先以大概的背景資料來作分配,希望各個部會,包含國發會本身的時候以這樣的原則來努力,法務部今年已經突破了原來未來預定需要達成的目標,所以我想各個單位有了目標才會往前進,目標是一個原則,並不是一個非常死的標準,我們會希望透過各個部會、各個單位共同努力,讓大家一起來達成上萬筆,謝謝。
主持人高仙桂:
剛剛有講到一件事,就是資訊及資料,大部分在行政部門裡面的包括我們這一個會議室的同仁,大概只有資管處比較知道什麼是「資料」,大部分其他都只提供資訊,所以其實我覺得我們現在要做一件很重要的事情,比如人力處提供的一些,這是要呈現資料的事情。
所以我剛剛問資管處,剛剛唐委員講的聽得懂不懂,他說還好、速度還可以,因為我本人就是屬於資訊的那一塊,我就不屬於資料那一塊,其實很多行政部門同仁也是這樣,所以我們現在其實要做一件非常重要的事情,要讓懂資訊的人其實也懂資料,也許技術面不知道,但將來要因應資料革命的世代,他還是要知道資訊改成資料,即讓民眾可以順利取得的重要性。
我覺得我們在做二級制的時候,某個程度上要叫教育訓練,就是讓行政團隊一些同仁的觀念可以有一些反轉,並同時瞭解。我想我們有些處室的同仁很多名詞也許都第一次聽到,對他們來說有一點陌生,但我想慢慢透過這一些會議就慢慢瞭解及熟悉。
怡君也有提到人口推計那一塊,人力處要不要說明一下?
人力處:
很謝謝大家對人口推計視覺化圖像的肯定,其實因為那時候這個圖做出來的時候,那個idea一開始是我們在做人口推計的時候,我們常需要利用各國人口統計資料去作分析時,會去瀏覽各國的統計資料,看看各國統計資料,其中我們發現日本或聯合國都有做金字塔動態的圖,我們想說如果我們人口推計做出來之後,我們也可以在網頁上show一個未來人口改變的金字塔圖。
其實我們在四、五年前做那一次人口推計時,首先是有一個人口推計的動態圖放在網站上,二年前在更新人口資料的時候,想說可以再修正一下,可以讓那個圖更視覺化,因為視覺化的資料是近二年的事。
那時我們又有參考教育部或者是主計總處互動式的圖形資料,他們是用系統跑出來的,我們有考慮到是不是也要做一個軟體的系統去跑這樣的東西,可是我們覺得可能不是那麼直接format的圖像,我們想說自己先來做做看,如果這一種圖形如果比較穩定,每一年都這樣的圖形,可能以後就會考慮跟廠商合作做系統,謝謝。
主持人高仙桂:
還好資管處跟人力處同一個會,所以以後資訊要改成資料,大概資管處要協助其他的業務部門。
這樣二位委員還有沒有什麼意見?我們會裡有沒有其他的委員對於資管處的計畫有什麼意見或建議?
委員唐鳳:
關於推計,我補一句話。即使它不是軟體系統產生的,這個動畫後面應該是有一個我們叫原始格式的東西,不管是用PPT或者是其他的工具,如果那個可以釋出的話,民間的社群就可以主動地把它變成資訊工具。
我會想提出這個的主要原因,是因為我們現在其實也有分區的人口推計的相關資料,如果只是這張圖的話,其實沒有辦法把它變成分區資料,所以我才會對這個提出需求,謝謝。
資管處陳怡君:
我補充一下,其實在人口推計的資料,我特別把它舉出來當一個案例的原因是,這除了視覺化效果做得非常好之外,一開始人口推計的原始資料我們其實是open data的data set了,從這一個當中來做一個舉例,這樣子看到的成果是一個資訊,但每一年的數字就是data,這個部分在人力處都已經開放出來,所以我們當時在社群po文的時候,我們也有特別把data set的連結也有show出來,人力處也有包含未來十年就業推估等等,我們希望給各個單位一起來參考,其實各單位現在做了很多的工作,對於民眾或者是其他的政府機關市政都幫助非常地大,我們整理綜整的結果,但我們產生這個分析結果背後的資料,我們可以同步開放出來,這一個圖像化的工具,未來不一定是我們自己的同仁來做,其實社群就可以發揮它更大的效應。
我們舉一個例子,比如像登革熱在前一陣子的疫情有一點嚴重的時候,在疾管署與台南市政府都把登革熱的地點及人數等等的資料開放出來,他只開放這一些數字,民間幫他做成了地圖,從地圖當中可以看蔓延的程度,移情是擴大或者是慢慢縮小,也許並不完全劃上等號,但其實是一個可以參考的資料。
像塵爆發生時,台北市政府是把受傷者的名單與就醫醫院PDF檔po出來,民間把PDF資料格式化,格式化之後幫他做了受傷的患者就診醫院的地圖,同時透過社群的力量呼籲民眾在這一段時間如果要就醫的話,盡量避開現在在做這一些急診的醫院,避免佔用他的醫療資源,這其實是政府與民間共同協作很好的一些案例,所以我們也希望各個單位也許看到這個數字會覺得很高,但我們仔細來看我們的業務,現行大家也許不覺得它可能是一個非常有幫助的資料,但其實副院長也常常講一句話「資料是需要有緣人」,今天我們把資料開放出來,剛剛委員其實有希望我們進一步能夠跟民間作應用上連結時,其實這部分可以幫我們做更大發揮的效益。
剛剛劉委員有提到資料與資訊的部分,其實我們在推資料開放的時候,我們看到整個生態環境可能會分成二大塊,但實際上可能會有三個角色,一個是政府端把資料開放出來,接下來是需求端或應用端,可能會包含開放者跟民眾,就像大家都所談的,資訊大家都容易看得懂、資料不容易看得懂,而且我們資料也希望以開放的格式,反而媒體記者跟我說其實開放資料完全看不懂,因此中間需要一個轉換中介者或開放者,目前工業局有研擬一些一系列推廣的措施,比如包含補助,希望開放者裡面有一些小型的SOHO族之外,能夠輔導一些中小企業或產業,真正發展成資料分析產業的形成,可能會包含資料整理、資料分析,甚至包含顧問,希望未來慢慢衍生資料生態產業的時候,真正組成資料經濟,以上。
主持人高仙桂:
其實我們人口推計事實上是有一個非常厚的一本書之資料開放,因為我看到這個圖的時候,我不可能在另外一個地方再找那厚厚的一本書,我想唐委員的意思是某個程度上在某個地方要有一個連結,可能就會知道,不可能在別的地方再做搜集,謝謝。
各個部會有沒有意見?我們回到第19頁,檔案被列為A級有沒有意見?有的被列為B級有沒有要抗議要升級的?(笑)列為不同等級,資料要開放的數目都不太一樣,所以我就讓檔案局有申覆的機會。
檔案局:
謝謝主席,的確我們局裡頭,沒有錯,檔案裡面真的蘊含了很多知識待開發,不過我們局裡頭在去年已經有open data共十五項了,我們預計105年度有二項,所以我們局裡頭要成為A級真的是力有未逮(笑),想要做也做不來,因為落差太大了,從我剛剛報告的,十七項可能C級都很勉強,而且照理來講,我們成長之後是不是會有一個瓶頸?可是我們這樣子看起來...
主持人高仙桂:
是不是一直往上衝這樣子...
檔案局:
對,我剛剛還在跟黃主任講,你們家不錯,是在D,而且都是一直線。(笑)
我們局裡頭是不是有可能到C?我覺得B都已經很勉強了...
主持人高仙桂:
說明一下為什麼要把檔案局放在A,一定有它的道理,說明一下?我們不會在外人面前吵很久,我們會事後再來協調。
資管處陳怡君:
其實對於數量的分配,說真的我們真的很難分,其實我們剛剛談到先從各個部會的層級來分A、B、C的時候,國發會是在B級,所以我們在109年(2020年)必須達到八百七,要達到八百七的話,就必須各個單位包含所屬機關共同努力,所以我們也很辛苦,也非常感謝各個單位的配合,我們已經有先做過初步的排列,在105年度我們大家可以達成的一個目標之後,我們接下來只能說我們再到109年需要開發到這麼多的時候,各單位的業務量來做一個建議跟分配。
檔管局當時列在A局的考量,其實我們在分配的時候,除了考量業務屬性外還包含一個機關組織架構的大小,確實檔管局是一個三級機關,其實應該講我們這個資料集是用「項」,是一個data set的理念,並不是「資料庫」,因此這一個部分我想也許檔管局可以試著再盤點看看是不是有data set的產出,其實像人力處來講,人口推計的資料可能也有包含未來十年就業或者是有分不同屬性等等,其實不同資料屬性的分類對於民眾應用來講的時候也是滿不錯的,像警察局有一些資料的時候,民眾就會建議可不可以By地區或者是By縣市政府來做一個調整,所以我想這部分會希望,而且檔管局目前的系統相較其他本會的業務單位來講也比較完整一點,因此我們希望大家可以共同努力,試著做這樣的建議,以上。
主持人高仙桂:
現在A級對不對?A級就一個單位,比如105年是六十二、106年是九十四,這是純量概念,對不對?所以九十四扣除六十二就必須要有三十二個。B級機關有八個,B級機關從二十七至三十八。
資管處陳怡君:
不過這個是各個,並不是合計,並不是合計三十八。
主持人高仙桂:
是每一個都要三十八?
資管處陳怡君:
對。所以變成三十八要乘以八,因為我們有八個業務處。
主持人高仙桂:
可是D級機關因為是純量,所以從105年以後就不用再成長的意思嗎?
資管處陳怡君:
這個部分確實也希望D級機關如果能夠告訴我們可以增加多少,那當然更好,其實去看過秘書室、人事室、政風室及主計室,雖然主計室每一年都會發布預算,但預算是一個data set,比如101年、102年及103年是不同的資源,不建議分列,因為當時院不希望切割資料集,因此預算來講就會只決算一個,因此我們也真的看過這一些單位業務的時候,也考量到他們業務的範疇,當然如果願意一起告訴我們能夠增加多少更好。
委員唐鳳:
其實我今天有帶來明年1月數位時代的開放政府雜誌專題... 裡面會講到從數據開始,像剛剛的人口推計變成人看得懂的資料,也有與我們從文字開始,例如像今天的會議紀錄或者是檔案管理局,我相信會有很多文字為主的資料,那其實也可以透過結構化來變成資料,所以資料有二個不同的來源,一個是從數字來的,一個是從文字來的。
從文字來的部分,我剛剛上了檔案管理局的電子檔案保存實驗室的網站其實有非常非常多的文字資料,只是目前可能是在一些聲音檔、影像檔或紙本,我想說的是:只要給予這一些資料一個結構,其實可以透過批次轉換的方式,在裡面本來是一個檔案的就會變成一筆資料,可能一下就會上千個資料集了。(笑)
檔案局:
謝謝指點。其實我剛剛有想說怎麼樣去把它更細緻化,並不是走database的方向,有,我有在想。
資管處陳怡君:
特別補充,這個是data set,並不是database。
主持人高仙桂:
所以各個處室對於這樣子資管處責成大家要達成的目標,大家有沒有意見?如果對這個計畫有其他的意見可以再提出來。
委員劉正千:
剛剛有聽到登革熱的例子,我是從疫區來的,我們事實上就是因為這一次的事情,所以我剛剛所提的那一個資料、資訊,我想再作一點補充。
我們就以登革熱來講,這一次真的做得很好,資料開放,所以民眾做了疫情擴散地圖,我們接著就會問到底哪裡變得更嚴重,也就是我該去哪裡、不該去哪裡,這樣就是一個資訊,並不是單純可以從資料看得出來,我們只是大概看到有擴散、減少,但事實上是沿著海安路一路往南走,那時候一開始看不出來,所以我們要把已經知道的原理放進來,然後把資料一起作處理,所以把資料變成資訊中要做一些處理,這處理就是要有資料科學家,我們希望未來能夠處理更多有用的資訊,像民眾要知道去哪裡,包括台南市政府要知道去哪裡噴藥,他們事實上沒有這一個資訊,所以我要抱怨一下,幾乎是亂噴,我家被噴了二次,用到半夜四點多貼了一大堆膠帶。就是因為他們沒有這個資訊,所以我們很積極想要進來做,也發現我們這一次開放的資料很寶貴,因為全世界都很關注這一些資料,像2004年阿根廷爆發,他們只有四百多個案例,我們有二萬個案例,但不知道該高興還是該難過,因為台南市政府的無作為,所以前面那一段資料完全是自然擴散了,那是非常好的研究例子。
我們要研究的是它與各種因素的關係,所以才問到與土地使用,是不是在市場一些商業利用的地方會擴散比較嚴重,或者是跟下水道系統有關,我們就想要探討之間關係的時候,就發現有些資料沒有那麼公開,我上次跟內政部討論過,內政部同仁說因為這個是地方政府自己建置的資料,所以沒辦法完全公開,因此我們變成還要再去張羅,這就是一個例子,也就是我們可以把這一些資料做一個加值處理,我們就可以得到有用的資訊,然後從這一些資訊裡面就可以學知識,真正會改善我們生活的是知識。
我們現在是在期待明年,萬一什麼地方先出來的話,我們可以給台南市政府比較明確的建議該怎麼去處置,這樣子我們就可以避免後面的事情發生;當然我們還沒有到那一步,但這的確是我們可以努力的方向,我相信也會是資料開放一個具體的成果,讓民眾感受到有做這一件事,我們國家真的是有智慧在治理國家,因此我用這一個例子來說明資料、資訊至知識,我們如果能夠到那個境界就最好不過了。
委員唐鳳:
幫劉老師問一個問題,data.gov.tw剛剛有提到要跟各級地方政府,如果有人申請地方政府的資料要串接,我想請問的是,因為其實data.gov.tw上面除了資料描述以外,還有關於資料討論、資料應用及資料要求部分。
我想請教的是,像劉老師要向地方政府要資料的話,地方政府的回應及對於資料討論這一些資料是否也在串接的標的裡面?還是其實只有描述資料是串接的?
資管處陳怡君:
我作個補充,我們原先做的跨平台這一些規範是只有做到Metadata的介接,但是我們現在跟內政部正在研議,就民眾有意見回應的時候,這一個回應的提出與機關的回覆二邊能不能同步,我們跟內政部正在研究這一個部分,我們也希望如果與內政部研究出來的案例出來之後,我們一樣可以變成一個Web API的方式與其他平台來介接。
另外剛剛老師談到的資訊、資料,其實以登革熱案例來看的話,開放資料只是一個前端,後端其實我們談到的是第五階段電子化政府著重在所謂的資料治理,也就是我們剛剛談到很多政府的施政作為,我們如何用擁有的這一些資料來作分析、政策的評析,除了民間看到APP的應用,其實屬於服務的提供,其實還有一大塊是政府施政的治理,所以我們第五階段電子化的政府與其他部會及地方政府要來研究及推動的就是「資料治理」。
主持人高仙桂:
我想數據如何做,我想大數據其實現在很夯,不管是政府部門或者是民間企業都做研究,怎麼樣有資料,接著怎麼樣如何應用,政府只會for他自己的施政目標,我覺得要結合民間社群這一塊恐怕是很重要的,將來資料怎麼樣變成資訊,我覺得民間社團可能可以扮演協助政府非常重要的力量。
在副院長的領導之下,其實我們開始有大數據技術指導小組,幫忙各部會意識到怎麼樣可以把這個資料變成有用的資訊。
如果大家沒有其他意見或建議的話,我們就謝謝二位委員提供給我們很多寶貴的意見,也先預祝大家新年快樂,因為過年前應該沒有什麼機會再看到大家。謝謝!
會前資料
主席致詞
高召集人仙桂:
報告:諮詢小組成立及其運作方式
高召集人仙桂:
報告:本會資料開放現況說明
資管處報告:
陳美蓉(檔管):
簡宏偉:
戴豪君:
高召集人仙桂:
報告:本會資料開放盤點結果及未來推動策略
高召集人仙桂:
張惠娟(綜規):
吳明蕙(經發):
楊淑瓊(社發):
林德生(產發):
張恒裕(人發):
毛振泰(國土):
何全德(管考):
簡宏偉(資管):
黃鴻文(主計):
羅清榮(法協):
高召集人仙桂:
陳美蓉(檔管):
討論:盤點結果不開放項目及擬申請下架之資料集
臨時動議
劉正千:
唐鳳:
簡宏偉(資管):
陳信宏:
戴豪君:
何全德(管考):
高召集人仙桂:
簡宏偉:
高召集人仙桂:
會後確認事項