「國家教育研究院雙語詞彙、學術名詞暨辭書資訊網」資料庫下載規劃
2015-03-19 更新
Location: 國家教育研究院三峽院區
Participants: 林慶隆主任、au
- 2014-12 提到的定期 .sql 匯出功能已請廠商報價,預計大約五萬左右,應該還不需要群募。 XD
- 國教院原本就有開放資料集用的資料夾(wd.naer.edu.tw/open/):
- http://wd.naer.edu.tw/open/naerprp.csv
- 考量到國發會現已允許登錄 Excel 及 SQL 資料集(2015-01-17),建議使用 data.gov.tw 平台登錄。
- Daily DB Dump 放置於 /open/ 下時,仍可設置流量限制或分流。
- 待 TODC 或 SheetHub 等外部映射啟動後,應推薦社群使用外部映射作為資料來源。
Meeting minutes: #date-2014-12-09
Location: 國家教育研究院編譯發展中心台北院區
摘要
此專案的最終目標為:名詞翻譯一致化。
中心持開放態度,不打算限制資料的使用、修改、散布。以下的「資料授權」與「db 下載申請辦法」目的僅在於讓開發者了解其使用、修改、散布的權利,避免濫用(大量下載破壞伺服器等等),並且協助相關單位計算資料使用的績效。
「資料授權」與「db 下載申請辦法」將對所有的使用者一視同仁。(不因為國籍、使用目的等有不同的規範)
DB Dump
- 編譯發展中心擬定「資料授權」與「db 下載申請辦法」
- 「資料授權」待中心人員擬定。
- 「db 下載申請辦法」已確定會有以下幾個欄位
- 姓名 / 單位
- Email
- access ip
- 使用目的
- 編譯發展中心聯絡廠商,請廠商在「下載專區」之下,區分為「一般使用者」(即原 excel 下載)與 「開發者專區」
- 請廠商在「開發者專區」加上「db 下載申請辦法」並附上線上申請表格 (google form 可)
- 請廠商設定 daily db dump ,在開發者專區提供固定的下載路徑,並限制連線 IP。
- 當有開發者申請時,編譯發展中心聯絡外包廠商,請廠商設定允許下載的 IP. (或自動化)
- 如果上述步驟,廠商不便協助修改。中心打算提供 ssh login 權限給 g0v 特定人員,由 g0v 人員協助設定 daily db dump。(isacl 建議:如對遠端操作有疑慮,可接受限制在台北院區現場操作,操作時有中心的人員在場擔保。)
詞彙 Feedback
現有的詞彙 feedback 機制為 forum 。使用者在網站上登入後,直接留言給予建議。使用率非常低。
當 g0v 下載了 db dump 後, 也可自行製作 feedback 介面來蒐集 feedback. 再把資料彙整給中心。
(中心需經由一定的程序後才正式發佈更新)
API 化後,可能的發展
- 製作 browser extension, 在瀏覽網站時,自動翻譯學術名詞
Others
網站上的幾個名詞解釋:
- 學術名詞
- 雙語詞彙
- 機關建議詞彙 - 由各機關建議,但未經完整的審核校對程序
- 公告詞彙 - 已經過完整程序後發佈