3 月萌典松: moed9ct

最後編輯:2015-06-07 建立:2015-02-25 歷史紀錄

 

AUDREY T時間:3/28 11am-9pm(歡迎遲到早退)

地點:Bookshow.tw 基隆路一段 141 號 6 樓之 7(捷運市政府站步行三分鐘)

名額:35 人(報名頁面

內容:比照前八次萌典松 ,採「併松」模式舉行,歡迎 g0v 各大小專案加參加。

費用:採量力而捐、自由贊助方式。如有剩餘,捐給下次黑客松。

活動守則:https://g0v.io/coc

直播網址:https://www.youtube.com/watch?v=_YLKZFLuBfs

    venev影片敘述中有各提案、短講的時間碼目錄,歡迎點閱

MICHAEL_註:今天聯合黑客松的 第二次新聞松 實況轉播網址/https://www.youtube.com/watch?v=vQd0gicscKM

 

AUDREY T流程:

  • 11:30 專案、想法簡報介紹
  • 12:00 自介、午餐、分組意見交流
  • 13:30 十五分鐘短講
  • 14:30 hack, eat, hack
  • 17:00 第一次成果報告
  • 17:30 hack, eat, hack
  • 19:30 第二次成果報告

 

萌典相關開發項目

  • 新臺語運動
    • LIZ L坑主報名時已額滿,所以排了其他事情,陷入後來有票也難以回頭的窘境。文字報告如下:
      • 專案目的:做一個給鄉民用的學台語、查台語網站,前端讓大家好用好查,背後由具正規化台語文書寫能力團隊維護。
        • hackpad: https://g0v.hackpad.com/moed7ct-taigi-neologism?r=0#
        • moqup:https://moqups.com/liz462/IMYHBVi5
        • github:https://github.com/g0v/taigi-neologism
      • 目前進度:前端雛形已由pomin5完成,並於不得罷免黑客松報告;後端目前薛丞宏一邊服役一邊寫。
      • 下一步:前後端大約完成後:
        • 第一階段會請具台語文能力的團隊測試、補資料;
        • 第二階段請鄉民盡量發問、盡量幫忙回答,以充實資料庫並改善網站;
        • 第三階段想辦法宣傳及推廣。
  • AUDREY T阿美語萌典
  • 討論上述兩個專案在牛津寰語計畫的介紹方式
    • 這是 OUP 想彙集各地 crowd dictionary 的工作一覽,所以主要是看看九月時怎麼介紹,例如把專案名稱和簡介翻成英語之類的。
  • 吳守禮《國臺對照活用辭典》資料處理資源蒐集
    • Photo & PDF: http://olddoc.tmu.edu.tw/chiaushin/dic-2.htm
    • 用字彙編及字型: http://xiaoxue.iis.sinica.edu.tw/download/WSL_TPS_Huibian.htm
    • 阿石工作區: https://github.com/g0v/koktai/tree/master/a-tsioh_sandbox
    • 倚天印表機控制碼表: https://tw.knowledge.yahoo.com/question/question?qid=1205072104611
    • 倚天使用手冊第六章印表控制 掃描圖檔 http://kcwu.csie.org/~kcwu/tmp/eten-ch6-print.zip
    • 目前 a-tsioh 工作狀態預覽 https://g0v.github.io/koktai/
    • yapcheahshen 提供 https://github.com/g0v/koktai/tree/master/big5-mapping
      • Big5 造字區對應表(如果有的話)正在連絡中
  • 國家教育研究院教材編制、雙語詞彙索引典分詞系統討論。會有三位國教院的朋友加入:
    • 柯華葳 院長
    • 王立心 主任 (綜合規劃室)
    • 邵婉卿 助理研究員 (編譯發展中心)
  • LIN W大BKRC 中俄/俄中字典: http://bkrs.info
    • AUDREY Thttps://github.com/ukoloff/bkrs

*

  • https://itunes.apple.com/ru/app/e-han-ci-dian-russko-kitajskij/id598999128?mt=8
  • moedict.tw 是非營利、完全開放程式碼的詞典網站,目前已有中德/法/英翻譯。如果想要使用,想請問是否有公眾授權條款(如 Creative Commons),或是希望如何標示來源(如網址、連結等)
  • Kage Font Generator
    • IDS 直接生成 SVG 的 React Component 部件
      • 參考資料:部件檢索辭典 http://blog.xuite.net/fg_wang/twblog/309627490
    • https://github.com/ksanaforge/kzy Font Generator 使用 http://fonts.jp/kage/ ,但目前只能喂 Glyphwiki 格式( 部件代碼及字框)。
    • YAP STODO 1: 從IDS算出適當的字框,即可完全取代醜醜的剎那單線體。
      • AUDREY TPrior art: 丞宏的 han3_ji7_tsoo1_kian3 (漢字組建專案)
      • YAP Shttps://github.com/g0v/idskage demo 從IDS產生kage 的輸入格式
    • TODO 2: Web 版、中文介面的字框調整程式。自由上傳缺字的IDS及字框參數。server side 儲存IDS及比例參數,缺字以IDS交換及搜尋,client side 如果 render之前找不到字框參數,則自動以idskage產生。
      Ting Zhong Loou請問 IDS 是什麼? 好像沒有給參考網址
      Yap Cheah Shenhttp://en.wikipedia.org/wiki/Chinese_character_description_languages
    • kage online demo http://fonts.jp/kage/demo.html
    • https://github.com/ksanaforge/kzy/blob/master/components/kzy-glyphwiki/gen.js 這段程式抓glyphwiki 的dump,轉換成 json。
    • CAASI Hdump 裡面一個字大概長這樣:
  • u26c29 | u26c29 | 99:0:0:0:3:200:162:u8279-03$1:12:13:44:63:44:92$1:2:2:44:63:156:63$1:22:23:156:63:156:92$1:2:2:44:92:156:92$1:0:0:30:114:170:114$1:0:0:18:137:182:137$7:32:7:100ː63:100ː110:100ː175:14:185$2:7:0:104:137:126:170:175:179
    • 其中 $ 是分隔符號,所以可以看成:
  • 99:0:0:0:3:200:162:u8279-03
  • 1:12:13:44:63:44:92
  • 1:2:2:44:63:156:63
  • 1:22:23:156:63:156:92
  • 1:2:2:44:92:156:92
  • 1:0:0:30:114:170:114
  • 1:0:0:18:137:182:137
  • 7:32:7:100ː63:100ː110:100ː175:14:185
  • 2:7:0:104:137:126:170:175:179
    • 99 開頭表示引用別的字,以「99:0:0:0:3:200:162:u8279-03」為例,格式:開頭兩個0,0用途未知,0,3為左上角x,y座標,200,162為右下角x,y座標。最後u8279-03為部件id (艹的第03號異體)。
    • YAP Sclient side 可以從這個資料找到可以讓使用者微調的部件。
    • 非99開頭是筆劃類型及參數點,直接送給kage就好。
    caasi Huang[冒號]100[冒號] 在 hackpad 變成一百分,不知道該怎麼解
    Audrey TangU+002D0 ː Triangular colon
    caasi Huang感謝 ː-)
    • CAASI H範例可以看這 https://github.com/ksanaforge/kzy/blob/master/components/kzy-kage/sample.js

 

    Audrey Tang請自由新增相關連結

 

 

短講

 

 

    AUDREY T併松

    Audrey Tang歡迎把想做的專案/計畫列在這裡!

 

曼 奧超農域

http://hack.g0v.tw/agriculture

 

CHE L公有地大行動

idea pool: 妄想土地/自己的土地自己用

 

AUDREY T陽光/開放政商/關係松

CHE LSunlighthon / GuanXithon

AUDREY Thttp://beta.hackfoldr.org/gxv/

 

 

JOHNSON Lppt 政治承諾追蹤網

Political Promise Tracker

 

LILIAN K東海大學企管系EMBA碩士論文提案

AUDREY TEMBA

 

藏傳大藏經 on GitHub

https://github.com/karmapa/adarsha2014

YAP S發表會新聞稿(英文) 中文 影片(西藏語)

 

LI-HSIN W國民小學國語數位教科書提案

    Audrey Tang轉移到 https://g0v.hackpad.com/VUz4BYQTrOh
  • AUDREY TGoogle Drive: http://goo.gl/jcrO6Z
  • ePub3 on Android: GitDen reader、on iOS/OS X: iBooks、on PC: Readium@Chrome
    • Tested with: http://goo.gl/TdLZ8J
    • ePub3 Export test: https://isp.moe.edu.tw/resources/resources_festival_list.jsp
      • 目前似乎無法生成 ePub3
      • 由 NAER 與維護者連絡,看是否能把 react-odp 接上去
  • 部件拆分原則:
    • 以不重疊的部件為準
    • 拆出來的單部件都要是國字(難字如「舛」是 OK 的)
      • 定義以簡編本裡有的為主
    • 筆順以整字為主,拆出來之後不需要筆順
  • 同義字
    • 放在 notes 裡
    • 句型用 CKIP 的樹(不顯示給使用者),Nhaa Nab 可置換,其他 particle 保留
      • 這就是照樣造句的 template
  • 仿作
    • 數位教科書可以做 parse tree
    • 學生自己寫時,給出 parse tree 裡不同的部份
      • 如果都一樣則視為照樣造句成功
      • 不然,以紅色標示不同處,但不判定為錯誤與否
  • 量詞
    • 用 http://120.127.233.228/Concordancer/ 選 Nf,找最近的名詞(Nab),做成文字雲
      • Family resemblance, 不再取 ontological abstraction
  • 疊詞
    • 萌典 regex 搜尋:
      • (.)\1(.)\2
      • (.)(.)\1\2
  • 狀聲詞
    • 用 https://www.moedict.tw/?q="的聲音" 來找。
  • 自動出題,由老師篩選 false negatives
    • 因果題
  • LI-HSIN W詢問「教育部數位教學資源入口網」(isp.moe.edu.tw/)有關「將勾選項目轉製成電子書」的功能。網站管理員回應:目前教育ISP僅提供資源轉製為電子書目錄,並無提供將各別資源內容轉成互動式瀏覽電子書服務。
  • 規劃將完成的電子書公開於教育部的「教育雲」(cloud.edu.tw)及國家教育研究院網站。
  • BOBBY標準上需要注意,IDPF與W3C以及IMS正在製作EDUPUB規範。製作教科書時,盡量希望能與國際標準接軌。這裏提供一些資料:
  • 另外注音符號在Web上的呈現最近有些擱淺,是否能給予協助?(Test Cases
  • LI-HSIN W暫時完成「讀學悠遊第1單元_動物昆蟲篇12課」Libre Office Impress ODP格式檔(2015.

5.23),在Google Drive: https://goo.gl/Xrdr0o

YAP SMOEDICT 引用書目分析

該書被引用次數越多,泡泡越大。

Online Demo(d3.js) Github

 

YAP S部件拼字遊戲 (中文scrabble)

  • AUDREY T延伸萌典部件方塊的想法,但不是即時的
    • 實驗:只拆第一層,不遞迴拆進部件裡
      • Or even whole-words only
  • 多人線上遊戲。
  • 系統隨機給出5~8個部件,高頻部件分數低,罕用部件分數高。
  • YAP S玩家試圖用這些部件,組出最多的字,部件可重覆使用。
  • 組成部件的分數加總即為該字分數。
  • 即時顯示每位玩家目前成功組出的字數,以增加刺激感。
  • 在限定時間內,總分最高者勝利。
  • 可限定字集,如小國生常用字,中日韓 800共用漢字等。
  • 為防止使用者用亂猜的方法,系統用某些方式(詢問字音或字義)來確認,答錯者扣秒數。
  • FB 登入,記錄成績,頒發漢字能力檢定證書。

例:以「木」「口」,可組出「㕲㗊吅吕呆品啉喿噪杏林森楍榀槑橾」。

從部件產生可能的字,程式碼及講解

 

MOON C授權小幫手

g0v開放社群授權小幫手,現有的方案不夠直覺,希望能做成更簡單的精靈

目標使用者 : 幫助設計師快速找到適合的授權方式!

  • 已完成樹狀圖繪製
  • Mockup製作中

https://g0v.hackpad.com/Cp3CFHqbLcx

 

    VENEV場務

VENEV午餐統計:素食 x3 葷食 x29

    venev已訂餐

 

    VENEV漂書 / DVD

VENEV《這不是太陽花學運》

  • 作者之一羅慧雯因參考、引用 g0v 社群產出( hackpad 媒體採訪共筆、g0v.tw/about、零時政府的第一年、向日葵體驗營⋯⋯等),贈書給社群致謝,托 venev 轉交,歡迎自由取閱
    Ting Zhong Loou本書Lilian 先借走了

《選舉追緝令 1998 / BULWORTH

  • 台北市長選舉期間,simon(還是誰)提到選舉文化跟這部電影有 deja vu 感,推薦觀賞
  • nchild 千方百計(?)買到 DVD -> 傳給 BP venev 看完 -> 歡迎接手繼續看
  • warning: 不是 A 級大製作,影片諧謔風格靠北