3du Reclaiming our Language @ g0v summit 2014

more info: g0v summit 2014 hackfoldr

現場直播網址 (live url) http://youtu.be/-Fo0jC0u5o8

錄影紀錄網址 (video url)

照片紀錄網址 (photos url)

↓文字轉播、線上討論↓

主持人引言:

大家好,我是唐鳳,很感謝大家一早來參加 3du 議程。

就像零時政府把「gov」換成「g0v」一樣,葉平在去年一月 g0v 黑客松時把「edu」換成「3du」,

就是希望能把教育用的基礎資料,也就是台灣所有人的各種母語,都用開放的 API 釋放出來。

我當時跳坑建議了「萌典」這個名字,就一直幫忙維護到現在。

「萌」這個字有人民的意思,也有發芽的意思,當然現在也有可愛的意思。

萌典希望讓人民一起參與,紀錄語言的演化,長出各式各樣可愛的應用,

這也就是今天 3du 議程的主題。

今天的議程分成上下兩段,第一段是 10:00 到 11:00,由教育部負責臺灣閩南語事務的林佳怡(Liz Lin)開場,接著由臺灣大學語言所的謝舒凱、馬基石(a-tsioh)介紹開放語料。

之後休息半小時到 11:30,再開始下半場。

教育部《臺灣閩南語常用詞辭典》資料庫釋出歷程 (Liz)

主持人引言:

我第一次寫信跟教育部要臺語資料的時候,就是由我們講者林佳怡 Liz Lin 回覆的。Liz 不但對 CC 授權非常瞭解,而且很積極、很有彈性,不像一般我們印象中「不做不錯」的公家人員。當時我很驚訝說,原來教育部有這麼有 sense 的公務員,後來 Liz 回信就再次強調自己不是公務員,是派遣人員... XD

後來臺語萌典在 OSDC 發表時,我有說我細漢的時陣,我阿嬤是鹿港人,佮我攏是講河洛話,但是後來佇學校讀冊學ㄅㄆㄇㄈ,小時候也有試過用來拼臺語,但是當時沒有教漢字怎麼寫,後來就愈來愈不會講了。所以真的很感謝 Liz 和教育部的同仁持續推廣,讓我能找回自己的母語。

那就讓我們掌聲歡迎 Liz 帶來的演講。

簡報:https://drive.google.com/file/d/0B_erUWNn_L9WZTg2Z0FOSnIwck0/view

著作權盤點 (國語辭典編纂歷時很長,著作權法對於權利歸屬的解釋不同)

重編國語辭典 CC 釋出「指日可待」

開放語料運動 (謝舒凱 + a-tsioh)

主持人引言:

感謝 Liz 的演講。因為時間的關係,之後下半場的 panel 會再 take 大家的問題。

參加萌典計劃最開心的事,就是可以交到全世界的朋友。臺語萌典上線沒多久,

我們就收到遠在法國的 a-tsioh(阿石)的訊息說,「我無孤單!」原來他也用

教育部的 CC 資料,真的寫出了 Android 上用注音符號輸入臺語的輸入法,而且

也幫忙把英文、法文、德文的對照加到萌典裡了。

後來阿石到臺大語言所當交換學者,和謝舒凱教授合作開放語料,聽說今天會在

g0v summit 公佈他們最新的研究計劃,我也非常期待!就請大家掌聲歡迎謝教授

和遠端參與的 Pierre Magistry(阿石)帶來的「開放語料運動」。

簡報:https://loperntu.github.io/g0v2014lopen/

PTT 語料分析:http://lopen.linguistics.ntu.edu.tw/PTT/data/

Redesigning MoeDict (hlb, a.k.a. 布丁)

主持人引言:

昨天在 ODW 我有給一個演講,提到 Moedict no Pangcah 阿美語萌典剛剛上線,

而其實整個太平洋、澳洲、紐西蘭的原住民語言,都可以在臺灣各族族語裡找到,

我對剛才謝教授說的南島語系連結也非常有興趣。

蔡玉玲政委在 ODW 也有給演講,說到 release early release often 的想法,

就是公部門總是想要做到盡善盡美,才能釋出,不然就像 Liz 說的有被媒體批評

的壓力。所以我們就討論了一下,想說如果各部會都有人長駐在 g0v 提案的話,

release early 就比較沒有壓力了 XD

Release early 的好處,就是會有看不下去的設計師來幫忙,布丁就是這樣被

推坑的 XD 他是 KKBOX 的總監,非常熱心參與各式新創團隊的設計工作,

也是 kkbox 總監與 kktix 售票亭長。請大家歡迎 hlb 的演講。

簡報: https://speakerdeck.com/hlb/redesigning-moedict

我是第一個投 g0v talk 的人!

怒氣爆發的 projects -> 沒有設計

設計要容易維護 

善待下一個跳坑的人!

3du 議程座談

聽眾發問:

Q:計算語言學造成的失業?

謝:讓人做人該做的事情 (檢視機器產生的資料)

Q:有沒有考慮語音辨識的東西

唐:學術單位做技轉時,之前會考慮怎樣子用可能賺得到錢,像是輸入法,但是開放資料其實可以接觸到更多的不特定廠商。

Q:不知道台灣有沒有定義更明確的拼音系統。因為羅馬拼音或通用拼音其實不夠數位化,沒辦法讓鄉民或公司開創更多的應用?

唐:(a-tsioh 附身在我身上)立法因為我們有立法院的逐字稿到秒,所以我們其實可以對應,可能用 IPA 音標之類的。如果大家在 flyingv 或是哪裡未來看到 a-tsioh 的提案的話,請幫忙支持一下......

唐:想問講者們的問題。如果一直遇到阿沙不魯的對象,就會越來越不想要多做些什麼事情... 要如何鼓勵公務員踏出舒適圈?