MoeDict - 萌典

編輯歷史

時間 作者 版本
2013-06-16 11:32 – 11:36 Pochung Pektiong Chen r1607 – r1641
顯示 diff
(74 行未修改)
無調:done
無連字:si-tsai和sit-sai就分不出來,介紹所有的結果會不會奇怪?而且一定會比較慢
+ ** 這是 UI 要怎麼設計的問題,是否讓使用者在可以輸入「不那麼明確的query」然後系統吐出所以可能的相容的結果。要求使用者「正確」的輸入連字符號的結果可能是使用者找不到想找的詞彙(因為不知道正確的寫法是什麼)。
Q:要不要支援 wildcard '!' and '*'
(19 行未修改)
2013-06-16 10:31 – 10:37 A-Tsioh r1536 – r1606
顯示 diff
(71 行未修改)
Need to make an index using "toneless format". 打多音節詞彙的時候,許多使用者習慣「無調號無連字符號」的方式。
+
+ 無調:done
+ 無連字:si-tsai和sit-sai就分不出來,介紹所有的結果會不會奇怪?而且一定會比較慢
Q:要不要支援 wildcard '!' and '*'
(19 行未修改)
2013-06-16 01:49 – 02:01 Pochung Pektiong Chen r1419 – r1535
顯示 diff
(65 行未修改)
except for gú -> gúa : are you sure we want this ?
onset and voyels are mandatory, tones and final may be omitted. and we input prefixes only.
+
+ 如果設計的方向是:打多少羅馬字進來,就顯示跟目前以以輸入的羅馬字「相容」的可能詞彙。
I'm also not sure for the sittsai->sit-tsai, this may enlarge the search space a lot, especially with 入聲 that may be interpreted as onset consonnant
+
+ Need to make an index using "toneless format". 打多音節詞彙的時候,許多使用者習慣「無調號無連字符號」的方式。
+ Q:要不要支援 wildcard '!' and '*'
輕音問題
(17 行未修改)
2013-06-15 21:12 – 21:31 A-Tsioh r1307 – r1418
顯示 diff
(75 行未修改)
POJ -> TL conversion
ch->ts, chh->tsh, ou->oo, ek->ik, eng->ing,
+
+ 羅馬字輸入 as a webservice
+ query as json {query:'sit8-tsai7', mode='<some mode>'}
+
+ results as {exact:[string list of 臺語漢字], prefix:[string list], fuzzy:[string list]}
+
整理<客家話常用詞典>類似
(4 行未修改)
2013-06-15 18:45 – 18:53 A-Tsioh r1084 – r1306
顯示 diff
(61 行未修改)
sit8-tsai7 顯示 si̍t-tsāi*
sittsai[space] 顯示 si̍t-tsāi, sit-tsâi, etc (任何可能的斷詞)
+
+ which means (my interpretation) :
+ except for gú -> gúa : are you sure we want this ?
+ onset and voyels are mandatory, tones and final may be omitted. and we input prefixes only.
+
+ I'm also not sure for the sittsai->sit-tsai, this may enlarge the search space a lot, especially with 入聲 that may be interpreted as onset consonnant
+
輕音問題
打 ah 要不要顯示 --ah ?
+ 要
POJ -> TL conversion
(7 行未修改)
2013-06-15 15:59 – 15:59 Ted Chen r1078 – r1083
顯示 diff
(34 行未修改)
*漢喃 on Wiki: https://zh.wikipedia.org/wiki/%E6%B1%89%E5%96%83
*範例: 漢文(越南語:Hán Văn/漢文),越南人又稱「儒字」(越南語:Chữ Nho/??儒) (前面的 ?? 好像是因為 hackpad 沒有支援 unicode 4.0 ? )
+ *東南亞文化系列沙龍─第二場:東南亞語言同根生: https://docs.google.com/forms/d/1RW8sWeRByeERY6EieQG1yAy-hqaJmngF2fC4DvdGics/viewform?pli=1
*開發者
(36 行未修改)
2013-06-11 06:44 – 06:50 Ted Chen r998 – r1077
顯示 diff
(31 行未修改)
*https://bitbucket.org/pcchen/nan
*private repo, 需要 get data 的人請跟 pcchen 說
+ *想詢問萌典的開發方向,因個人背景關係。有一段時間喜歡越南文化。了解越南文化的當中發現越南與中華文化的密切關係,甚至越南歷史上曾經一度想要自創【漢喃】文字。且越文其實裡面也有很多古漢字的發音。
+ *漢喃 on Wiki: https://zh.wikipedia.org/wiki/%E6%B1%89%E5%96%83
+ *範例: 漢文(越南語:Hán Văn/漢文),越南人又稱「儒字」(越南語:Chữ Nho/??儒) (前面的 ?? 好像是因為 hackpad 沒有支援 unicode 4.0 ? )
*開發者
(36 行未修改)
2013-06-09 11:54 – 11:55 Audrey Tang r995 – r997
顯示 diff
(42 行未修改)
*NeedsDesigner: 需要介面設計
*從一個詞和它的注音 + 拼音 (如 https://moedict.tw/uni/%E9%80%9A%E8%A8%8A%E8%87%AA%E7%94%B1 ),畫出結合拼音和直排注音的 CSS 來
-
- 閩南語 羅馬字 輸入界面
+ *閩南語 羅馬字 輸入界面
endkey:
space 表示完整結束
(23 行未修改)
2013-06-08 10:54 – 10:54 Audrey Tang r971 – r994
顯示 diff
(69 行未修改)
*https://github.com/g0v/moedict-data-hakka
*已完成:造字處理
- *還需要:分開近反義詞、對應話語
+ *還需要:華<->客對照、線上語音、詞性
2013-06-08 10:08 – 10:09 Pochung Pektiong Chen r946 – r970
顯示 diff
(29 行未修改)
*詞庫 XML schema https://code.google.com/p/lift-standard/
*sync 信望愛輸入法詞庫的方法
+ *https://bitbucket.org/pcchen/nan
+ *private repo, 需要 get data 的人請跟 pcchen 說
*開發者
(37 行未修改)
2013-06-08 09:57 – 09:57 Audrey Tang r944 – r945
顯示 diff
(70 行未修改)
2013-06-08 08:35 – 09:35 Pochung Pektiong Chen r515 – r943
顯示 diff
(24 行未修改)
*其他平台 (Win8, MeeGo, XULRunner, ...)
*...請自行加上新主意!
+ *<閩南語多語詞典>
+ *資料來源:信望愛輸入法詞庫
+ *詞庫維護軟體:http://wesay.palaso.org/
+ *詞庫 XML schema https://code.google.com/p/lift-standard/
+ *sync 信望愛輸入法詞庫的方法
*開發者
- au, a-tsioh, kcwu, yllan, ethantw, hlb, racklin, ...
+ au, a-tsioh, kcwu, yllan, ethantw, hlb, racklin, pcchen=pektiong, ...
分工與成員
(5 行未修改)
*從一個詞和它的注音 + 拼音 (如 https://moedict.tw/uni/%E9%80%9A%E8%A8%8A%E8%87%AA%E7%94%B1 ),畫出結合拼音和直排注音的 CSS 來
- 閩南語 拼音 輸入界面
+ 閩南語 羅馬字 輸入界面
+
+ endkey:
+ space 表示完整結束
+ 123456789 表示單一音節結束,有可能會繼續打下一個音節
+
+ case study
+ 單字
+ g (not valid)
+ gu 顯示 gu*, gú*, gù*, gu̍* (gu̍p,gu̍t,gu̍k,gu̍h)
+ gu2 顯示 gú-* (遇到數字表示音節已結束)
+ gú 顯示 gú* gúa, gúng (知道是這個調,可是後面還可能出現其他母音)
+ si̍t-tsāi 顯示 si̍t-tsāi*
+ sit8-tsai7 顯示 si̍t-tsāi*
+ sittsai[space] 顯示 si̍t-tsāi, sit-tsâi, etc (任何可能的斷詞)
+ 輕音問題
+ 打 ah 要不要顯示 --ah ?
+ POJ -> TL conversion
+ ch->ts, chh->tsh, ou->oo, ek->ik, eng->ing,
整理<客家話常用詞典>類似
(4 行未修改)
2013-06-08 07:29 – 08:23 Audrey Tang r481 – r514
顯示 diff
(15 行未修改)
*https://github.com/g0v/moedict-data-hakka/blob/master/mp3-urls.txt
*正在轉成 ogg 中 -au
+ *閩南語 拼音 輸入界面
*試試新版型。hlb 做了一些開頭:
*http://moe.hlb.the-hold.handlino.com/
(15 行未修改)
*NeedsDesigner: 需要介面設計
*從一個詞和它的注音 + 拼音 (如 https://moedict.tw/uni/%E9%80%9A%E8%A8%8A%E8%87%AA%E7%94%B1 ),畫出結合拼音和直排注音的 CSS 來
+
+ 閩南語 拼音 輸入界面
+
(1 行未修改)
*https://github.com/g0v/moedict-data-hakka
-
- 還需要:分開近反義詞、對應話語
+ *已完成:造字處理
+ *還需要:分開近反義詞、對應話語
2013-06-08 07:29 (unknown) r480
顯示 diff
(43 行未修改)
2013-06-08 05:25 – 07:29 Audrey Tang r399 – r479
顯示 diff
(12 行未修改)
* "example": ["\ufff9大浪排山倒海打過來,企在海脣个人險險分佢捲走。\ufffb大浪排山倒海打過來,站在海邊的人差一點被它捲走。"]}
*PUA 造字可忽略,能轉多少是多少,即使只有 title 都好
+ *客家典語音清單:
+ *https://github.com/g0v/moedict-data-hakka/blob/master/mp3-urls.txt
+ *正在轉成 ogg 中 -au
*試試新版型。hlb 做了一些開頭:
*http://moe.hlb.the-hold.handlino.com/
(11 行未修改)
*NeedsData: 需要資料(擷取、清理)
*客家典 HTML 轉 JSON http://www.audreyt.org/newdict/hakka.tar.gz
- *可參考 kcwu 的 https://github.com/g0v/moedict-process
- *另外 fork 一個處理客家典 HTML 的 repo?
+ *另外 fork 一個處理客家典 HTML 的 repo:
+ *初步成果 (a-tsioh): https://github.com/g0v/moedict-data-hakka
*NeedsDesigner: 需要介面設計
*從一個詞和它的注音 + 拼音 (如 https://moedict.tw/uni/%E9%80%9A%E8%A8%8A%E8%87%AA%E7%94%B1 ),畫出結合拼音和直排注音的 CSS 來
-
整理<客家話常用詞典>類似
+
+ *https://github.com/g0v/moedict-data-hakka
+
+ 還需要:分開近反義詞、對應話語
2013-06-08 04:23 – 04:35 A-Tsioh r370 – r398
顯示 diff
(31 行未修改)
*NeedsDesigner: 需要介面設計
*從一個詞和它的注音 + 拼音 (如 https://moedict.tw/uni/%E9%80%9A%E8%A8%8A%E8%87%AA%E7%94%B1 ),畫出結合拼音和直排注音的 CSS 來
- 資料
+
+
+
+ 整理<客家話常用詞典>類似
2013-06-08 04:23 (unknown) r369
顯示 diff
(34 行未修改)
2013-06-08 04:23 – 04:23 A-Tsioh r365 – r368
顯示 diff
(34 行未修改)
2013-06-08 04:22 (unknown) r364
顯示 diff
(34 行未修改)
2013-06-08 04:22 A-Tsioh r363
顯示 diff
(31 行未修改)
*NeedsDesigner: 需要介面設計
*從一個詞和它的注音 + 拼音 (如 https://moedict.tw/uni/%E9%80%9A%E8%A8%8A%E8%87%AA%E7%94%B1 ),畫出結合拼音和直排注音的 CSS 來
+ 資料
2013-06-08 02:26 – 02:39 Audrey Tang r117 – r362
顯示 diff
MoeDict - 萌典
+
+ https://moedict.tw/
*開發方向
今天除了將 a-tsioh 整理的新版英法德文包裝釋出之外,也想開始:
- *整理客家話的部份
- *見下方「分工與成員」
+ *整理<客家話常用詞典>
*上次黑客松取得的原始資料: http://www.audreyt.org/newdict/hakka.tar.gz
- *試試 hlb 的新版型:
+ *需要轉成 https://github.com/g0v/moedict-data-twblg 相容格式
+ *參考其中的 dict-twblg.json,原有欄位意義保持一致下,請任意新增新欄位
+ *例句的格式用 \uFFF9 \uFFFB,如 hakka/9990.html :
+ *{"def": "形容力量巨大,氣勢壯闊。",
+ * "example": ["\ufff9大浪排山倒海打過來,企在海脣个人險險分佢捲走。\ufffb大浪排山倒海打過來,站在海邊的人差一點被它捲走。"]}
+ *PUA 造字可忽略,能轉多少是多少,即使只有 title 都好
+ *試試新版型。hlb 做了一些開頭:
*http://moe.hlb.the-hold.handlino.com/
*https://github.com/audreyt/moedict-webkit/tree/master/ios/www
(1 行未修改)
*https://twitter.com/hlb/status/342664167246921729/photo/1
*http://ethantw.net/lab/han/css/han.css 國語注音符號(直式)
+ *其他平台 (Win8, MeeGo, XULRunner, ...)
*...請自行加上新主意!
(6 行未修改)
*可參考 kcwu 的 https://github.com/g0v/moedict-process
*另外 fork 一個處理客家典 HTML 的 repo?
- *NeedsTech: 需要技術支援(程式、架站 etc)
- *
+ *NeedsDesigner: 需要介面設計
+ *從一個詞和它的注音 + 拼音 (如 https://moedict.tw/uni/%E9%80%9A%E8%A8%8A%E8%87%AA%E7%94%B1 ),畫出結合拼音和直排注音的 CSS 來
2013-06-08 02:26 (unknown) r116
顯示 diff
(25 行未修改)
2013-06-08 02:22 – 02:26 Audrey Tang r1 – r115
顯示 diff
- Untitled
+ MoeDict - 萌典
- This pad text is synchronized as you type, so that everyone viewing this page sees the same text. This allows you to collaborate seamlessly on documents!
+ *開發方向
+ 今天除了將 a-tsioh 整理的新版英法德文包裝釋出之外,也想開始:
+ *整理客家話的部份
+ *見下方「分工與成員」
+ *上次黑客松取得的原始資料: http://www.audreyt.org/newdict/hakka.tar.gz
+ *試試 hlb 的新版型:
+ *http://moe.hlb.the-hold.handlino.com/
+ *https://github.com/audreyt/moedict-webkit/tree/master/ios/www
+ *整合 ethantw 的直排注音樣式
+ *https://twitter.com/hlb/status/342664167246921729/photo/1
+ *http://ethantw.net/lab/han/css/han.css 國語注音符號(直式)
+ *...請自行加上新主意!
+
+ *開發者
+ au, a-tsioh, kcwu, yllan, ethantw, hlb, racklin, ...
+
+ 分工與成員
+ *NeedsData: 需要資料(擷取、清理)
+ *客家典 HTML 轉 JSON http://www.audreyt.org/newdict/hakka.tar.gz
+ *可參考 kcwu 的 https://github.com/g0v/moedict-process
+ *另外 fork 一個處理客家典 HTML 的 repo?
+ *NeedsTech: 需要技術支援(程式、架站 etc)
+ *
2013-06-08 02:22 (unknown) r0
顯示 diff
+ Untitled
+ This pad text is synchronized as you type, so that everyone viewing this page sees the same text. This allows you to collaborate seamlessly on documents!