你佇寫啥物!?臺灣語言資訊技術

編輯歷史

時間 作者 版本
2016-09-08 04:57 – 04:57 A-Tsioh r1556 – r1557
顯示 diff
(119 行未修改)
2016-06-22 09:00 – 09:00 A-Tsioh r1554 – r1555
顯示 diff
(119 行未修改)
2016-02-25 02:39 – 02:43 Chu-Cheng Lin r1521 – r1553
顯示 diff
(49 行未修改)
*seq2seq我拄仔查,看起來門檻無低,愛用心調參數才有法度比moses好XDD
*你嘛會使用這語料試驗覓seq2seq
+ *感恩!我共語料下落來矣。毋過這暫仔較無閒,愛拜六才有通詳細來看。
*我要改合成程式,用HTS、…
*我想做語音辨識,可以考慮HTK、Kaldi、…
(65 行未修改)
2016-02-24 02:16 – 02:42 薛丞宏 r1363 – r1520
顯示 diff
(44 行未修改)
*我頂擺主要是照tsit份做个:http://www.statmt.org/moses/?n=Moses.Baseline
*(抑是敢卜來試看覓這馬尚時行的seq2seq? XD https://www.tensorflow.org/versions/r0.7/tutorials/seq2seq/index.html)
+ *我這馬是用這個baseline
+ *這是我整理到一半的語料 https://www.dropbox.com/s/5ej3dcwpz3p2wia/%E9%96%A9%E5%8D%97%E8%AA%9E.tar?dl=0
+ *嘛是我下佇網站的moses訓練語料,我的意思是「字詞」下入去平行語料是毋是會影響著翻譯效果?
+ *seq2seq我拄仔查,看起來門檻無低,愛用心調參數才有法度比moses好XDD
+ *你嘛會使用這語料試驗覓seq2seq
*我要改合成程式,用HTS、…
*我想做語音辨識,可以考慮HTK、Kaldi、…
(65 行未修改)
2016-02-23 06:41 – 06:56 Chu-Cheng Lin r1247 – r1362
顯示 diff
(41 行未修改)
*毋過進前有學長講,辭典下入,會影響伊的reorder模型
*想講敢有法度,予辭典莫影響著reorder model無?
+ *你講个辭典是啥物款?尚簡單个模型干焦需要平行語料耳,總--是,若是有辭典feature,會當tune出較好个模型。
+ *我頂擺主要是照tsit份做个:http://www.statmt.org/moses/?n=Moses.Baseline
+ *(抑是敢卜來試看覓這馬尚時行的seq2seq? XD https://www.tensorflow.org/versions/r0.7/tutorials/seq2seq/index.html)
*我要改合成程式,用HTS、…
*我想做語音辨識,可以考慮HTK、Kaldi、…
(65 行未修改)
2016-02-23 01:04 – 01:09 Chu-Cheng Lin r1210 – r1246
顯示 diff
(110 行未修改)
2016-02-22 20:35 – 21:01 Chu-Cheng Lin r1174 – r1209
顯示 diff
(110 行未修改)
2016-02-22 02:47 – 02:55 薛丞宏 r925 – r1173
顯示 diff
(12 行未修改)
*進度
2016/2/20萌典松
+ https://g0v.hackpad.com/oeBceDBeNA2
*替專案想個名字
*前端要怎樣,使用者才方便
(16 行未修改)
*我要改翻譯程式,使用moses、…
*(我有捌用 moses 鬥過 MT pipeline,毋知敢有啥物通鬥變个無?)
+ *會當麻煩你研究moses的訓練無?
+ *這馬我是用'scripts/training'/train-model.perl'佮預設的訓練參數
+ *伊會產生alignment model、language model佮reorder model,三個model
+ *alignment model需要平行語句佮辭典
+ *reorder model干焦愛平行語句,無愛辭典
+ *我這馬共平行語句佮辭典攏下入去訓練
+ *毋過進前有學長講,辭典下入,會影響伊的reorder模型
+ *想講敢有法度,予辭典莫影響著reorder model無?
*我要改合成程式,用HTS、…
*我想做語音辨識,可以考慮HTK、Kaldi、…
(65 行未修改)
2016-02-21 03:13 – 03:37 Chu-Cheng Lin r850 – r924
顯示 diff
(31 行未修改)
*我是工程師
*我要改翻譯程式,使用moses、…
+ *(我有捌用 moses 鬥過 MT pipeline,毋知敢有啥物通鬥變个無?)
*我要改合成程式,用HTS、…
*我想做語音辨識,可以考慮HTK、Kaldi、…
(65 行未修改)
2016-02-20 17:33 – 17:50 Chou Shoichi r712 – r849
顯示 diff
(51 行未修改)
*讓一般人能輕易學會正確寫法
*輸入「我要吃飯」、「我要呷飯」,顯示「我欲食飯」
+ *這個idea讚!類似自然/新注音輸入法一類的自動校正
*技術:正規化/翻譯
(38 行未修改)
*語音合成
*沒聲音模型
+ *我帶的開源虛擬歌手計畫,其實有子計畫-台語的聲音庫以及虛擬歌手合成引擎的衍生應用-超清晰、自然的語音合成,只是還在努力當前主任務-華語聲音庫中,還顧不到台語聲音庫製作(錄音表已經完成基本單獨音整理,待跟已錄好的日語、華語音diff,找出台語需要新錄音的部份)以及歌手轉語音合成的延伸模組製作。有人有興趣有耐心的話,請跟我聯絡,將來就會有嬌滴滴的女生聲音可用囉:P
*聲音模型勘用
*聲音普通
(1 行未修改)
2016-02-20 10:12 – 10:19 文嘉 蔡 r707 – r711
顯示 diff
(1 行未修改)
Demo頁
*http://用.意傳.台灣
+ *在網頁文字上附聲音:http://gaga978.github.io/gongdaigi/
*相關專案
(92 行未修改)
2016-02-18 08:39 – 08:45 薛丞宏 r696 – r706
顯示 diff
(16 行未修改)
*客家電視臺
*原視
+ *線上直播
+ *Aliyang網路廣播
+ *https://bitbucket.org/pcchen/nan
*ptt文章、推文(臺語的居多:呷飽、…)
+ *https://www.ptt.cc/bbs/Gossiping/M.1455729673.A.38B.html
+ *原住民族語言線上詞典
+ *http://e-dictionary.apc.gov.tw/Index.htm
其他副本
(70 行未修改)
2016-02-18 06:54 – 06:54 薛丞宏 r689 – r695
顯示 diff
- 寫啥物!?臺灣語言資訊技術
+ 你佇寫啥物!?臺灣語言資訊技術
Demo頁
*http://用.意傳.台灣
(88 行未修改)
2016-02-18 02:31 – 02:46 薛丞宏 r366 – r688
顯示 diff
- 臺灣語言資訊技術
+ 寫啥物!?臺灣語言資訊技術
Demo頁
*http://用.意傳.台灣
*相關專案
- *新台語運動
+ *iTaigi新台語運動
*https://g0v.hackpad.com/moed7ct-taigi-neologism
*TaigiLex
*萌典
*MoeDict
+
+ *進度
+ 2016/2/20萌典松
+ *替專案想個名字
+ *前端要怎樣,使用者才方便
+ *如何有效率的得到語料
+ *客家電視臺
+ *原視
+ *ptt文章、推文(臺語的居多:呷飽、…)
+
+ 其他副本
+ *我會族語!!!我想要幫忙族語的語音技術
+ *我有語料,要怎麼貢獻出來
+ *我知道哪裡有母語資料,網址是……
+ *我是工程師
+ *我要改翻譯程式,使用moses、…
+ *我要改合成程式,用HTS、…
+ *我想做語音辨識,可以考慮HTK、Kaldi、…
+
*動機
(18 行未修改)
*技術:語音合成
- *進度
+
+ *做法
*正規化/翻譯
*統計的技術,所以語料的數量影響翻譯的效果
(36 行未修改)
2016-02-17 09:54 – 10:03 薛丞宏 r131 – r365
顯示 diff
臺灣語言資訊技術
+ Demo頁
+ *http://用.意傳.台灣
*相關專案
(5 行未修改)
*動機
- *一般人沒有管道可以學母語
+ *提供一般人可以用臺灣母語的資訊技術
*網路上都是華語的資料
*提供一般人學母語、查母語的所在
(2 行未修改)
*司機B: 那會 chiah gâu 講台語。
*Tâi-gí-bûn chhut-thâu-thiⁿ!
- *
+
+ *整理母語語料
*母語資料散亂一地
*做研究常常遇到找不到語料的問題
*目的
- *提供一般人可以用臺灣母語的資訊技術
- *讓電腦/手機講母語
- *技術:語音合成
*讓一般人能輕易學會正確寫法
*輸入「我要吃飯」、「我要呷飯」,顯示「我欲食飯」
- *技術:翻譯/正規化
+ *技術:正規化/翻譯
- 進
+ *讓電腦/手機講母語
+ *技術:語音合成
+
+ *進度
+ *正規化/翻譯
+ *統計的技術,所以語料的數量影響翻譯的效果
+ *語音合成
+ *同一個人,清楚的音檔一千句以上,愈多愈好
+
+
+ 臺語
+ *翻譯
+ *語料不足
+ *語料勘用
+ *語料足夠
+ *語音合成
+ *沒聲音模型
+ *聲音模型勘用
+ *聲音普通
+ *聲音好聽
+
+ 客語
+ *翻譯
+ *語料不足
+ *語料勘用
+ *語料足夠
+ *語音合成
+ *沒聲音模型
+ *聲音模型勘用
+ *聲音普通
+ *聲音好聽
+
+ 南島語
+ *翻譯
+ *語料不足
+ *語料勘用
+ *語料足夠
+ *語音合成
+ *沒聲音模型
+ *聲音模型勘用
+ *聲音普通
+ *聲音好聽
2016-02-17 09:54 (unknown) r130
顯示 diff
(30 行未修改)
2016-02-17 09:41 – 09:54 薛丞宏 r14 – r129
顯示 diff
(6 行未修改)
*萌典
*MoeDict
+
*動機
*一般人沒有管道可以學母語
*網路上都是華語的資料
- *提供一般人學母語查母語的所在
+ *提供一般人學母語、查母語的所在
*辭典是有母語基礎的人才有辦法使用
- *初學者需要母語語句、母語發音
- *母語工作者需要一個編輯、分享平臺
- *臺灣母語的語言研究、資訊技術常常遇到找不到語料的問題
+ *初學者需要母語語句正確寫法、母語唸法
+ *司機B: 那會 chiah gâu 講台語。
+ *Tâi-gí-bûn chhut-thâu-thiⁿ!
+ *
*母語資料散亂一地
- *做研究時不能公開,做完又沒地方公開
+ *做研究常常遇到找不到語料的問題
+
+ *目的
+ *提供一般人可以用臺灣母語的資訊技術
+ *讓電腦/手機講母語
+ *技術:語音合成
+ *讓一般人能輕易學會正確寫法
+ *輸入「我要吃飯」、「我要呷飯」,顯示「我欲食飯」
+ *技術:翻譯/正規化
+
+ 進
2016-02-17 09:41 (unknown) r13
顯示 diff
(18 行未修改)
2016-02-17 09:41 薛丞宏 r12
顯示 diff
(6 行未修改)
*萌典
*MoeDict
+ *動機
+ *一般人沒有管道可以學母語
+ *網路上都是華語的資料
+ *提供一般人學母語查母語的所在
+ *辭典是有母語基礎的人才有辦法使用
+ *初學者需要母語語句、母語發音
+ *母語工作者需要一個編輯、分享平臺
+ *臺灣母語的語言研究、資訊技術常常遇到找不到語料的問題
+ *母語資料散亂一地
+ *做研究時不能公開,做完又沒地方公開
2016-02-17 09:40 (unknown) r11
顯示 diff
(8 行未修改)
2016-02-17 09:40 – 09:40 薛丞宏 r1 – r10
顯示 diff
- Untitled
+ 臺灣語言資訊技術
- This pad text is synchronized as you type, so that everyone viewing this page sees the same text. This allows you to collaborate seamlessly on documents!
+ *相關專案
+ *新台語運動
+ *https://g0v.hackpad.com/moed7ct-taigi-neologism
+ *TaigiLex
+ *萌典
+ *MoeDict
2016-02-17 09:39 (unknown) r0
顯示 diff
+ Untitled
+ This pad text is synchronized as you type, so that everyone viewing this page sees the same text. This allows you to collaborate seamlessly on documents!