你佇寫啥物!?臺灣語言資訊技術
編輯歷史
| 時間 | 作者 | 版本 |
|---|---|---|
| 2016-09-08 04:57 – 04:57 | r1556 – r1557 | |
顯示 diff(119 行未修改)
|
||
| 2016-06-22 09:00 – 09:00 | r1554 – r1555 | |
顯示 diff(119 行未修改)
|
||
| 2016-02-25 02:39 – 02:43 | r1521 – r1553 | |
顯示 diff(49 行未修改)
*seq2seq我拄仔查,看起來門檻無低,愛用心調參數才有法度比moses好XDD
*你嘛會使用這語料試驗覓seq2seq
+ *感恩!我共語料下落來矣。毋過這暫仔較無閒,愛拜六才有通詳細來看。
*我要改合成程式,用HTS、…
*我想做語音辨識,可以考慮HTK、Kaldi、…
(65 行未修改)
|
||
| 2016-02-24 02:16 – 02:42 | r1363 – r1520 | |
顯示 diff(44 行未修改)
*我頂擺主要是照tsit份做个:http://www.statmt.org/moses/?n=Moses.Baseline
*(抑是敢卜來試看覓這馬尚時行的seq2seq? XD https://www.tensorflow.org/versions/r0.7/tutorials/seq2seq/index.html)
+ *我這馬是用這個baseline
+ *這是我整理到一半的語料 https://www.dropbox.com/s/5ej3dcwpz3p2wia/%E9%96%A9%E5%8D%97%E8%AA%9E.tar?dl=0
+ *嘛是我下佇網站的moses訓練語料,我的意思是「字詞」下入去平行語料是毋是會影響著翻譯效果?
+ *seq2seq我拄仔查,看起來門檻無低,愛用心調參數才有法度比moses好XDD
+ *你嘛會使用這語料試驗覓seq2seq
*我要改合成程式,用HTS、…
*我想做語音辨識,可以考慮HTK、Kaldi、…
(65 行未修改)
|
||
| 2016-02-23 06:41 – 06:56 | r1247 – r1362 | |
顯示 diff(41 行未修改)
*毋過進前有學長講,辭典下入,會影響伊的reorder模型
*想講敢有法度,予辭典莫影響著reorder model無?
+ *你講个辭典是啥物款?尚簡單个模型干焦需要平行語料耳,總--是,若是有辭典feature,會當tune出較好个模型。
+ *我頂擺主要是照tsit份做个:http://www.statmt.org/moses/?n=Moses.Baseline
+ *(抑是敢卜來試看覓這馬尚時行的seq2seq? XD https://www.tensorflow.org/versions/r0.7/tutorials/seq2seq/index.html)
*我要改合成程式,用HTS、…
*我想做語音辨識,可以考慮HTK、Kaldi、…
(65 行未修改)
|
||
| 2016-02-23 01:04 – 01:09 | r1210 – r1246 | |
顯示 diff(110 行未修改)
|
||
| 2016-02-22 20:35 – 21:01 | r1174 – r1209 | |
顯示 diff(110 行未修改)
|
||
| 2016-02-22 02:47 – 02:55 | r925 – r1173 | |
顯示 diff(12 行未修改)
*進度
2016/2/20萌典松
+ https://g0v.hackpad.com/oeBceDBeNA2
*替專案想個名字
*前端要怎樣,使用者才方便
(16 行未修改)
*我要改翻譯程式,使用moses、…
*(我有捌用 moses 鬥過 MT pipeline,毋知敢有啥物通鬥變个無?)
+ *會當麻煩你研究moses的訓練無?
+ *這馬我是用'scripts/training'/train-model.perl'佮預設的訓練參數
+ *伊會產生alignment model、language model佮reorder model,三個model
+ *alignment model需要平行語句佮辭典
+ *reorder model干焦愛平行語句,無愛辭典
+ *我這馬共平行語句佮辭典攏下入去訓練
+ *毋過進前有學長講,辭典下入,會影響伊的reorder模型
+ *想講敢有法度,予辭典莫影響著reorder model無?
*我要改合成程式,用HTS、…
*我想做語音辨識,可以考慮HTK、Kaldi、…
(65 行未修改)
|
||
| 2016-02-21 03:13 – 03:37 | r850 – r924 | |
顯示 diff(31 行未修改)
*我是工程師
*我要改翻譯程式,使用moses、…
+ *(我有捌用 moses 鬥過 MT pipeline,毋知敢有啥物通鬥變个無?)
*我要改合成程式,用HTS、…
*我想做語音辨識,可以考慮HTK、Kaldi、…
(65 行未修改)
|
||
| 2016-02-20 17:33 – 17:50 | r712 – r849 | |
顯示 diff(51 行未修改)
*讓一般人能輕易學會正確寫法
*輸入「我要吃飯」、「我要呷飯」,顯示「我欲食飯」
+ *這個idea讚!類似自然/新注音輸入法一類的自動校正
*技術:正規化/翻譯
(38 行未修改)
*語音合成
*沒聲音模型
+ *我帶的開源虛擬歌手計畫,其實有子計畫-台語的聲音庫以及虛擬歌手合成引擎的衍生應用-超清晰、自然的語音合成,只是還在努力當前主任務-華語聲音庫中,還顧不到台語聲音庫製作(錄音表已經完成基本單獨音整理,待跟已錄好的日語、華語音diff,找出台語需要新錄音的部份)以及歌手轉語音合成的延伸模組製作。有人有興趣有耐心的話,請跟我聯絡,將來就會有嬌滴滴的女生聲音可用囉:P
*聲音模型勘用
*聲音普通
(1 行未修改)
|
||
| 2016-02-20 10:12 – 10:19 | r707 – r711 | |
顯示 diff(1 行未修改)
Demo頁
*http://用.意傳.台灣
+ *在網頁文字上附聲音:http://gaga978.github.io/gongdaigi/
*相關專案
(92 行未修改)
|
||
| 2016-02-18 08:39 – 08:45 | r696 – r706 | |
顯示 diff(16 行未修改)
*客家電視臺
*原視
+ *線上直播
+ *Aliyang網路廣播
+ *https://bitbucket.org/pcchen/nan
*ptt文章、推文(臺語的居多:呷飽、…)
+ *https://www.ptt.cc/bbs/Gossiping/M.1455729673.A.38B.html
+ *原住民族語言線上詞典
+ *http://e-dictionary.apc.gov.tw/Index.htm
其他副本
(70 行未修改)
|
||
| 2016-02-18 06:54 – 06:54 | r689 – r695 | |
顯示 diff- 寫啥物!?臺灣語言資訊技術
+ 你佇寫啥物!?臺灣語言資訊技術
Demo頁
*http://用.意傳.台灣
(88 行未修改)
|
||
| 2016-02-18 02:31 – 02:46 | r366 – r688 | |
顯示 diff- 臺灣語言資訊技術
+ 寫啥物!?臺灣語言資訊技術
Demo頁
*http://用.意傳.台灣
*相關專案
- *新台語運動
+ *iTaigi新台語運動
*https://g0v.hackpad.com/moed7ct-taigi-neologism
*TaigiLex
*萌典
*MoeDict
+
+ *進度
+ 2016/2/20萌典松
+ *替專案想個名字
+ *前端要怎樣,使用者才方便
+ *如何有效率的得到語料
+ *客家電視臺
+ *原視
+ *ptt文章、推文(臺語的居多:呷飽、…)
+
+ 其他副本
+ *我會族語!!!我想要幫忙族語的語音技術
+ *我有語料,要怎麼貢獻出來
+ *我知道哪裡有母語資料,網址是……
+ *我是工程師
+ *我要改翻譯程式,使用moses、…
+ *我要改合成程式,用HTS、…
+ *我想做語音辨識,可以考慮HTK、Kaldi、…
+
*動機
(18 行未修改)
*技術:語音合成
- *進度
+
+ *做法
*正規化/翻譯
*統計的技術,所以語料的數量影響翻譯的效果
(36 行未修改)
|
||
| 2016-02-17 09:54 – 10:03 | r131 – r365 | |
顯示 diff 臺灣語言資訊技術
+ Demo頁
+ *http://用.意傳.台灣
*相關專案
(5 行未修改)
*動機
- *一般人沒有管道可以學母語
+ *提供一般人可以用臺灣母語的資訊技術
*網路上都是華語的資料
*提供一般人學母語、查母語的所在
(2 行未修改)
*司機B: 那會 chiah gâu 講台語。
*Tâi-gí-bûn chhut-thâu-thiⁿ!
- *
+
+ *整理母語語料
*母語資料散亂一地
*做研究常常遇到找不到語料的問題
*目的
- *提供一般人可以用臺灣母語的資訊技術
- *讓電腦/手機講母語
- *技術:語音合成
*讓一般人能輕易學會正確寫法
*輸入「我要吃飯」、「我要呷飯」,顯示「我欲食飯」
- *技術:翻譯/正規化
+ *技術:正規化/翻譯
- 進
+ *讓電腦/手機講母語
+ *技術:語音合成
+
+ *進度
+ *正規化/翻譯
+ *統計的技術,所以語料的數量影響翻譯的效果
+ *語音合成
+ *同一個人,清楚的音檔一千句以上,愈多愈好
+
+
+ 臺語
+ *翻譯
+ *語料不足
+ *語料勘用
+ *語料足夠
+ *語音合成
+ *沒聲音模型
+ *聲音模型勘用
+ *聲音普通
+ *聲音好聽
+
+ 客語
+ *翻譯
+ *語料不足
+ *語料勘用
+ *語料足夠
+ *語音合成
+ *沒聲音模型
+ *聲音模型勘用
+ *聲音普通
+ *聲音好聽
+
+ 南島語
+ *翻譯
+ *語料不足
+ *語料勘用
+ *語料足夠
+ *語音合成
+ *沒聲音模型
+ *聲音模型勘用
+ *聲音普通
+ *聲音好聽
|
||
| 2016-02-17 09:54 | r130 | |
顯示 diff(30 行未修改)
|
||
| 2016-02-17 09:41 – 09:54 | r14 – r129 | |
顯示 diff(6 行未修改)
*萌典
*MoeDict
+
*動機
*一般人沒有管道可以學母語
*網路上都是華語的資料
- *提供一般人學母語查母語的所在
+ *提供一般人學母語、查母語的所在
*辭典是有母語基礎的人才有辦法使用
- *初學者需要母語語句、母語發音
- *母語工作者需要一個編輯、分享平臺
- *臺灣母語的語言研究、資訊技術常常遇到找不到語料的問題
+ *初學者需要母語語句正確寫法、母語唸法
+ *司機B: 那會 chiah gâu 講台語。
+ *Tâi-gí-bûn chhut-thâu-thiⁿ!
+ *
*母語資料散亂一地
- *做研究時不能公開,做完又沒地方公開
+ *做研究常常遇到找不到語料的問題
+
+ *目的
+ *提供一般人可以用臺灣母語的資訊技術
+ *讓電腦/手機講母語
+ *技術:語音合成
+ *讓一般人能輕易學會正確寫法
+ *輸入「我要吃飯」、「我要呷飯」,顯示「我欲食飯」
+ *技術:翻譯/正規化
+
+ 進
|
||
| 2016-02-17 09:41 | r13 | |
顯示 diff(18 行未修改)
|
||
| 2016-02-17 09:41 | r12 | |
顯示 diff(6 行未修改)
*萌典
*MoeDict
+ *動機
+ *一般人沒有管道可以學母語
+ *網路上都是華語的資料
+ *提供一般人學母語查母語的所在
+ *辭典是有母語基礎的人才有辦法使用
+ *初學者需要母語語句、母語發音
+ *母語工作者需要一個編輯、分享平臺
+ *臺灣母語的語言研究、資訊技術常常遇到找不到語料的問題
+ *母語資料散亂一地
+ *做研究時不能公開,做完又沒地方公開
|
||
| 2016-02-17 09:40 | r11 | |
顯示 diff(8 行未修改)
|
||
| 2016-02-17 09:40 – 09:40 | r1 – r10 | |
顯示 diff- Untitled
+ 臺灣語言資訊技術
- This pad text is synchronized as you type, so that everyone viewing this page sees the same text. This allows you to collaborate seamlessly on documents!
+ *相關專案
+ *新台語運動
+ *https://g0v.hackpad.com/moed7ct-taigi-neologism
+ *TaigiLex
+ *萌典
+ *MoeDict
|
||
| 2016-02-17 09:39 | r0 | |
顯示 diff+ Untitled
+ This pad text is synchronized as you type, so that everyone viewing this page sees the same text. This allows you to collaborate seamlessly on documents!
|
||