逐字稿打字坊
過了四個月都沒人回應,大概是無疾而終了。剛好看到這個工具,雖然只能個人使用,但至少支援影音檔播放兼打字,應該可以提供有需要的朋友參考。
106.6.14補充:更理想的出來了,直接語音辨識,自動轉錄音檔
原始心智圖
http://i.imgur.com/fDHoqdM.jpg
目的
整合需要逐字稿的資源,方便大家一起跳坑
- 現在各種需要上字幕的影音檔案越來越多,每個都要個別挖坑再上來請人幫忙打字,實在有點麻煩
- 要挖坑或跳坑都需要有一定的技術門檻,不是每個人都知道怎麼做
- 仿照P2P分享原理,由系統自動整合原始文件並加以分割,然後提供專案網址,方便分享給更多有空的人幫忙打字
- 如此可以降低門檻,提高志工參與率,或許也能提高供檔者把原始文件拿出來建檔的意願,讓更多東西得以曝光
那些東西需要逐字稿?
- 無字幕影片
- 錄音檔:mp3、wav...
- 掃描文件:pdf、jpg...
- 需要翻譯的原文資料
應用
- 影音旁白
- 文件打字
- 翻譯蒟蒻
- 多人合作翻譯同一份原文資料
- 將一份文件翻譯多國語言,以便進行國際宣傳
- 學術應用
- 上課內容錄影
- 原文資料協同翻譯
- 高手前輩的筆記建檔
- 題庫詳解建檔
作法
- 粗胚
- 文件
- 直接上傳
- 各別JPG掃描檔是否可自動合併?
- 或由上傳者自己合併成pdf再上傳?
- 掃描檔可否先經過OCR初步辨識後,再分段交由志工校對以節省時間?
- 切割
- 影片、錄音檔
- 依固定時間分段(1分 or 5分?)
- 每段前後延伸3-5秒,以免分段處聽不清楚
- 文件
- 封裝
- 每個專案提供獨立網址,方便分享找志工
- 系統提供此檔案的基本資料(標題、長度、頁數)
- 測試
- 志工挑選[待領]片段
- 系統顯示該段內容(影片、聲音或文件)
- 志工直接將文字輸入在下方,完成後送出
- 回到前面繼續認領下一片段
- 組裝
- 後臺顯示已完成片段內容,可供檢查是否有問題
- 確認後,系統自動合併輸出
- 完整逐字稿
- 校對稿:時間+內容 或 頁數+內容
可能遇到的問題
- 挖到寶了怎麼處理
- 問題:如果挖到大量掃描文件,還要這樣逐篇處理嗎?
- 建議對策:支援壓縮檔上傳,並由系統自動挖出裡面的文件檔批次處理
- 衍生問題:要如何讓系統自動辨識那些檔案是需要處理的?
- 衍生對策:掃描檔可否先經過OCR初步辨識後,再分段交由志工校對以節省時間?這樣在處理大批文件時應該會更有效率。
- 志工有空全程在線上輸入嗎?
- 問題:線上直接輸入固然方便,但志工會有被綁住的感覺
- 建議對策:除線上直接輸入外,另提供附件上傳功能
- 衍生問題:附件只限TXT檔嗎?
- 逐字稿不一定是純文字
- 問題:線上直接輸入只適合純文字,但掃描文件可能包含表格和插圖
- 建議對策:提供附件上傳功能,支援DOC檔
- 衍生問題:如何讓系統自動合併一系列DOC+TXT附件檔
- 安全隱私問題
- 問題:有些文件可能涉及機密,或不便太早曝光
- 建議對策:由上傳者決定是否要公開放到清單上,若不公開就提供網址讓他私下找人打字
- 衍生問題:本系統需要支援這種涉及機密或純粹學術(私人)用途的文件打字嗎?