Hackpads are smart collaborative documents. Join Hackpad Now.

Johnson Liang

191 days ago
Unfiled. Edited by Johnson Liang 191 days ago
  • g0v-talks 群組由 clkao 發起,目前成員二十(請小組成員自己上來簽名):clkao, ipa, audreyt (au), yhsiang (LY), ETBlue, venev, johnny, hychen, jimmy huang, tkirby, ronny, nchild, walkingice, pofeng, chihao, pm5 , bess, mrorz
 
476 days ago
Unfiled. Edited by Yun-Chen Chien , Johnson Liang 476 days ago
Yun-Chen C 公民協作國史館二二八檔案資料庫
想做的事:
開放高品質的數位化檔案,open data 讓關心二二八的人更方便使用、查詢,並且讓一般公民也可以參與,而不只是歷史研究者。
 
 
目前已經有的東西:
五萬七千頁,約一萬兩千件的檔案影像檔。但是只有非常模糊的卷標註,例如:內政部警政署(檔案移轉機關),二二八事變(案名),據密告劉君曾參加二二八暴動等情(件名)。裡面的檔案可能混雜不同主題和關鍵字的檔案。
 
 
 
 
 
 
 
遇到的問題:
1. 想開放,但是因為缺乏人力,標記、下 metadata、下 tag 的速度不夠快。
2. 在思考該怎麼設計資料庫系統,讓民眾方便查詢、瀏覽。是走傳統的欄位,還是可以輸入前 250 字,還是先很破爛的 OCR 讓民眾可以先查詢(因為很多檔案是毛筆字,非常難 OCR)。
 
國史館想做的實驗:
除了正式官方的檔案查詢系統外,可以試著切一塊出來,讓一般公民自由參與標記、分類或是提想法。例如 OCR 後結果校正、下 tag、下名詞的 annotation 超連結、清理地址對應到地圖座標的資料加上去之類的,成熟後再把資料加回正式系統。因此今天黑客松希望能夠:
 
1. 討論資料庫、協作標記可以怎麼進行。歡迎對二二八資料有興趣的人,以使用者和參與者的角度討論怎麼開放公眾參與。
2. 討論 open data 格式:歡迎熟悉資料庫和開放資料的技術人,提供架設資料庫的意見。
 
聯絡人
曉雯
hwchou@drnh.gov.tw
 
ipa c 授權方式
nchild 文件討論採 CC BY NC
 
ipa c 使用資料
Yun-Chen C 資料目前為國史館、檔案館合作,視未來官方開放的授權為主,會盡量開放授權
 
ET B 專案目前狀態
Yun-Chen C Idea 發想討論中
 
Johnson L
  •  感覺跟 g0v 國家寶藏專案的「鑑定小隊」做的事情一模一樣?
  • 鑑定小隊
  • 任務:將國家寶藏資料庫的文件進行數位化、勘誤與翻譯
  • 適合:善於文書處理、喜愛室內活動、鄉民
  • 優點:修身養性的細心、打字速度進步、電腦前即可貢獻的參與感
  •  
  • 資料庫呈現可以參考國家寶藏的「寶藏庫」介面,我覺得一樣屬於 crowd-sourced OCR 的範疇:
  •  
  •  
Yun-Chen C
  • 討論事項
 
 
526 days ago
Unfiled. Edited by Johnson Liang 526 days ago
採訪:MrOrz, Ronny
 
538 days ago
Unfiled. Edited by Michael_Li , Johnson Liang 538 days ago
ally w
  • 但其實我們有查過有一些限制,當然有一些簡單的頁面可以透過web archive 去處理,但也是要餵給他們,他們才會處理,因此想寫一些機器人去爬資料後,餵給web archive 去備存,若存的不錯就很好,若很重要又存的不好,我們就會想要自已存一份。而且很多當代歷史事件,評論很容易被消失,當然台灣比較沒有,但對岸就滿多被消失的記錄。若能即時archive  也是很有趣的一個保存
Johnson L
  • 他不會爬資料,有人給了他連結他才會去爬,不過他抓下來 archive 的東西似乎比 wayback machine 完整,印象中連 FB 貼文(公開)也能處理。
  •  
  • 對於 web archiving,目前全世界已經有這一些 initiatives 在進行:
  •  
  • 但感覺好像都很難架,說不定 caasi 自己寫比較快(然後順便讓這世界上多誕生一種 archive format standard... XD)
  •  
 
 Michael_LI  //我有參加318直播影片備份後移轉到中研院,變成了一個資料呈現網站,318文播組資料我備份到「這邊」(請先不要改文字,頂多下載就好)
 
771 days ago
Unfiled. Edited by Johnson Liang , DieKlassik Charlie , 妤庭 魏 771 days ago
Johnson L 聯合報 g0v grant 第一屆獲獎團隊專訪 - Cofacts LINE bot
 
ET B 提問前,請先參考  g0v 媒體區過往採訪共筆
 
以下正文
 
  • (採訪共筆大綱)
 
DieKlassik C Q. 在人人可以是自媒體、眾聲喧嘩的時代,「新聞倫理」中求實求真的精神似乎更需要放大。我想問,貴團隊在這幾個月下來,對台灣社會,尤其是Line上「謠言廣傳」的第一線觀察是什麼?
 
Johnson L 由於 Cofacts 接受回報的範圍是所有 LINE 上的轉傳訊息,絕大部分被回報的問題訊息其實不是來自編輯室。因此對我們來說,比起新聞倫理,或許訊息鍊末端的讀者的媒體識讀更為重要。(這裡的「媒體」不是只指新聞媒體而是任何訊息媒介。)
 
與其要求所有能發佈內容的人自律 -- 這在 web 2.0 之後基本上不可能了,發文可以有各種「動機」,在這些動機之下,所有自律都是枉然--讀者方面的動機相對單純,就是單純的求知慾。
 
DieKlassik C →記者追問:我想確認一下,所以為了提升民眾的「媒體識讀」能力,你們的做法便是讓本來不善於搜尋的通訊軟體使用戶,透過「轉傳」的方式,使機器人代為「搜尋」進而「查證」。而「查證」就是你們認為,「媒體識讀」的實踐方式嗎?(over)
 
Johnson L 我們這個專案目前只能做到讓使用者轉傳這塊。媒體識讀還有很多其他方面,對於我們來說,就是把「降低資訊獲取門檻」這段做好就好。就我們所知,其他 ngo 例如媒體觀察基金會,就會比較關注在媒體識讀的其他方面。就我個人認為,主要還是得靠教育。
 
我朋友說外國小朋友在小學低年級的時候,就要學著對一句話分 opinion 與 fact,例如說讓小朋友在 she ia a teacher 旁邊寫 "f" (fact) ,然後 she is beautiful 是 "o" (opinion) 這樣。我們有些編輯會在回應裡頭寫說,哪些部分是「屬於個人意見」,就是試著引導讀者把個人推測或甚至是煽情的語句,把他們與事實分開。
Q. 過去一陣子有一些經典謠言案例,如「柿子加優酪乳會中毒」或「條碼9字頭是有機食品,8字頭是基改食品條碼」。我想詢問團隊,近期有什麼印象深刻的案例嗎?
 
Johnson L  最近是打開藥罐之後要把棉花與乾燥劑丟掉的例子。這個例子我搜尋到的時候是標成「含有不實訊息」,但我看了看 reference 之後覺得其實要丟掉乾燥劑這件事情是專家意見,而且不知道台灣醫生這麼說,美國也有一些醫學網站這麼說,所以我又發一個回應說是含有真實資訊這樣。
 
 
 另外一個有趣的例子是「不要打開」系列。在 cofacts 裡搜尋「不要打開」有超級多同一份樣板做出來的文章。
 
 
 有時候會覺得這真的很神秘,到底是為什麼會有人這麼無聊,或許是一種惡趣味吧 xD
 
DieKlassik C  →記者:已笑歪XDDD 我很好奇,這類樣板感覺還有其他類型的?可以舉例嗎XD
 
妤庭 魏 一直都有呼籲愛心行動的型的案例,像是老薑爺爺的例子,呼籲line的使用者發揮愛心幫幫忙,購買農產品不要浪費食物,但一經查證,許多時候都是過時資訊。然而仔細一查,這樣的訊息通常將時間序完全混雜再一起,使用者收到問題的當下,問題已經解決、或問題早就不存在,訊息的轉傳反而會造成受幫助對象的困擾。
Johnson L  還有「不要離開該群組」,但少很多:
 
 
DieKlassik C Q. 我想請問你們的最新數據:包括舉報文章數多少?以及「真的假的」line bot好友數?
 
Johnson L  首頁那個「 7835 articles 」就是被舉報文章數。
 Line bot 有效好友數在六月底是 18000。
 
 
DieKlassik C Q. 今年臉書跟Google都有表態說要「打假新聞」,而剛在新加坡舉行的Google News Lab APAC summit似乎也在回應這一部份的努力。我想問,貴團隊在本次大會上最印象深刻的訊息是什麼?大會又帶給「真的假的LINE bot」什麼樣的啟發?
 
Johnson L 我最深的印象是,發現每個國家都有類似的問題。當泰國的公共電視 thai news angency 的 sure and share center 在台上報告說他們在 line 上有很多不實訊息,然後會轉傳的也大多是年長的人的時候,有一種天啊那完全跟我們一樣的感覺。
 
DieKlassik C  →記者:對啊,這感覺是全世界都會面對到的問題......我想說,面對這樣龐大且無孔不入的假訊息/偽新聞等,其一解方似乎就是倚靠群眾的力量,盡力建立資訊交流/溝通的管道(像你們正在做的)。
 
Johnson L 我覺得在群眾闢謠方面做得很好的是印尼的 Mafindo。
Mafindo 裡的參與者都是 volunteer,未來則會加入 full timers。在印尼有大概 3 個 Facebook 群組,會讓大家轉貼想查證的訊息進來,然後開放讓大家自由回應。
其中一個 group 甚至有 40000 人。
Mafindo(Turn back hoax)的志工們會彙整這些 group 的資訊進到一個單一的網站,共用資料庫。
我覺得最酷的是他們會舉辦現下活動,實際的去把他們的這些 group 推廣出去、讓大家明白查證的重要,並且邀集更多的 volunteer 一起做事情。
 
妤庭 魏 長期投入「資訊查核 (Verification)」的跨國組織First Draft有許多工具與資源,讓資訊查證的工作更快速與精準,這些資源的中文化可以帶給台灣的查證者(專業記者或公民編輯)除了文字查證外,照片、影片這些社群媒體上大量轉傳內容的方法。
 
Johnson L 比起啟發,其實我覺得我們著眼的是現在有滿多 actionable item 可以做的。我們還在彙整,未來還會再討論我們與其他這次的與會者要如何繼續這次的合作,還有把我們在這裡聽到的東西給更多人知道。
 

Contact Support



Please check out our How-to Guide and FAQ first to see if your question is already answered! :)

If you have a feature request, please add it to this pad. Thanks!


Log in / Sign up