"網軍分身" vs "正常使用者" Classification

最後編輯:2016-12-14 建立:2015-04-01 歷史紀錄
  • CHE-AN W理想結果

 

 

  • Why? :為什麼要做這個
    • PTT 上站人數異常 有養分身嫌疑 http://www.appledaily.com.tw/realtimenews/article/life/20150330/583462/
    • 阻止網軍影響言論的歪風
    • 或許可以提供給鄉民或版主參考 辨認不正常使用者

 

  • How? :打算怎麼做,授權方式
    • 發展一套 Classification 演算法 判斷 "網軍分身" or "其他使用者" 可能也會有 "灰色地帶待觀察"
    • 授權 : LGPL

 

  • Need?:需要哪些技術
    • 鄉民Marketing
    • 熟知PTT系統 鄉民文化
    • Machine learning classification feature decision
    • Big data collection

 

======================================================================================================

  1. 可能使用feature
    1. 晚一點再來整理FB上大家給的建議
  2. 資料收集
  3. 工具使用
    1. Machine Learning Tool - Weka http://www.cs.waikato.ac.nz/ml/weka/
    2. 非主流使用者分析: http://zbryikt.github.io/visualize/ptt-user/
    3. ptt 爬蟲: http://github.com/zbryikt/ptt-crawler
    4. google 條件搜尋 http://www.gtwang.org/2013/10/tips-use-google-search-efficiently.html