判決書心證分析

最後編輯:2015-10-12 建立:2015-01-25 歷史紀錄

    MIFFY C目標

MIFFY C司改會在申訴不適任法官與檢察官的過程中發現,許多判決的案情事實、背景近似,適用的法規也雷同,但不同的法官卻做出迥然不同的判決結果,在法定刑與法官自由心證之間是否有法官恣意的問題,因此希望透過資訊工具進行分析量化。

 

    MIFFY C相關專案or參考

MIFFY C貪汙判決分析

裁判書小幫手

Data-Centric Government 的二十大類資料

妨害性自主量刑分析研究小組期中報告-以刑法第221條第1項強制性交罪為例

https://dsp.im/

 

    MIFFY C工作內容

MIFFY C可能方法

  1. 決策樹
  2. 文本關連分析
  3. 從實際案例回推
    1. 去掉部分資訊,ex被告

 

呈現

  1. 判決產生器
  2. 心理測驗

 

目標選定

  1. KOKO初步可先從一位法官單一罪名開始

2. 妨害性自主

3. 或者立基於貪污判決分析的結果,所做出來的database為分析

4. 妨害性自主案件

    妨害性自主的類型通常是不公開案件,沒辦法作…

5. 標的案件

a. 已定讞案件

b. 三審判決確定近十年

c. 由三審判決往三→二→一審抓

    我倒覺得應該從一審抓,因為三審判決常常寫得很簡略。二審是會針對一審的結果決定改判或維持原判,所以結論就是一審無論如何都避不掉。
    Miffy Chen會由三審往回爬資料,是因為必須是已三審定讞的案件,所以先由三審的判決書做判決書的範圍的圈定。
    張淵智法律法源網的判決查詢,會附歷審判決,可能有幫助

 

  • 暫定資料蒐集目標:台灣高等法院 刑事庭法官 曾德水 (2015/02/14)

1. 資料庫:法源,關鍵字:曾德水

  • NINTHDAY S 法源網址:http://www.lawbank.com.tw/

KOKO 2. 時間:以2014年12月31日往前推10年

NINTHDAY S 3. 設定查詢條件:刑事(高等法院)、承審法官:曾德水

4. 撈取資料下載:http://station.ninthday.info/~jeffy/law-bank.zip(2015/05/18)

  • 說明:共抓取曾德水法官資料共 9,995 筆(86年~104年),爲了方便大家瀏覽做了一個目錄菜單方便大家選菜。檔案解壓縮後直接使用瀏覽器開啓根目錄下的 lb_index.html。左邊有一個年份列表,點選後右邊會開啓那個年份的資料列,點選想看的判決書會另外開啓新視窗。
    Ninthday Shih 曾德水法官的案件已經砍好柴了,這幾天料理一下再讓大家夾菜~
      Ninthday Shih祝大家用餐愉快~
  1. KOKO資料欄位
    1. MIFFY C法官姓名
    2. 罪名
    3. 案情事實dropbox
      1. 使用斷詞系統去比對案情結構的相似度→詞句組成及詞頻分析→量化
      2. 決策樹
    4. 判決結果
      1. 刑期
        1. 死刑、無期徒刑、有期徒刑
        2. 如以殺人案件為例,分成死刑、無期徒刑、10年以上有期徒刑;如果是貪污案,則可能可以分為"污多少錢判多少
    5. 判決理由(法官心證)
      1. 使用斷詞系統去比對案情結構的相似度→詞句組成及詞頻分析→量化
        1. 義憤殺人
        2. 小孩殺父母
    淑華我本身有做語言學言辭分析的經驗,如果有需要幫忙可以找我~
    Miffy Chen太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
    淑華目前不會!因為時間卡到了~但可以線上技術交流~
    Miffy Chen好噢!謝謝你 :D
    淑華++

 

  • KOKO判決書內容的用詞語句

MIFFY C「猶不知悔改」前,是指被告前科

「等語云云」前法官說的話,是法官不採的

「惟」是法官的想法

NINA T補充一下,「惟」是轉折語氣,通常是有「但是」的意思,未必完全是法官想法,但會是法官在判決時的考量。(比方說先前判決是XXXX,惟考量OOOO因素,故ZZZZ)

 

MIFFY C最末段為量刑

 

    MIFFY C所需技術

  • MIFFY C爬資料
    Keith Ning搭啦~~~ 今天帶了增援兵力來, 除了肚子吃很撐以外果然也有成果啦!!! 哈哈哈~~~ 這位也是我們同系的學弟, 技術部分也很強~ 今天抓資料的成果就再請他上來簡略描述一下囉 :DDD
    Ninthday Shih嗨,大家好,我是吃飽飽不小心掉坑的蜜蜂,在上次的大松和大家有一面之緣。目前以抓曾德水的資料做測試,分批慢慢的抓回來先放在資料庫裡存放。
    Ninthday Shih阿嘍哈~~更新一下爬資料進度,曾德水法官的案件列表已經抓完,正在一篇篇的抓判決的內容,有9,968篇。溫柔的抓取,沒有使用暴力,所以拉長抓資料的間隔~!請稍待片刻唷~
    Ninthday Shih各位大家好,已經上菜嘍~祝大家用餐愉快 ;)
  • 斷詞
    Keith Ning先來認領一下... 大家好我是格致, 語言基礎的機器分類及學習方法這邊我或許可以幫得上忙 :D
  • 社群網絡分析
  • 語言學言辭分析

 

 

    建議:以下都是考量重點,但一開始可以先盡量簡化,再陸續加上viarables (變數),分階段進行。例如,全部的判決,可以只先看法官是誰、"判決結果"亦即主文的罪名和刑度即可,刑度的部分,可以僅看死刑、徒刑和罰金(併科罰金),而先忽略褫奪公權部分,判決的事實和法官心證形成的理由,也可以在第一階段蒐集資料時先忽略。也就是說,抓data 的範圍應由寬到窄採"十分逼近法",我們只要關心"關聯性"即可,先不用思考太精細的部分。
    Keith Ning根據KOKO上方提到的相同概念, 在資訊科學領域的應用方法就是決策樹, 我這邊附上上次國發會一個類似案例的投影片供大家參考 : 1999 投訴案件最後指派給環保局處理的決策過程 ;
    Keith Ning另一個是Wiki : Dicision Tree 上的圖例, 是根據已沉沒的鐵達尼號乘客的資料以及罹難與否, 反過來看罹難與乘客資訊的關係 : Survival of passengers on the Titanic (當然這例子是有點古怪);
    Keith Ning因此應用在判決書的心證分析上, 我們就需要先針對單一法官的判決書內容進行關鍵因素分析及提取(專家人工), 然後建立出類似像 1999 或是鐵達尼號乘客資訊那樣子能將重點資訊羅列的資料表, 資料量夠的話就可以熵基礎的資訊理論(Entropy-based Information Theory), 用現成的決策樹工具(CART, C4.5, ID3..etc)為基礎建立出上面例子所顯示的決策樹, 也就等於是萃取出了該法官的"心證地圖". 然後接著才能夠進行單一法官或是多個法官的心證分析或預測.
    Miffy Chen我們去訪談一位法官吧XD,在法官的訓練過程中應該是有這方面的訓練,也許可依此建立判決的標準決策樹,然後再試著丟案件進去,看看這個決策樹的判決結果。
    Keith NingOh yeah~ 吃吃喝喝! (誤)
    Koko感謝Keith 的加入~ 資訊人和法律人需要進一步溝通,才會知道我們要如何來解析"法官心證<-->判決"這個玩意兒。因此有拜訪法官的想法。

 

 

普遍性的抓取項目

  1. 法院別:例台北地院、高雄地院。可看城鄉、地域差距。
  2. 案號:例102年度訴字第254號。基本的判決要素,方便回查。
  3. 被告:不同被告會有不同的事實、罪名、刑度,也才能回查。
  4. 判決日期:隨著時間的變遷,法院整體、個別法官可能都會有變化。
  5. 法官
  6. 辯護人:有無辯護人,或誰辯護會對案件結果有影響。
  7. 罪名:例殺人罪。
  8. 有罪否:可能會出現有罪、無罪、其他(例:免訴)
  9. 刑度:要注意有所謂的「宣告刑」和「執行刑」的差別。比較有實質意義的是「執行刑」。另外,考量到定執行刑是數罪併罰的結果,在分析刑度上其實還要納入罪數的考量。
  10. 案由:例詐欺。因為在抓取上非常容易,沒什麼理由不抓。好處是可以將不同案件很大略地分類,缺點是並不精確。

以上為各類案件皆重要且容易抓的項目。

 

 

各罪論的差異

犯罪事實、證據取捨、量刑因素隨著不同的案件類型,會有不同的常見模式或是問題。但是這麼內容分析的東西,我實在不知道怎麼用程式來作分析,有點難以想像。

以收受賄賂類的案件為例,我們在看案件時會重視的證據有:金流證明(提存款記錄、帳冊)、違背或不違背職務的行為、送錢者的證詞、共犯證詞。此類案件送錢者、共犯的證詞常常是定罪的關鍵,而最容易出問題的狀況就是直接證據只有送錢者(即白手套)的證詞,另外就是檢調為了取供而讓涉案者轉汙點證人,調查局的不正訊問(之後會出現翻供的問題)。

以販毒案為例,我們在看案件時會重視的證據有:毒品類型(一級、二級)、重量、有無通聯、有無監聽譯文、監聽譯文有無暗語、證人證詞、是否有販毒相關工具(分裝袋、磅秤、帳冊)、是否釣魚辦案。其中證人證詞最常出現問題,因為證人供出毒品來源可減刑,然後吸毒者供詞也經常反覆。然後販毒案非常常見的抗辯是合購、代買,行為類型很像,但是因為涉及販賣、轉讓、幫助吸食的差異,所以在判斷上又很難分。所以販毒案比較容易出現坐雲霄飛車的情形,一審判無期,二審判一年,或是剛好倒過來。

以幫助詐欺案件(但宣稱帳戶被盜用)為例,我們在看案件時會重視的證據有:帳戶被盜者被騙經過的證據(求職剪報、通聯、即時通、e-mail、line…)、掛失止付的記錄、報警記錄、窘迫處境的證據、帳戶狀況(是否常用、裡面是否有錢)。不過更為嚴重的與其說是證據取捨,而是例稿判決的問題。也就是不怎麼查,就直接判有罪的問題。

也就是說,不同的案件類型,真的值得分析的東西其實很不一樣(性侵類就先不說了,反正絕大多數是不公開判決),要怎麼用程式來抓這些分析要素,我真的不太懂…。

    jennyjmgbwcy@gmail.com請問例稿判決的話是不是在判決書上就會出現制式文句?如果是的話可以用文句比對之類的方法來判斷嗎?

另外,如果要監督法官的不當判決,還有另一種方式,就是看例稿駁回數。

之前我有做過刑訴361條,上訴二審未附具體理由。原本的立法意旨是避免空白上訴,結果有部分的二審法官濫用,只要他覺得上訴理由看起來沒什麼道理就直接駁掉,根本不開庭。把哪些法官最常用361駁回上訴,其中有多少件是幾乎相同的例稿,可以用來了解法官的認真度。

也就是說,可以詢問律師,知不知道實務上有哪些打混摸魚的判決方式,掌握這種模式,透過程式來抓出哪些法官喜歡用這種模式來判案,就可以了解這個法官的認真度。

 

    MIFFY C參考文獻

"Competing Approaches to Predicting Supreme Court Decision Making" (2004) (http://www.wusct.wustl.edu/media/man1.pdf)

    這篇文章其實是這個model 的簡明版介紹,裡面有提到他們是如何建立這個model,和對照組就是以"法律人"的組成來判斷聯邦最高法院的判決。方式值得參考。

 

    Ninthday Shih
    本文就是在玩一種猜猜看的遊戲。比較專家和統計誰比較會預測最高法院(或某個法官)的決定。專家就是考量各種因素作出預測,而統計就是依據過去的案例來作預測。
    統計作預測的方式是:抓取案件中的某些特徵,從過去擁有某些特徵會傾向得出某些結果,來預測在將來出現有類似特徵的案件,最高法院就會作出類似決定。
    舉例:預測O’Connor法官(保守派)的決定
    1.下級法院的決定是自由派的?是,則撤銷改判
    不是的話,則往下走。
    2.案件是來自於第二、三、特區、聯邦巡迴上訴法院?是,則維持。不是的話,則往下走…(請自行參figure 1)
    *這邊我不是很懂,案件來自哪個法院,為何與O’Connor法官的決定有關?可能是因為我不了解美國法院的生態就是了。
    也就是說,統計作預測的方式,是以在言詞辯論前即已存在的某些特徵,來預測言詞辯論後的結果。但是本文也強調,此處抓取的特徵與決定的結果,在解釋上並沒有因果關係,比較像是相關而已。
    jennyjmgbwcy@gmail.com而本文的結論是:統計作的預測比專家作的預測來得準。
    jennyjmgbwcy@gmail.com我目前看不出來本文是用程式去抓取相關特徵而得出。甚至我覺得資料庫比較像靠手工完成的(或至少有部分必須靠手工)。理由就是:一個決定到底屬於自由派或保守派,其實難以單靠電腦程式來判斷,或者至少是,如果是用電腦程式來判斷,我看不出本文是如何設計這個程式。
    本文對我的啟示是:其實不一定要抓取很多判決的細節,有些看似很容易抓取的特徵,對結果來說,就有一定程度的預測性。
    不過如果從監督法官判決的角度來看,我覺得本文的啟示性有限。
    jennyjmgbwcy@gmail.com關於二呆林所說「一個決定到底屬於自由派或保守派」,我覺得可能是先判斷做出決定的法官屬於保守派或自由派(藉由法官判決以外的言論表態甚至是其選民性質,事先預設法官屬性),再依照法官判斷該決定屬於保守或自由派。