判決書心證分析
目標
司改會在申訴不適任法官與檢察官的過程中發現,許多判決的案情事實、背景近似,適用的法規也雷同,但不同的法官卻做出迥然不同的判決結果,在法定刑與法官自由心證之間是否有法官恣意的問題,因此希望透過資訊工具進行分析量化。
相關專案or參考
Data-Centric Government 的二十大類資料
妨害性自主量刑分析研究小組期中報告-以刑法第221條第1項強制性交罪為例
https://dsp.im/
工作內容
可能方法
- 決策樹
- 文本關連分析
- 從實際案例回推
- 去掉部分資訊,ex被告
呈現
- 判決產生器
- 心理測驗
目標選定
- 初步可先從一位法官單一罪名開始
2. 妨害性自主
3. 或者立基於貪污判決分析的結果,所做出來的database為分析
4. 妨害性自主案件
5. 標的案件
a. 已定讞案件
b. 三審判決確定近十年
c. 由三審判決往三→二→一審抓
- 暫定資料蒐集目標:台灣高等法院 刑事庭法官 曾德水 (2015/02/14)
1. 資料庫:法源,關鍵字:曾德水
- 法源網址:http://www.lawbank.com.tw/
2. 時間:以2014年12月31日往前推10年
3. 設定查詢條件:刑事(高等法院)、承審法官:曾德水
4. 撈取資料下載:http://station.ninthday.info/~jeffy/law-bank.zip(2015/05/18)
- 說明:共抓取曾德水法官資料共 9,995 筆(86年~104年),爲了方便大家瀏覽做了一個目錄菜單方便大家選菜。檔案解壓縮後直接使用瀏覽器開啓根目錄下的 lb_index.html。左邊有一個年份列表,點選後右邊會開啓那個年份的資料列,點選想看的判決書會另外開啓新視窗。
- 資料欄位
- 法官姓名
- 罪名
- 案情事實dropbox
- 使用斷詞系統去比對案情結構的相似度→詞句組成及詞頻分析→量化
- 決策樹
- 判決結果
- 刑期
- 死刑、無期徒刑、有期徒刑
- 如以殺人案件為例,分成死刑、無期徒刑、10年以上有期徒刑;如果是貪污案,則可能可以分為"污多少錢判多少
- 判決理由(法官心證)
- 使用斷詞系統去比對案情結構的相似度→詞句組成及詞頻分析→量化
- 義憤殺人
- 小孩殺父母
- 判決書內容的用詞語句
「猶不知悔改」前,是指被告前科
「等語云云」前法官說的話,是法官不採的
「惟」是法官的想法
補充一下,「惟」是轉折語氣,通常是有「但是」的意思,未必完全是法官想法,但會是法官在判決時的考量。(比方說先前判決是XXXX,惟考量OOOO因素,故ZZZZ)
最末段為量刑
所需技術
- 爬資料
- 斷詞
- 機器學習(決策樹):格致
- 社群網絡分析
- 語言學言辭分析
普遍性的抓取項目
- 法院別:例台北地院、高雄地院。可看城鄉、地域差距。
- 案號:例102年度訴字第254號。基本的判決要素,方便回查。
- 被告:不同被告會有不同的事實、罪名、刑度,也才能回查。
- 判決日期:隨著時間的變遷,法院整體、個別法官可能都會有變化。
- 法官
- 辯護人:有無辯護人,或誰辯護會對案件結果有影響。
- 罪名:例殺人罪。
- 有罪否:可能會出現有罪、無罪、其他(例:免訴)
- 刑度:要注意有所謂的「宣告刑」和「執行刑」的差別。比較有實質意義的是「執行刑」。另外,考量到定執行刑是數罪併罰的結果,在分析刑度上其實還要納入罪數的考量。
- 案由:例詐欺。因為在抓取上非常容易,沒什麼理由不抓。好處是可以將不同案件很大略地分類,缺點是並不精確。
以上為各類案件皆重要且容易抓的項目。
各罪論的差異
犯罪事實、證據取捨、量刑因素隨著不同的案件類型,會有不同的常見模式或是問題。但是這麼內容分析的東西,我實在不知道怎麼用程式來作分析,有點難以想像。
以收受賄賂類的案件為例,我們在看案件時會重視的證據有:金流證明(提存款記錄、帳冊)、違背或不違背職務的行為、送錢者的證詞、共犯證詞。此類案件送錢者、共犯的證詞常常是定罪的關鍵,而最容易出問題的狀況就是直接證據只有送錢者(即白手套)的證詞,另外就是檢調為了取供而讓涉案者轉汙點證人,調查局的不正訊問(之後會出現翻供的問題)。
以販毒案為例,我們在看案件時會重視的證據有:毒品類型(一級、二級)、重量、有無通聯、有無監聽譯文、監聽譯文有無暗語、證人證詞、是否有販毒相關工具(分裝袋、磅秤、帳冊)、是否釣魚辦案。其中證人證詞最常出現問題,因為證人供出毒品來源可減刑,然後吸毒者供詞也經常反覆。然後販毒案非常常見的抗辯是合購、代買,行為類型很像,但是因為涉及販賣、轉讓、幫助吸食的差異,所以在判斷上又很難分。所以販毒案比較容易出現坐雲霄飛車的情形,一審判無期,二審判一年,或是剛好倒過來。
以幫助詐欺案件(但宣稱帳戶被盜用)為例,我們在看案件時會重視的證據有:帳戶被盜者被騙經過的證據(求職剪報、通聯、即時通、e-mail、line…)、掛失止付的記錄、報警記錄、窘迫處境的證據、帳戶狀況(是否常用、裡面是否有錢)。不過更為嚴重的與其說是證據取捨,而是例稿判決的問題。也就是不怎麼查,就直接判有罪的問題。
也就是說,不同的案件類型,真的值得分析的東西其實很不一樣(性侵類就先不說了,反正絕大多數是不公開判決),要怎麼用程式來抓這些分析要素,我真的不太懂…。
另外,如果要監督法官的不當判決,還有另一種方式,就是看例稿駁回數。
之前我有做過刑訴361條,上訴二審未附具體理由。原本的立法意旨是避免空白上訴,結果有部分的二審法官濫用,只要他覺得上訴理由看起來沒什麼道理就直接駁掉,根本不開庭。把哪些法官最常用361駁回上訴,其中有多少件是幾乎相同的例稿,可以用來了解法官的認真度。
也就是說,可以詢問律師,知不知道實務上有哪些打混摸魚的判決方式,掌握這種模式,透過程式來抓出哪些法官喜歡用這種模式來判案,就可以了解這個法官的認真度。
參考文獻
"Competing Approaches to Predicting Supreme Court Decision Making" (2004) (http://www.wusct.wustl.edu/media/man1.pdf)