判決書心證分析

編輯歷史

時間 作者 版本
2015-10-12 11:39 – 11:39 蔡維哲 r2188 – r2189
顯示 diff
(144 行未修改)
2015-05-18 07:48 – 07:58 Ninthday Shih r1987 – r2187
顯示 diff
(40 行未修改)
2. 時間:以2014年12月31日往前推1蒐年
3. 設定查詢條件:刑事(高等法院)、承審法官:曾德水
- * 曾德水法官的案件已經砍好柴了,這幾天料理一下再讓大家夾菜~位
+ 4. 撈取資料下載:http://station.ninthday.info/~jeffy/law-bank.zip(2015/)5/18
+
+ * 說明:共抓取曾德水法官資料共 9,995 筆(86年~104年),爲了方便大家瀏覽做了一個目錄菜單方便大家選菜。檔案解壓縮後直接使用瀏覽器開啓根目錄下的 lb_index.html。左邊有一個年份列表,點選後右邊會開啓那個年份的資料列,點選想看的判決書會另外開啓新視窗。* 曾德水法官的案件已經砍好柴了,這幾天料理一下再讓大家夾菜~位
+ *祝大家用餐愉快~
*法官姓名
*罪名
(29 行未修改)
*搭啦~~~ 今天帶了增援兵力來, 除了肚子吃很撐以外果然也有成果啦!!! 哈哈哈~~~ 這位也是我們同系的學弟, 技術部分也很強~ 今天抓資料的成果就再請他上來簡略描述一下囉 :DDD
*嗨,大家好,我是吃飽飽不小心掉坑的蜜蜂,在上次的大松和大家有一面之緣。目前以抓曾德水的資料做測試,分批慢慢的抓回來先放在資料庫裡存放。
- *阿嘍哈~~更新一下爬資料進度,曾德水法官的案件列表已經抓完,正在一篇篇的抓判決的內容,有9,968篇。溫柔的抓取,沒有使用暴力,所以拉長抓資料的間隔~!請稍待片刻唷~*機器學習(決策樹):格致
+ *阿嘍哈~~更新一下爬資料進度,曾德水法官的案件列表已經抓完,正在一篇篇的抓判決的內容,有9,968篇。溫柔的抓取,沒有使用暴力,所以拉長抓資料的間隔~!請稍待片刻唷~*
+ *各位大家好,已經上菜嘍~祝大家用餐愉快 ;)機器學習(決策樹):格致
*先來認領一下... 大家好我是格致, 語言基礎的機器分類及學習方法這邊我或許可以幫得上忙 :D
*社群網絡分析
(61 行未修改)
2015-05-13 12:56 – 13:04 jennyjmgbwcy@gmail.com r1930 – r1986
顯示 diff
(109 行未修改)
以幫助詐欺案件(但宣稱帳戶被盜用)為例,我們在看案件時會重視的證據有:帳戶被盜者被騙經過的證據(求職剪報、通聯、即時通、e-mail、line…)、掛失止付的記錄、報警記錄、窘迫處境的證據、帳戶狀況(是否常用、裡面是否有錢)。不過更為嚴重的與其說是證據取捨,而是例稿判決的問題。也就是不怎麼查,就直接判有罪的問題。
也就是說,不同的案件類型,真的值得分析的東西其實很不一樣(性侵類就先不說了,反正絕大多數是不公開判決),要怎麼用程式來抓這些分析要素,我真的不太懂…。
- 另外,如果要監督法官的不當判決,還有另一種方式,就是看例稿駁回數。
+ 另外,如果
+ *請問例稿判決的話是不是在判決書上就會出現制式文句?如果是的話可以用文句比對之類的方法來判斷嗎?要監督法官的不當判決,還有另一種方式,就是看例稿駁回數。
之前我有做過刑訴361條,上訴二審未附具體理由。原本的立法意旨是避免空白上訴,結果有部分的二審法官濫用,只要他覺得上訴理由看起來沒什麼道理就直接駁掉,根本不開庭。把哪些法官最常用361駁回上訴,其中有多少件是幾乎相同的例稿,可以用來了解法官的認真度。
也就是說,可以詢問律師,知不知道實務上有哪些打混摸魚的判決方式,掌握這種模式,透過程式來抓出哪些法官喜歡用這種模式來判案,就可以了解這個法官的認真度。
(20 行未修改)
*不過如果從監督法官判決的角度來看,我覺得本文的啟示性有限。
+ *
+ 關於二呆林提出的[所說個決定到底屬於自由派或保守派,我覺得可能是依照做先判斷定的法官屬於保守派或自由派,再依(藉由法官判決以外的言論表態甚至是其選民性質,事先預設法官屬性)照法官判斷定判斷決定屬於保守或自由派。
*
2015-05-13 12:55 (unknown) r1929
顯示 diff
(137 行未修改)
2015-05-13 12:54 – 12:55 jennyjmgbwcy@gmail.com r1924 – r1928
顯示 diff
(126 行未修改)
**這邊我不是很懂,案件來自哪個法院,為何與O’Connor法官的決定有關?可能是因為我不了解美國法院的生態就是了。
*也就是說,統計作預測的方式,是以在言詞辯論前即已存在的某些特徵,來預測言詞辯論後的結果。但是本文也強調,此處抓取的特徵與決定的結果,在解釋上並沒有因果關係,比較像是相關而已。
- *而本文的結論是:統計作的預測比專家作的預測來得準。
+ *而本文的結*是:統計作的預測比專家作的預測來得準。
*
- *我目前看不出來本文是用程式去抓取相關特徵而得出。甚至我覺得資料庫比較像靠手工完成的(或至少有部分必須靠手工)。理由就是:一個決定到底屬於自由派或保守派,其實難以單靠電腦程式來判斷,或者至少是,如果是用電腦程式來判斷,我看不出本文是如何設計這個程式。
+ *我目前看不*來本文是用程式去抓取相關特徵而得出。甚至我覺得資料庫比較像靠手工完成的(或至少有部分必須靠手工)。理由就是:一個決定到底屬於自由派或保守派,其實難以單靠電腦程式來判斷,或者至少是,如果是用電腦程式來判斷,我看不出本文是如何設計這個程式。
*
*本文對我的啟示是:其實不一定要抓取很多判決的細節,有些看似很容易抓取的特徵,對結果來說,就有一定程度的預測性。
*
*不過如果從監督法官判決的角度來看,我覺得本文的啟示性有限。
+
+ *
2015-05-11 20:27 – 20:29 Nina Meng-Chen Tsou r1907 – r1923
顯示 diff
(65 行未修改)
「惟」是法官的想法
- 最末段為量刑
+ 最末段
+ 補充一下,「惟」是轉折語氣,通常是有「但是」的意思,未必完全是法官想法,但會是法官在判決時的考量。(比方說先前判決是XXXX,惟考量OOOO因素,故ZZZZ)為量刑
*所需技術
(64 行未修改)
2015-05-11 07:55 – 08:10 Ninthday Shih r1863 – r1906
顯示 diff
(39 行未修改)
* 法源網址:http://www.lawbank.com.tw/
2. 時間:以2014年12月31日往前推1蒐年
- 3. 設定查詢條件:刑事(高等法院)、承審法官:曾德水 欄位
+ 3. 設定查詢條件:刑事(高等法院)、承審法官:曾德水
+ * 曾德水法官的案件已經砍好柴了,這幾天料理一下再讓大家夾菜~位
*法官姓名
*罪名
(89 行未修改)
2015-05-08 14:48 – 14:55 Ninthday Shih r1782 – r1862
顯示 diff
(71 行未修改)
*搭啦~~~ 今天帶了增援兵力來, 除了肚子吃很撐以外果然也有成果啦!!! 哈哈哈~~~ 這位也是我們同系的學弟, 技術部分也很強~ 今天抓資料的成果就再請他上來簡略描述一下囉 :DDD
- *嗨,大家好,我是吃飽飽不小心掉坑的蜜蜂,在上次的大松和大家有一面之緣。目前以抓曾德水的資料做測試,分批慢慢的抓回來先放在資料庫裡存放。*機器學習(決策樹):格致
+ *嗨,大家好,我是吃飽飽不小心掉坑的蜜蜂,在上次的大松和大家有一面之緣。目前以抓曾德水的資料做測試,分批慢慢的抓回來先放在資料庫裡存放。
+ *阿嘍哈~~更新一下爬資料進度,曾德水法官的案件列表已經抓完,正在一篇篇的抓判決的內容,有9,968篇。溫柔的抓取,沒有使用暴力,所以拉長抓資料的間隔~!請稍待片刻唷~*機器學習(決策樹):格致
*先來認領一下... 大家好我是格致, 語言基礎的機器分類及學習方法這邊我或許可以幫得上忙 :D
*社群網絡分析
(56 行未修改)
2015-04-30 11:21 – 11:22 Miffy Chen r1773 – r1781
顯示 diff
(2 行未修改)
司改會在申訴不適任法官與檢察官的過程中發現,許多判決的案情事實、背景近似,適用的法規也雷同,但不同的法官卻做出迥然不同的判決結果,在法定刑與法官自由心證之間是否有法官恣意的問題,因此希望透過資訊工具進行分析量化。
- *相關專案
+ *相關專案or參考
貪汙判決分析
裁判書小幫手
Data-Centric Government 的二十大類資料
妨害性自主量刑分析研究小組期中報告-以刑法第221條第1項強制性交罪為例
+ https://dsp.im/
*工作內容
(120 行未修改)
2015-04-19 08:20 – 08:40 Ninthday Shih r1658 – r1772
顯示 diff
(38 行未修改)
* 法源網址:http://www.lawbank.com.tw/
2. 時間:以2014年12月31日往前推1蒐年
- 3. 條件:刑事(高等法院)、承審法官:曾德水 欄位
+ 3. 設定查詢條件:刑事(高等法院)、承審法官:曾德水 欄位
*法官姓名
*罪名
(26 行未修改)
*斷詞
- *搭啦~~~ 今天帶了增援兵力來, 除了肚子吃很撐以外果然也有成果啦!!! 哈哈哈~~~ 這位也是我們同系的學弟, 技術部分也很強~ 今天抓資料的成果就再請他上來簡略描述一下囉 :DDD*機器學習(決策樹):格致
+ *搭啦~~~ 今天帶了增援兵力來, 除了肚子吃很撐以外果然也有成果啦!!! 哈哈哈~~~ 這位也是我們同系的學弟, 技術部分也很強~ 今天抓資料的成果就再請他上來簡略描述一下囉 :DDD
+ *嗨,大家好,我是吃飽飽不小心掉坑的蜜蜂,在上次的大松和大家有一面之緣。目前以抓曾德水的資料做測試,分批慢慢的抓回來先放在資料庫裡存放。*機器學習(決策樹):格致
*先來認領一下... 大家好我是格致, 語言基礎的機器分類及學習方法這邊我或許可以幫得上忙 :D
*社群網絡分析
(38 行未修改)
*這篇文章其實是這個model 的簡明版介紹,裡面有提到他們是如何建立這個model,和對照組就是以"法律人"的組成來判斷聯邦最高法院的判決。方式值得參考。
- *本文就是在玩一種猜猜看的遊戲。比較專家和統計誰比較會預測最高法院(或某個法官)的決定。專家就是考量各種因素作出預測,而統計就是依據過去的案例來作預測。
+ *本文就是在*
+ 玩一種猜猜看的遊戲。比較專家和統計誰比較會預測最高法院(或某個法官)的決定。專家就是考量各種因素作出預測,而統計就是依據過去的案例來作預測。
*統計作預測的方式是:抓取案件中的某些特徵,從過去擁有某些特徵會傾向得出某些結果,來預測在將來出現有類似特徵的案件,最高法院就會作出類似決定。
*舉例:預測O’Connor法官(保守派)的決定
(12 行未修改)
2015-04-18 13:50 – 13:53 Keith Ning r1612 – r1657
顯示 diff
(68 行未修改)
*爬資料
*斷詞
- *機器學習(決策樹):格致
+
+ *搭啦~~~ 今天帶了增援兵力來, 除了肚子吃很撐以外果然也有成果啦!!! 哈哈哈~~~ 這位也是我們同系的學弟, 技術部分也很強~ 今天抓資料的成果就再請他上來簡略描述一下囉 :DDD*機器學習(決策樹):格致
*先來認領一下... 大家好我是格致, 語言基礎的機器分類及學習方法這邊我或許可以幫得上忙 :D
*社群網絡分析
(55 行未修改)
2015-04-18 04:31 – 05:38 Ninthday Shih r1575 – r1611
顯示 diff
(36 行未修改)
(2015/02/14)
1. 資料庫:法源,關鍵字:曾德水
- 2. 時間:以2014年12月31日往前推1蒐年 欄位
+ * 法源網址:http://www.lawbank.com.tw/
+ 2. 時間:以2014年12月31日往前推1蒐年
+ 3. 條件:刑事(高等法院)、承審法官:曾德水 欄位
*法官姓名
*罪名
*案情事實
- *使用斷詞系統去比對案情結構的相似度→詞句組成及詞頻分析→量化
+ *使用斷dropbox詞系統去比對案情結構的相似度→詞句組成及詞頻分析→量化
*決策樹
*判決結果
(81 行未修改)
2015-02-14 05:58 – 06:32 Koko r1259 – r1574
顯示 diff
(20 行未修改)
目標選定
- *初步可先從一位法官單一罪名開始
- * a. 初步討論:台灣高等法院曾德水法官 (討論日期:2015/
- 2/14)* b. 以2014年年底為準,往前推10年
- *
- 2. 妨害性自主
- *或者立基於貪污判決分析的結果,所做出來的database為分析
- *先抓確定的案件
- *妨害性自主的類型通常是不公開案件,沒辦法作…
- *已定讞案件
- *三審判決確定近十年
+ *初步可先從一位法官單一罪名開始
+ . 妨害性自主
+ * 3. 者立基於貪污判決分析的結果,所做出來的database為分析
+ * 4. 妨害性自主案件*妨害性自主的類型通常是不公開案件,沒辦法作…
- **由三審
- *判決往三→二→一審抓
+ 5. 標的案件定a. 讞案件
+ *三b. 判決確定近十年
+ *由c. 審判決往三→二→一審抓
*我倒覺得應該從一審抓,因為三審判決常常寫得很簡略。二審是會針對一審的結果決定改判或維持原判,所以結論就是一審無論如何都避不掉。
*會由三審往回爬資料,是因為必須是已三審定讞的案件,所以先由三審的判決書做判決書的範圍的圈定。
*法律法源網的判決查詢,會附歷審判決,可能有幫助
- 暫定資料蒐集目標:高等法院 刑事庭法官曾德水
+ 暫定*資料蒐集目標:高等台灣法院 刑事庭法官曾德水
- 資料欄位
+ (2015/02/14)
+ 1. 資料庫:法源,關鍵字:曾德水
+ 2. 時間:以2014年12月31日往前推1蒐年 欄位
*法官姓名
*罪名
(15 行未修改)
*++
- 「猶不知悔改」前是前科
- 「等語云云」前是法官不採的
+ 「猶*判決書內容的用詞語句
+ 不知悔改」前是前,科指被告
+ 「等語云云」前是法法官說的話,官不採的
「惟」是法官的想法
(63 行未修改)
2015-02-14 05:58 – 05:58 Keith Ning r1257 – r1258
顯示 diff
(37 行未修改)
*法律法源網的判決查詢,會附歷審判決,可能有幫助
- 暫定資料蒐集目標:高等法院 曾德水
+ 暫定資料蒐集目標:高等法院 刑事庭法官曾德水
資料欄位
(86 行未修改)
2015-02-14 05:51 – 05:56 Koko r1182 – r1256
顯示 diff
(21 行未修改)
目標選定
*初步可先從一位法官單一罪名開始
- 1. 殺人罪
+ * a. 初步討論:台灣高等法院曾德水法官 (討論日期:2015/
+ 2/14)* b. 以2014年年底為準,往前推10年
+ *
2. 妨害性自主
*或者立基於貪污判決分析的結果,所做出來的database為分析
(2 行未修改)
*已定讞案件
*三審判決確定近十年
- *由三審判決往三→二→一審抓
+
+ **由三審
+ *判決往三→二→一審抓
*我倒覺得應該從一審抓,因為三審判決常常寫得很簡略。二審是會針對一審的結果決定改判或維持原判,所以結論就是一審無論如何都避不掉。
*會由三審往回爬資料,是因為必須是已三審定讞的案件,所以先由三審的判決書做判決書的範圍的圈定。
(91 行未修改)
2015-02-14 05:33 – 05:41 Keith Ning r1160 – r1181
顯示 diff
(32 行未修改)
*會由三審往回爬資料,是因為必須是已三審定讞的案件,所以先由三審的判決書做判決書的範圍的圈定。
*法律法源網的判決查詢,會附歷審判決,可能有幫助
+
+ 暫定資料蒐集目標:高等法院 曾德水
資料欄位
(53 行未修改)
*案由:例詐欺。因為在抓取上非常容易,沒什麼理由不抓。好處是可以將不同案件很大略地分類,缺點是並不精確。
以上為各類案件皆重要且容易抓的項目。
+
各罪論的差異
(28 行未修改)
2015-02-14 05:22 – 05:31 Koko r1110 – r1159
顯示 diff
(21 行未修改)
目標選定
*初步可先從一位法官單一罪名開始
- *殺人罪
- *妨害性自主
- *強姦罪
- *猥褻
+ 1. 殺人罪
+ 2. 妨害性自主
*或者立基於貪污判決分析的結果,所做出來的database為分析
*先抓確定的案件
(94 行未修改)
2015-02-14 03:48 – 04:46 Miffy Chen r1021 – r1109
顯示 diff
(6 行未修改)
裁判書小幫手
Data-Centric Government 的二十大類資料
+ 妨害性自主量刑分析研究小組期中報告-以刑法第221條第1項強制性交罪為例
*工作內容
(1 行未修改)
*決策樹
*文本關連分析
+ *從實際案例回推
+ *去掉部分資訊,ex被告
+
+ 呈現
+ *判決產生器
+ *心理測驗
目標選定
- *初步可先從個別罪名單純的項目開始
+ *初步可先從一位法官單一罪名開始
*殺人罪
*妨害性自主
(9 行未修改)
*會由三審往回爬資料,是因為必須是已三審定讞的案件,所以先由三審的判決書做判決書的範圍的圈定。
*法律法源網的判決查詢,會附歷審判決,可能有幫助
+
資料欄位
*法官姓名
(15 行未修改)
*好噢!謝謝你 :D
*++
+
+ 「猶不知悔改」前是前科
+ 「等語云云」前是法官不採的
+ 「惟」是法官的想法
+
+ 最末段為量刑
*所需技術
(59 行未修改)
2015-02-03 07:39 – 07:41 Koko r995 – r1020
顯示 diff
(63 行未修改)
*我們去訪談一位法官吧XD,在法官的訓練過程中應該是有這方面的訓練,也許可依此建立判決的標準決策樹,然後再試著丟案件進去,看看這個決策樹的判決結果。
*Oh yeah~ 吃吃喝喝! (誤)
+ *感謝Keith 的加入~ 資訊人和法律人需要進一步溝通,才會知道我們要如何來解析"法官心證<-->判決"這個玩意兒。因此有拜訪法官的想法。
普遍性的抓取項目
(41 行未修改)
2015-02-03 06:51 – 06:51 Keith Ning r984 – r994
顯示 diff
(62 行未修改)
*因此應用在判決書的心證分析上, 我們就需要先針對單一法官的判決書內容進行關鍵因素分析及提取(專家人工), 然後建立出類似像 1999 或是鐵達尼號乘客資訊那樣子能將重點資訊羅列的資料表, 資料量夠的話就可以熵基礎的資訊理論(Entropy-based Information Theory), 用現成的決策樹工具(CART, C4.5, ID3..etc)為基礎建立出上面例子所顯示的決策樹, 也就等於是萃取出了該法官的"心證地圖". 然後接著才能夠進行單一法官或是多個法官的心證分析或預測.
*我們去訪談一位法官吧XD,在法官的訓練過程中應該是有這方面的訓練,也許可依此建立判決的標準決策樹,然後再試著丟案件進去,看看這個決策樹的判決結果。
+ *Oh yeah~ 吃吃喝喝! (誤)
普遍性的抓取項目
(41 行未修改)
2015-02-03 06:47 – 06:49 Miffy Chen r952 – r983
顯示 diff
(61 行未修改)
(當然這例子是有點古怪);
*因此應用在判決書的心證分析上, 我們就需要先針對單一法官的判決書內容進行關鍵因素分析及提取(專家人工), 然後建立出類似像 1999 或是鐵達尼號乘客資訊那樣子能將重點資訊羅列的資料表, 資料量夠的話就可以熵基礎的資訊理論(Entropy-based Information Theory), 用現成的決策樹工具(CART, C4.5, ID3..etc)為基礎建立出上面例子所顯示的決策樹, 也就等於是萃取出了該法官的"心證地圖". 然後接著才能夠進行單一法官或是多個法官的心證分析或預測.
+ *我們去訪談一位法官吧XD,在法官的訓練過程中應該是有這方面的訓練,也許可依此建立判決的標準決策樹,然後再試著丟案件進去,看看這個決策樹的判決結果。
普遍性的抓取項目
(41 行未修改)
2015-02-03 06:25 – 06:46 Keith Ning r768 – r951
顯示 diff
(57 行未修改)
* 建議:以下都是考量重點,但一開始可以先盡量簡化,再陸續加上viarables (變數),分階段進行。例如,全部的判決,可以只先看法官是誰、"判決結果"亦即主文的罪名和刑度即可,刑度的部分,可以僅看死刑、徒刑和罰金(併科罰金),而先忽略褫奪公權部分,判決的事實和法官心證形成的理由,也可以在第一階段蒐集資料時先忽略。也就是說,抓data 的範圍應由寬到窄採"十分逼近法",我們只要關心"關聯性"即可,先不用思考太精細的部分。
+ *根據KOKO上方提到的相同概念, 在資訊科學領域的應用方法就是決策樹, 我這邊附上上次國發會一個類似案例的投影片供大家參考 : 1999 投訴案件最後指派給環保局處理的決策過程 ;
+ *另一個是Wiki : Dicision Tree 上的圖例, 是根據已沉沒的鐵達尼號乘客的資料以及罹難與否, 反過來看罹難與乘客資訊的關係 : Suvival of passengers on the Titanic
+ (當然這例子是有點古怪);
+ *因此應用在判決書的心證分析上, 我們就需要先針對單一法官的判決書內容進行關鍵因素分析及提取(專家人工), 然後建立出類似像 1999 或是鐵達尼號乘客資訊那樣子能將重點資訊羅列的資料表, 資料量夠的話就可以熵基礎的資訊理論(Entropy-based Information Theory), 用現成的決策樹工具(CART, C4.5, ID3..etc)為基礎建立出上面例子所顯示的決策樹, 也就等於是萃取出了該法官的"心證地圖". 然後接著才能夠進行單一法官或是多個法官的心證分析或預測.
普遍性的抓取項目
(41 行未修改)
2015-02-03 06:24 Miffy Chen r767
顯示 diff
(102 行未修改)
2015-02-03 06:20 – 06:22 Keith Ning r739 – r766
顯示 diff
(51 行未修改)
*斷詞
*機器學習(決策樹):格致
+ *先來認領一下... 大家好我是格致, 語言基礎的機器分類及學習方法這邊我或許可以幫得上忙 :D
*社群網絡分析
*語言學言辭分析
(46 行未修改)
2015-02-02 17:06 – 17:06 張淵智 r732 – r738
顯示 diff
(26 行未修改)
*我倒覺得應該從一審抓,因為三審判決常常寫得很簡略。二審是會針對一審的結果決定改判或維持原判,所以結論就是一審無論如何都避不掉。
*會由三審往回爬資料,是因為必須是已三審定讞的案件,所以先由三審的判決書做判決書的範圍的圈定。
+ *法律法源網的判決查詢,會附歷審判決,可能有幫助
資料欄位
*法官姓名
(70 行未修改)
2015-02-02 08:31 – 08:42 Miffy Chen r679 – r731
顯示 diff
(7 行未修改)
Data-Centric Government 的二十大類資料
- *內容
+ *工作內容
+ 可能方法
+ *決策樹
+ *文本關連分析
+
目標選定
*初步可先從個別罪名單純的項目開始
(11 行未修改)
*會由三審往回爬資料,是因為必須是已三審定讞的案件,所以先由三審的判決書做判決書的範圍的圈定。
資料欄位
- 解構心證的list
*法官姓名
*罪名
(21 行未修改)
*社群網絡分析
*語言學言辭分析
+
* 建議:以下都是考量重點,但一開始可以先盡量簡化,再陸續加上viarables (變數),分階段進行。例如,全部的判決,可以只先看法官是誰、"判決結果"亦即主文的罪名和刑度即可,刑度的部分,可以僅看死刑、徒刑和罰金(併科罰金),而先忽略褫奪公權部分,判決的事實和法官心證形成的理由,也可以在第一階段蒐集資料時先忽略。也就是說,抓data 的範圍應由寬到窄採"十分逼近法",我們只要關心"關聯性"即可,先不用思考太精細的部分。
(14 行未修改)
各罪論的差異
犯罪事實、證據取捨、量刑因素隨著不同的案件類型,會有不同的常見模式或是問題。但是這麼內容分析的東西,我實在不知道怎麼用程式來作分析,有點難以想像。
- 以收受賄賂類的案件為例,我們在看案件時會重視的證據有:金流證明(提存款記錄、帳冊)、違背或不違背職務的行為、送錢者的證詞、共犯證詞。此類案件送錢者、共犯的證詞常常是定罪的關鍵,而最容易出問題的狀況就是直接證據只有送錢者(即白手套)的證詞,另外就是檢調為了取供而讓涉案者轉汙點證人,調查局的不正訊問(之後會出現翻供的問題)。
+ 以收受賄賂類的案件為例,我們在看案件時會重視的證據有:金流證明(提存款記錄、帳冊)、違背或不違背職務的行為、送錢者的證詞、共犯證詞。此類案件送錢者、共犯的證詞常常是定罪的關鍵,而最容易出問題的狀況就是直接證據只有送錢者(即白手套)的證詞,另外就是檢調為了取供而讓涉案者轉汙點證人,調查局的不正訊問(之後會出現翻供的問題)。
以販毒案為例,我們在看案件時會重視的證據有:毒品類型(一級、二級)、重量、有無通聯、有無監聽譯文、監聽譯文有無暗語、證人證詞、是否有販毒相關工具(分裝袋、磅秤、帳冊)、是否釣魚辦案。其中證人證詞最常出現問題,因為證人供出毒品來源可減刑,然後吸毒者供詞也經常反覆。然後販毒案非常常見的抗辯是合購、代買,行為類型很像,但是因為涉及販賣、轉讓、幫助吸食的差異,所以在判斷上又很難分。所以販毒案比較容易出現坐雲霄飛車的情形,一審判無期,二審判一年,或是剛好倒過來。
以幫助詐欺案件(但宣稱帳戶被盜用)為例,我們在看案件時會重視的證據有:帳戶被盜者被騙經過的證據(求職剪報、通聯、即時通、e-mail、line…)、掛失止付的記錄、報警記錄、窘迫處境的證據、帳戶狀況(是否常用、裡面是否有錢)。不過更為嚴重的與其說是證據取捨,而是例稿判決的問題。也就是不怎麼查,就直接判有罪的問題。
(24 行未修改)
2015-02-02 06:50 – 06:50 淑華 r674 – r678
顯示 diff
(41 行未修改)
*目前不會!因為時間卡到了~但可以線上技術交流~
*好噢!謝謝你 :D
+ *++
*所需技術
(50 行未修改)
2015-02-02 06:50 – 06:50 Miffy Chen r669 – r673
顯示 diff
(41 行未修改)
*目前不會!因為時間卡到了~但可以線上技術交流~
*好噢!謝謝你 :D
- *
*所需技術
(50 行未修改)
2015-02-02 06:50 淑華 r668
顯示 diff
(40 行未修改)
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
*目前不會!因為時間卡到了~但可以線上技術交流~
- *好噢!謝謝你 :D
+ *好噢!謝謝你 :D
+ *
*所需技術
(50 行未修改)
2015-02-02 06:50 – 06:50 Miffy Chen r664 – r667
顯示 diff
(40 行未修改)
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
*目前不會!因為時間卡到了~但可以線上技術交流~
- *好噢!謝謝你
+ *好噢!謝謝你 :D
*所需技術
(50 行未修改)
2015-02-02 06:50 淑華 r663
顯示 diff
(39 行未修改)
*我本身有做語言學言辭分析的經驗,如果有需要幫忙可以找我~
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
- *目前不會!因為時間卡到了~但可以線上技術交流
+ *目前不會!因為時間卡到了~但可以線上技術交流~
*好噢!謝謝你
(51 行未修改)
2015-02-02 06:50 – 06:50 Miffy Chen r658 – r662
顯示 diff
(40 行未修改)
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
*目前不會!因為時間卡到了~但可以線上技術交流
- *好噢!
+ *好噢!謝謝你
*所需技術
(50 行未修改)
2015-02-02 06:50 淑華 r657
顯示 diff
(39 行未修改)
*我本身有做語言學言辭分析的經驗,如果有需要幫忙可以找我~
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
- *目前不會!因為時間卡到了~但可以線上上技術交流
+ *目前不會!因為時間卡到了~但可以線上技術交流
*好噢!
(51 行未修改)
2015-02-02 06:50 – 06:50 Miffy Chen r655 – r656
顯示 diff
(40 行未修改)
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
*目前不會!因為時間卡到了~但可以線上上技術交流
- *好噢!那我
+ *好噢!
*所需技術
(50 行未修改)
2015-02-02 06:50 淑華 r654
顯示 diff
(39 行未修改)
*我本身有做語言學言辭分析的經驗,如果有需要幫忙可以找我~
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
- *目前不會!因為時間卡到了~但但可以線上上技術交流
+ *目前不會!因為時間卡到了~但可以線上上技術交流
*好噢!那我
(51 行未修改)
2015-02-02 06:50 – 06:50 Miffy Chen r652 – r653
顯示 diff
(95 行未修改)
2015-02-02 06:50 – 06:50 淑華 r650 – r651
顯示 diff
(39 行未修改)
*我本身有做語言學言辭分析的經驗,如果有需要幫忙可以找我~
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
- *目前不會!因為時間卡到了~但可以獻但可以線上上技術交流
+ *目前不會!因為時間卡到了~但但可以線上上技術交流
*好噢!那我
(51 行未修改)
2015-02-02 06:50 – 06:50 Miffy Chen r647 – r649
顯示 diff
(40 行未修改)
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
*目前不會!因為時間卡到了~但可以獻但可以線上上技術交流
- *好噢
+ *好噢!那我
*所需技術
(50 行未修改)
2015-02-02 06:50 – 06:50 淑華 r645 – r646
顯示 diff
(39 行未修改)
*我本身有做語言學言辭分析的經驗,如果有需要幫忙可以找我~
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
- *目前不會!因為時間卡到了~但可以獻但可以線上技術交流上技術交流
+ *目前不會!因為時間卡到了~但可以獻但可以線上上技術交流
*好噢
(51 行未修改)
2015-02-02 06:50 Miffy Chen r644
顯示 diff
(40 行未修改)
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
*目前不會!因為時間卡到了~但可以獻但可以線上技術交流上技術交流
- *
+ *好噢
*所需技術
(50 行未修改)
2015-02-02 06:50 淑華 r643
顯示 diff
(39 行未修改)
*我本身有做語言學言辭分析的經驗,如果有需要幫忙可以找我~
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
- *目前不會!因為時間卡到了~但可以獻但可以獻上技術交流上技術交流
+ *目前不會!因為時間卡到了~但可以獻但可以線上技術交流上技術交流
*
(51 行未修改)
2015-02-02 06:50 – 06:50 Miffy Chen r640 – r642
顯示 diff
(40 行未修改)
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
*目前不會!因為時間卡到了~但可以獻但可以獻上技術交流上技術交流
- *那
+ *
*所需技術
(50 行未修改)
2015-02-02 06:50 淑華 r639
顯示 diff
(39 行未修改)
*我本身有做語言學言辭分析的經驗,如果有需要幫忙可以找我~
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
- *目前不會!因為時間卡到了~但可以獻上技術交流
+ *目前不會!因為時間卡到了~但可以獻但可以獻上技術交流上技術交流
*那
(51 行未修改)
2015-02-02 06:50 Miffy Chen r638
顯示 diff
(40 行未修改)
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
*目前不會!因為時間卡到了~但可以獻上技術交流
- *
+ *那
*所需技術
(50 行未修改)
2015-02-02 06:50 淑華 r637
顯示 diff
(39 行未修改)
*我本身有做語言學言辭分析的經驗,如果有需要幫忙可以找我~
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
- *目前不會!因為時間卡到了~
+ *目前不會!因為時間卡到了~但可以獻上技術交流
*
(51 行未修改)
2015-02-02 06:50 Miffy Chen r636
顯示 diff
(40 行未修改)
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
*目前不會!因為時間卡到了~
+ *
*所需技術
(50 行未修改)
2015-02-02 06:49 – 06:50 淑華 r633 – r635
顯示 diff
(39 行未修改)
*我本身有做語言學言辭分析的經驗,如果有需要幫忙可以找我~
*太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
+ *目前不會!因為時間卡到了~
*所需技術
(50 行未修改)
2015-02-02 04:38 – 06:49 Miffy Chen r299 – r632
顯示 diff
判決書心證分析
- 目標
+ *目標
司改會在申訴不適任法官與檢察官的過程中發現,許多判決的案情事實、背景近似,適用的法規也雷同,但不同的法官卻做出迥然不同的判決結果,在法定刑與法官自由心證之間是否有法官恣意的問題,因此希望透過資訊工具進行分析量化。
- 相關專案
+ *相關專案
貪汙判決分析
裁判書小幫手
+ Data-Centric Government 的二十大類資料
- 工作內容
- *爬判決書
+ *內容
+ 目標選定
*初步可先從個別罪名單純的項目開始
*殺人罪
(1 行未修改)
*強姦罪
*猥褻
+ *或者立基於貪污判決分析的結果,所做出來的database為分析
+ *先抓確定的案件
+ *妨害性自主的類型通常是不公開案件,沒辦法作…
*已定讞案件
*三審判決確定近十年
*由三審判決往三→二→一審抓
- *抓取項目
+ *我倒覺得應該從一審抓,因為三審判決常常寫得很簡略。二審是會針對一審的結果決定改判或維持原判,所以結論就是一審無論如何都避不掉。
+ *會由三審往回爬資料,是因為必須是已三審定讞的案件,所以先由三審的判決書做判決書的範圍的圈定。
+ 資料欄位
+ 解構心證的list
*法官姓名
*罪名
*案情事實
*使用斷詞系統去比對案情結構的相似度→詞句組成及詞頻分析→量化
+ *決策樹
*判決結果
*刑期
*死刑、無期徒刑、有期徒刑
+ *如以殺人案件為例,分成死刑、無期徒刑、10年以上有期徒刑;如果是貪污案,則可能可以分為"污多少錢判多少
*判決理由(法官心證)
*使用斷詞系統去比對案情結構的相似度→詞句組成及詞頻分析→量化
(1 行未修改)
*小孩殺父母
*我本身有做語言學言辭分析的經驗,如果有需要幫忙可以找我~
+ *太感謝了!2/14的大松淑華會去嗎?想和你聊聊 :D 我的FB
+
+ *所需技術
+ *爬資料
+ *斷詞
+ *機器學習(決策樹):格致
+ *社群網絡分析
+ *語言學言辭分析
+
+ * 建議:以下都是考量重點,但一開始可以先盡量簡化,再陸續加上viarables (變數),分階段進行。例如,全部的判決,可以只先看法官是誰、"判決結果"亦即主文的罪名和刑度即可,刑度的部分,可以僅看死刑、徒刑和罰金(併科罰金),而先忽略褫奪公權部分,判決的事實和法官心證形成的理由,也可以在第一階段蒐集資料時先忽略。也就是說,抓data 的範圍應由寬到窄採"十分逼近法",我們只要關心"關聯性"即可,先不用思考太精細的部分。
+
+ 普遍性的抓取項目
+ *法院別:例台北地院、高雄地院。可看城鄉、地域差距。
+ *案號:例102年度訴字第254號。基本的判決要素,方便回查。
+ *被告:不同被告會有不同的事實、罪名、刑度,也才能回查。
+ *判決日期:隨著時間的變遷,法院整體、個別法官可能都會有變化。
+ *法官
+ *辯護人:有無辯護人,或誰辯護會對案件結果有影響。
+ *罪名:例殺人罪。
+ *有罪否:可能會出現有罪、無罪、其他(例:免訴)
+ *刑度:要注意有所謂的「宣告刑」和「執行刑」的差別。比較有實質意義的是「執行刑」。另外,考量到定執行刑是數罪併罰的結果,在分析刑度上其實還要納入罪數的考量。
+ *案由:例詐欺。因為在抓取上非常容易,沒什麼理由不抓。好處是可以將不同案件很大略地分類,缺點是並不精確。
+ 以上為各類案件皆重要且容易抓的項目。
+
+ 各罪論的差異
+ 犯罪事實、證據取捨、量刑因素隨著不同的案件類型,會有不同的常見模式或是問題。但是這麼內容分析的東西,我實在不知道怎麼用程式來作分析,有點難以想像。
+ 以收受賄賂類的案件為例,我們在看案件時會重視的證據有:金流證明(提存款記錄、帳冊)、違背或不違背職務的行為、送錢者的證詞、共犯證詞。此類案件送錢者、共犯的證詞常常是定罪的關鍵,而最容易出問題的狀況就是直接證據只有送錢者(即白手套)的證詞,另外就是檢調為了取供而讓涉案者轉汙點證人,調查局的不正訊問(之後會出現翻供的問題)。
+ 以販毒案為例,我們在看案件時會重視的證據有:毒品類型(一級、二級)、重量、有無通聯、有無監聽譯文、監聽譯文有無暗語、證人證詞、是否有販毒相關工具(分裝袋、磅秤、帳冊)、是否釣魚辦案。其中證人證詞最常出現問題,因為證人供出毒品來源可減刑,然後吸毒者供詞也經常反覆。然後販毒案非常常見的抗辯是合購、代買,行為類型很像,但是因為涉及販賣、轉讓、幫助吸食的差異,所以在判斷上又很難分。所以販毒案比較容易出現坐雲霄飛車的情形,一審判無期,二審判一年,或是剛好倒過來。
+ 以幫助詐欺案件(但宣稱帳戶被盜用)為例,我們在看案件時會重視的證據有:帳戶被盜者被騙經過的證據(求職剪報、通聯、即時通、e-mail、line…)、掛失止付的記錄、報警記錄、窘迫處境的證據、帳戶狀況(是否常用、裡面是否有錢)。不過更為嚴重的與其說是證據取捨,而是例稿判決的問題。也就是不怎麼查,就直接判有罪的問題。
+ 也就是說,不同的案件類型,真的值得分析的東西其實很不一樣(性侵類就先不說了,反正絕大多數是不公開判決),要怎麼用程式來抓這些分析要素,我真的不太懂…。
+ 另外,如果要監督法官的不當判決,還有另一種方式,就是看例稿駁回數。
+ 之前我有做過刑訴361條,上訴二審未附具體理由。原本的立法意旨是避免空白上訴,結果有部分的二審法官濫用,只要他覺得上訴理由看起來沒什麼道理就直接駁掉,根本不開庭。把哪些法官最常用361駁回上訴,其中有多少件是幾乎相同的例稿,可以用來了解法官的認真度。
+ 也就是說,可以詢問律師,知不知道實務上有哪些打混摸魚的判決方式,掌握這種模式,透過程式來抓出哪些法官喜歡用這種模式來判案,就可以了解這個法官的認真度。
+
+ *參考文獻
+ "Competing Approaches to Predicting Supreme Court Decision Making" (2004) (http://www.wusct.wustl.edu/media/man1.pdf)
+ *這篇文章其實是這個model 的簡明版介紹,裡面有提到他們是如何建立這個model,和對照組就是以"法律人"的組成來判斷聯邦最高法院的判決。方式值得參考。
+
+ *本文就是在玩一種猜猜看的遊戲。比較專家和統計誰比較會預測最高法院(或某個法官)的決定。專家就是考量各種因素作出預測,而統計就是依據過去的案例來作預測。
+ *統計作預測的方式是:抓取案件中的某些特徵,從過去擁有某些特徵會傾向得出某些結果,來預測在將來出現有類似特徵的案件,最高法院就會作出類似決定。
+ *舉例:預測O’Connor法官(保守派)的決定
+ *1.下級法院的決定是自由派的?是,則撤銷改判
+ *不是的話,則往下走。
+ *2.案件是來自於第二、三、特區、聯邦巡迴上訴法院?是,則維持。不是的話,則往下走…(請自行參figure 1)
+ **這邊我不是很懂,案件來自哪個法院,為何與O’Connor法官的決定有關?可能是因為我不了解美國法院的生態就是了。
+ *也就是說,統計作預測的方式,是以在言詞辯論前即已存在的某些特徵,來預測言詞辯論後的結果。但是本文也強調,此處抓取的特徵與決定的結果,在解釋上並沒有因果關係,比較像是相關而已。
+ *而本文的結論是:統計作的預測比專家作的預測來得準。
+ *
+ *我目前看不出來本文是用程式去抓取相關特徵而得出。甚至我覺得資料庫比較像靠手工完成的(或至少有部分必須靠手工)。理由就是:一個決定到底屬於自由派或保守派,其實難以單靠電腦程式來判斷,或者至少是,如果是用電腦程式來判斷,我看不出本文是如何設計這個程式。
+ *
+ *本文對我的啟示是:其實不一定要抓取很多判決的細節,有些看似很容易抓取的特徵,對結果來說,就有一定程度的預測性。
+ *
+ *不過如果從監督法官判決的角度來看,我覺得本文的啟示性有限。
2015-01-31 16:58 – 16:59 淑華 r290 – r298
顯示 diff
(28 行未修改)
*義憤殺人
*小孩殺父母
- *
+ *我本身有做語言學言辭分析的經驗,如果有需要幫忙可以找我~
2015-01-31 16:58 (unknown) r289
顯示 diff
(31 行未修改)
2015-01-31 16:58 淑華 r288
顯示 diff
(28 行未修改)
*義憤殺人
*小孩殺父母
+ *
2015-01-25 16:14 – 16:22 Miffy Chen r270 – r287
顯示 diff
- 判決書恩仇記
+ 判決書心證分析
目標
司改會在申訴不適任法官與檢察官的過程中發現,許多判決的案情事實、背景近似,適用的法規也雷同,但不同的法官卻做出迥然不同的判決結果,在法定刑與法官自由心證之間是否有法官恣意的問題,因此希望透過資訊工具進行分析量化。
- 現有相關專案
+ 相關專案
貪汙判決分析
裁判書小幫手
(23 行未修改)
2015-01-25 09:18 – 09:21 Miffy Chen r259 – r269
顯示 diff
(25 行未修改)
*死刑、無期徒刑、有期徒刑
*判決理由(法官心證)
+ *使用斷詞系統去比對案情結構的相似度→詞句組成及詞頻分析→量化
*義憤殺人
*小孩殺父母
2015-01-25 07:42 – 08:16 Miffy Chen r72 – r258
顯示 diff
(1 行未修改)
目標
司改會在申訴不適任法官與檢察官的過程中發現,許多判決的案情事實、背景近似,適用的法規也雷同,但不同的法官卻做出迥然不同的判決結果,在法定刑與法官自由心證之間是否有法官恣意的問題,因此希望透過資訊工具進行分析量化。
+
+ 現有相關專案
+ 貪汙判決分析
+ 裁判書小幫手
工作內容
- *
+ *爬判決書
+ *初步可先從個別罪名單純的項目開始
+ *殺人罪
+ *妨害性自主
+ *強姦罪
+ *猥褻
+ *已定讞案件
+ *三審判決確定近十年
+ *由三審判決往三→二→一審抓
+ *抓取項目
+ *法官姓名
+ *罪名
+ *案情事實
+ *使用斷詞系統去比對案情結構的相似度→詞句組成及詞頻分析→量化
+ *判決結果
+ *刑期
+ *死刑、無期徒刑、有期徒刑
+ *判決理由(法官心證)
+ *義憤殺人
+ *小孩殺父母
2015-01-25 07:41 (unknown) r71
顯示 diff
(6 行未修改)
2015-01-25 07:36 – 07:41 Miffy Chen r1 – r70
顯示 diff
- 判決小幫手
+ 判決書恩仇記
+ 目標
+ 司改會在申訴不適任法官與檢察官的過程中發現,許多判決的案情事實、背景近似,適用的法規也雷同,但不同的法官卻做出迥然不同的判決結果,在法定刑與法官自由心證之間是否有法官恣意的問題,因此希望透過資訊工具進行分析量化。
- This pad text is synchronized as you type, so that everyone viewing this page sees the same text. This allows you to collaborate seamlessly on documents!
+ 工作內容
+ *
2015-01-25 07:35 (unknown) r0
顯示 diff
+ 判決小幫手
+ This pad text is synchronized as you type, so that everyone viewing this page sees the same text. This allows you to collaborate seamlessly on documents!