透析貪污判決--揭露與查詢網站

編輯歷史

時間 作者 版本
2021-11-02 13:21 – 13:21 che wei liu r4857 – r4877
顯示 diff
透析貪污判決--揭露與查詢網站
+
+
+ 最新內容請至 hackmd
+ https://g0v.hackmd.io/T-S5xZOVSIWdv45noYmsUA
+
+
+
+
(暫名,尚缺副標)
The Disclosure of Corruption Judgement, the Web
(230 行未修改)
2018-07-29 22:43 changyajune r4856
顯示 diff
(8 行未修改)
*貪污是個表面上看起來沒什麼,實際上會對社會造成侵蝕的嚴重病灶
*有些人會講「水至清則無魚」、「無能比貪污更要不得」,但通常例子是官員收錢所以開始選擇性做事,有益人民的事情不作為,變成「無能」
- *但是貪污不好查,接著想到有貪污法案,法院有判決書,也許可以從判決書切入
- *然後發現判決書落落長,動輒數百頁,如果可以用簡單方式呈現那不就太好了嗎!
+ *但貪污是個表面上看起來沒什麼,實際上會對社會造成侵蝕的嚴重病灶*然後發現判決書落落長,動輒數百頁,如果可以用簡單方式呈現那不就太好了嗎!
(220 行未修改)
2016-09-12 05:52 – 06:09 胡雨露 r4780 – r4855
顯示 diff
(121 行未修改)
*我對於這些表格做了些觀察,沒有統一的格式,甚至有表格內還有表格的情況,就像word一樣可畫任意表格,表格內容也不一定遵守column的schema。這個evernote 有我的一些觀察和一些畸形表格”樣本” 。
*code可以抽取cell,雖然不算完全結構化。我
- 不在下資工相關科系出身,誠徵對判決書有興趣的NLP陣
+ *各位大大好,我非資工系出身對程式也完全不通,不過工作主要接觸貪瀆案件,覺得貪瀆案件對於社會真的影響很大,無意間發現這個網站覺得你們好厲害,希望可以就自己所知貢獻,所有判決書的表格都是「漢書」系統登打,才會導致表格變成上面這個樣子,另外不知道你們是如何搜尋洩密案件,我認為洩密案件是一個貪瀆案件的前端,他是在刑法裡,貪汙治罪條例裡面不會有洩密;還要注意我曾碰過案由跟判決書內容會不一致的情形。有關新聞的部分,我推薦官方新聞會比較準確,各地檢署、調查局、廉政署對於貪瀆案件發動,基本上都會在搜索、約詢、判決當日有官方新聞稿。不在下資工相關科系出身,誠徵對判決書有興趣的NLP陣
各路大神提供的Approach:
1.r egular expression
(108 行未修改)
2015-07-15 10:00 Kriis Liao r4779
顯示 diff
(123 行未修改)
不在下資工相關科系出身,誠徵對判決書有興趣的NLP陣
各路大神提供的Approach:
- 1.regular expression
+ 1.r egular expression
2. & pattern(目前作法)machine learning
(106 行未修改)
2015-06-13 08:53 – 08:53 張淵智 r4774 – r4778
顯示 diff
(234 行未修改)
2015-06-13 08:42 – 08:44 李翌辰 r4724 – r4773
顯示 diff
(24 行未修改)
由於一個案件通常會有複數被告,因此抽取案件資料傾向於以人作為抽取重點,這裡我的想法是一個判決書以兩段資料呈現:第一段是判決書的欄位,一份判決書一筆;第二段是被告的欄位,每個被告都有自己的欄位,故筆數取決於被告人數
以下是我想到覺得重要的欄位,歡迎各種建議
+
+ 預定使用的資料庫:MySQL => 因為預定會使用到不只一個欄位的搜尋,資料庫的table可以直接用下面兩個資料表來製作,並把地址欄位加進去。
第一段:判決書部份
(203 行未修改)
2015-05-06 04:42 – 04:42 Ronny Wang r4708 – r4723
顯示 diff
(115 行未修改)
*可以先觀察判決書這類表格的形式是否一致,比如說每個欄位都是由 "|(...)|" 這樣子的格式分隔開,表頭的各個欄位header亦同,但不同的地方是表頭是從 "┌(...)" 這樣子的 pattern 的下一列開始,而每一列內容則是從 "├(...)" 的下一列開始,按照這樣的規則應該可以把表格內容整併入指定的資料結構中供取用。 (不好意思,先把12/20那天的嘴砲討論先記錄一下,我還是優先會處理好職位身分的偵測,有需要再回來支援這邊的parsing)
+ *http://test.ronny.tw/table.html 做了一個陽春的可以抓表格的 API
表格結構化?
*我對於這些表格做了些觀察,沒有統一的格式,甚至有表格內還有表格的情況,就像word一樣可畫任意表格,表格內容也不一定遵守column的schema。這個evernote 有我的一些觀察和一些畸形表格”樣本” 。
(112 行未修改)
2015-04-18 09:44 – 09:45 小說 r4652 – r4707
顯示 diff
(226 行未修改)
↓↓↓
https://www.facebook.com/groups/876229695725086/a歡迎加入討論s# *上Parse資料上線好
+ 不https://www.parse.com/apps/uncovertw/
+ 建了兩個怎表,普分別是judgment和party。
+ 需要的人使用api或更的新新的人請找張淵智XD
2015-04-18 09:44 (unknown) r4651
顯示 diff
(228 行未修改)
2015-04-18 09:44 – 09:44 小說 r4636 – r4650
顯示 diff
(225 行未修改)
*對貪腐、貪污、官商勾結等相關議題有興趣
↓↓↓
- https://www.facebook.com/groups/876229695725086/a歡迎加入討論s
+ https://www.facebook.com/groups/876229695725086/a歡迎加入討論s# *上Parse資料上線好
2015-04-18 09:12 – 09:13 Poren Chiang r4609 – r4635
顯示 diff
(199 行未修改)
http://www.judicial.gov.tw/jw9706/pdf/1700-1.pdf
透過判決書萃取出貪污金額需要專業法律人閱讀判決之文意,也就是說,這需要大量的工人智慧,而司法院已經建立一個量刑系統,或許可以嘗試用他們的資料庫取得被告對應貪污金額及刑度的資訊
+
+ 網站可以參考的數據呈現方式
+ http://designspiration.net/image/25875462678551/
資料中文處理工具簡介
(22 行未修改)
2015-04-18 06:16 – 07:30 郭嘉元 r4530 – r4608
顯示 diff
(195 行未修改)
研究文獻:中研院政治所吳重禮:Chung-li Wu. Charge Me if You Can: Assessing Political Biases in Votebuying Verdicts in Democratic Taiwan (2000–2010). The China Quarterly, Available on CJO 2012 doi:10.1017/S0305741012000847 中文版:http://newsletter.sinica.edu.tw/file/file/77/7792.pdf
- 員判刑資料中文處理工具簡介
+ 員判刑司法院量刑系統--量刑資訊系統將判決書加以「量化」,使用者只要在查詢介面 輸入查詢條件,量刑資訊系統就會將符 合查詢條件的所有類似案件檢索出來, 提供該類似案件的平均刑度、最高刑度、最低刑度及量刑分布全貌圖
+ http://www.judicial.gov.tw/revolution/judReform06.asp
+ http://www.judicial.gov.tw/jw9706/pdf/1700-1.pdf
+ 透過判決書萃取出貪污金額需要專業法律人閱讀判決之文意,也就是說,這需要大量的工人智慧,而司法院已經建立一個量刑系統,或許可以嘗試用他們的資料庫取得被告對應貪污金額及刑度的資訊
+ 資料中文處理工具簡介
政商透明化
(21 行未修改)
2015-04-15 14:22 – 14:40 張淵智 r4486 – r4529
顯示 diff
(136 行未修改)
*超酷XD (Y)
*對於一樓經驗表示完全可以理解XD
- 抓取表格內容補足 宣告刑 欄位 -
+
+ *15/4/15:前幾天嘗試用re寫pattern去抓 大概可以抓到20%(這比例..orz) 抓取表格內容補足 宣告刑 欄位 -
*code Brief:做的事是把表格cell抽出來再用regular expression找宣告刑。table九成可以抽取cell內容。但宣告刑recall我猜不高,這需要sample評估多少沒抓出來。
*稍微回應一下,「'禠'!='褫'」如果仔細看的話,一個是一點,一個是兩點。判決書有不少像這種差一點的(機歪)錯別字*抓取法官欄位
(79 行未修改)
2015-02-24 09:26 – 09:26 slamky r4484 – r4485
顯示 diff
(220 行未修改)
2015-02-14 02:30 – 02:30 楊孟勳 r4469 – r4483
顯示 diff
(177 行未修改)
中文字大寫轉換(Python 3)
https://github.com/rschiang/py-conv-digit團
- *其他相關
+
+
+ 初版網站@heroku
+ http://g0v-uncover.herokuapp.com/*其他相關
*如果要顯示判決書稀少字
司法院對於非big5編碼的字會用造字的方式處理,並提供下載:
(35 行未修改)
2015-01-31 03:39 – 03:41 張淵智 r4446 – r4468
顯示 diff
(167 行未修改)
判決書欄位(第一段),欄位(檔名/字號/時間/法院/檢察官起訴案由/被告數/被告名單):google試算表
- 判決書欄位(第二段部份),欄位(檔名/被告/罪名/是否易科罰金/罰金/緩刑):google試算表
- 註1:covered指主文中被告匿名,無法確認哪位是哪位尾註2:need check目前剩下未列入主文的代理人或公司,還有名字英文三種出原始碼
+ 判決書欄位(第二段部份),欄位(檔名/被告/罪名/是否易科罰金/罰金/緩刑):gogoogle試算表1(2)15-
+ 1-31 簡化罪名 and 罰金數字化:covered指主文中被告匿名,無法確認哪位是哪位尾註2:need check目前剩下未列入主文的代理人或公司,還有名字英文三種出原始碼
字 by 淵智(python2)
- 號讀取判決書內的表格(python3) by 煒清
+ )(過期號讀取判決書內的表格(python3) by 煒清
https://github.com/superChing/extract_declared_sentence
、日期、案由、被告 by csferng
(42 行未修改)
2015-01-29 13:54 – 14:02 張淵智 r4415 – r4445
顯示 diff
(4 行未修改)
POREN:uncover.g0v.tw 之類的,感覺很有特務風XD
- 近日活動
- 1/25(日) 10:
- 0 - 18:00 第零次法律松
- 歡迎對專案有興趣者一同參與!!
- 小摘要:
- 淵智繼續資料爬梳 , 孟勳 製作網站
- 司改會: 中豪大哥提議了資料分析的建議 ;
- 宜珊律師 & 執秘 林瑋婷給了實務上關於貪汙案件的實況、
- 以及法官量刑尺度的不同 , 是未來司改會關心的爭點之一。
- 技術端:
- 甯格致 ( Keith Ning ) 關於社會網路分析可以提供協助 ;
- 林鉦育 提供資料分析建議 ;
- 郭俊儀 : 後台協助
- 姜柏任 ( Poren Chiang ) 寫完轉換器
*緣起
*貪污是個表面上看起來沒什麼,實際上會對社會造成侵蝕的嚴重病灶
(131 行未修改)
*稍微回應一下,「'禠'!='褫'」如果仔細看的話,一個是一點,一個是兩點。判決書有不少像這種差一點的(機歪)錯別字*抓取法官欄位
*
- *抓取金額 / 國字轉數字查詢被告政黨屬性
+ *抓取涉貪金額
+ *國字轉數字查詢被告政黨屬性
------
*處理高院/最高法院判決書
(49 行未修改)
政商透明化
- 我們歡迎下列各種夥伴:
+ 我們歡迎下列各
+
+ *參與活動種1/25(日) 10:00 - 18:00 第零次法律松
+ 當天活動摘要:
+ *淵智繼續資料爬梳 , 孟勳 製作網站
+ *司改會: 中豪大哥提議了資料分析的建議 ;
+ *宜珊律師 & 執秘 林瑋婷給了實務上關於貪汙案件的實況、
+ *以及法官量刑尺度的不同 , 是未來司改會關心的爭點之一。
+ 技術端:
+ *甯格致 ( Keith Ning ) 關於社會網路分析可以提供協助 ;
+ *林鉦育 提供資料分析建議 ;
+ *郭俊儀 : 後台協助
+ *姜柏任 ( Poren Chiang ) 寫完轉換器
+ 夥伴:
*對判決書閱讀熟悉敏銳
*自然語言處理高手
(4 行未修改)
2015-01-25 08:07 – 08:08 吳長鋼 r4408 – r4414
顯示 diff
(8 行未修改)
0 - 18:00 第零次法律松
歡迎對專案有興趣者一同參與!!
-
小摘要:
-
+ 淵智繼續資料爬梳 , 孟勳 製作網站
+ 司改會: 中豪大哥提議了資料分析的建議 ;
+ 宜珊律師 & 執秘 林瑋婷給了實務上關於貪汙案件的實況、
+ 以及法官量刑尺度的不同 , 是未來司改會關心的爭點之一。
+ 技術端:
+ 甯格致 ( Keith Ning ) 關於社會網路分析可以提供協助 ;
+ 林鉦育 提供資料分析建議 ;
+ 郭俊儀 : 後台協助
+ 姜柏任 ( Poren Chiang ) 寫完轉換器
*緣起
*貪污是個表面上看起來沒什麼,實際上會對社會造成侵蝕的嚴重病灶
(194 行未修改)
2015-01-25 06:35 – 06:35 Poren Chiang r4391 – r4407
顯示 diff
(179 行未修改)
https://github.com/superChing/extract_declared_sentence
、日期、案由、被告 by csferng
- https:/(過期)/https://github.com/csferng/AnalyzeVerdict社團
+ https:/(過期)/https://github.com/csferng/AnalyzeVerdict社
+
+ 中文字大寫轉換(Python 3)
+ https://github.com/rschiang/py-conv-digit團
*其他相關
*如果要顯示判決書稀少字
(23 行未修改)
2015-01-25 06:10 – 06:10 吳長鋼 r4386 – r4390
顯示 diff
(8 行未修改)
0 - 18:00 第零次法律松
歡迎對專案有興趣者一同參與!!
+
+ 小摘要:
+
+
*緣起
*貪污是個表面上看起來沒什麼,實際上會對社會造成侵蝕的嚴重病灶
(191 行未修改)
2015-01-21 20:14 – 20:15 張淵智 r4363 – r4385
顯示 diff
(32 行未修改)
*
*資料ID暫時用檔名
- 第一段的部份除了「案件標的」外,其他欄位已擷取:
+ 第一段的部份除了「案件標的」外、「法官」,其他欄位已擷取:
google試算表
(105 行未修改)
*code Brief:做的事是把表格cell抽出來再用regular expression找宣告刑。table九成可以抽取cell內容。但宣告刑recall我猜不高,這需要sample評估多少沒抓出來。
*稍微回應一下,「'禠'!='褫'」如果仔細看的話,一個是一點,一個是兩點。判決書有不少像這種差一點的(機歪)錯別字*抓取法官欄位
- *查詢被告政黨屬性
+ *
+ *抓取金額 / 國字轉數字查詢被告政黨屬性
------
*處理高院/最高法院判決書
(55 行未修改)
2015-01-16 13:42 – 13:47 張淵智 r4320 – r4362
顯示 diff
(170 行未修改)
判決書欄位(第二段部份),欄位(檔名/被告/罪名/是否易科罰金/罰金/緩刑):google試算表
註1:covered指主文中被告匿名,無法確認哪位是哪位尾註2:need check目前剩下未列入主文的代理人或公司,還有名字英文三種出原始碼
- 字號、日期、案由、被告 by csferng
+ 字 by 淵智(python2)
+ 號讀取判決書內的表格(python3) by 煒清
+ https://github.com/superChing/extract_declared_sentence
+ 、日期、案由、被告 by csferng
https:/(過期)/https://github.com/csferng/AnalyzeVerdict社團
*其他相關
(24 行未修改)
2015-01-06 18:03 – 18:07 蔡維哲 r4302 – r4319
顯示 diff
(184 行未修改)
八卦版文章:中國黨貪污一覽表
- 議員判刑資料中文處理工具簡介
+ 議
+ 研究文獻:中研院政治所吳重禮:Chung-li Wu. Charge Me if You Can: Assessing Political Biases in Votebuying Verdicts in Democratic Taiwan (2000–2010). The China Quarterly, Available on CJO 2012 doi:10.1017/S0305741012000847 中文版:http://newsletter.sinica.edu.tw/file/file/77/7792.pdf
+ 員判刑資料中文處理工具簡介
政商透明化
(8 行未修改)
2015-01-05 08:06 – 08:08 張淵智 r4252 – r4301
顯示 diff
(4 行未修改)
POREN:uncover.g0v.tw 之類的,感覺很有特務風XD
+ 近日活動
+ 1/25(日) 10:
+ 0 - 18:00 第零次法律松
+ 歡迎對專案有興趣者一同參與!!
*緣起
*貪污是個表面上看起來沒什麼,實際上會對社會造成侵蝕的嚴重病灶
(185 行未修改)
2015-01-04 14:44 – 14:49 張淵智 r4221 – r4251
顯示 diff
(13 行未修改)
*目標
*一個查詢貪污與判決結果的查詢網站
- *不搞法理解釋、不提論述心證,用簡單幾個欄位呈現判決結果,告訴你「某某某當年就有貪污案底」
+ *不搞法理解釋、不提論述心證(也許是第三步以後的事),用簡單幾個欄位呈現判決結果,告訴你「某某某當年就有貪污案底」
一般民眾在意的點:
*金額大的案子
(118 行未修改)
*對於一樓經驗表示完全可以理解XD
抓取表格內容補足 宣告刑 欄位 -
- *code Brief:做的事是把表格cell抽出來再用regular expression找宣告刑。table九成可以抽取cell內容。但宣告刑recall我猜不高,這需要sample評估多少沒抓出來。*抓取法官欄位
+ *code Brief:做的事是把表格cell抽出來再用regular expression找宣告刑。table九成可以抽取cell內容。但宣告刑recall我猜不高,這需要sample評估多少沒抓出來。
+ *稍微回應一下,「'禠'!='褫'」如果仔細看的話,一個是一點,一個是兩點。判決書有不少像這種差一點的(機歪)錯別字*抓取法官欄位
*查詢被告政黨屬性
------
(51 行未修改)
2015-01-04 02:17 – 03:07 煒清 林 r4085 – r4220
顯示 diff
(115 行未修改)
表格結構化?
- *我對於這些表格做了些觀察,沒有統一的格式,甚至有表格內還有表格的情況,就像word一樣可畫任意表格,表格內容也不一定遵守column的schema。這個evernote有我的一些觀察和一些畸形表格”樣本” : https://www.evernote.com/l/AMe-3Qfov0xE4Yb63yOrvh7In82dIWOYGYI 。我
+ *我對於這些表格做了些觀察,沒有統一的格式,甚至有表格內還有表格的情況,就像word一樣可畫任意表格,表格內容也不一定遵守column的schema。這個evernote 有我的一些觀察和一些畸形表格”樣本” 。
+ *code可以抽取cell,雖然不算完全結構化。我
不在下資工相關科系出身,誠徵對判決書有興趣的NLP陣
各路大神提供的Approach:
(15 行未修改)
*對於一樓經驗表示完全可以理解XD
抓取表格內容補足 宣告刑 欄位 -
- *code: https://github.com/superChing/extract_declared_sentence
- *做的事是把表格cell抽出來再用regular expression。
- *table九成可以抽取cell內容。但recall我猜好像不高,而且也不知道怎麼評估有多少沒抓出來。*抓取法官欄位
+ *code Brief:做的事是把表格cell抽出來再用regular expression找宣告刑。table九成可以抽取cell內容。但宣告刑recall我猜不高,這需要sample評估多少沒抓出來。*抓取法官欄位
*查詢被告政黨屬性
------
(51 行未修改)
2015-01-03 13:08 – 13:20 煒清 林 r4047 – r4084
顯示 diff
(137 行未修改)
*code: https://github.com/superChing/extract_declared_sentence
*做的事是把表格cell抽出來再用regular expression。
- *recall我猜好像不高,而且也不知道怎麼評估有多少沒抓出來。*抓取法官欄位
+ *table九成可以抽取cell內容。但recall我猜好像不高,而且也不知道怎麼評估有多少沒抓出來。*抓取法官欄位
*查詢被告政黨屬性
------
(51 行未修改)
2015-01-03 09:31 – 10:55 煒清 林 r3885 – r4046
顯示 diff
(115 行未修改)
表格結構化?
- *我對於這些表格做了些觀察,沒有統一的格式,甚至有表格內還有表格的情況,就像word一樣可畫任意表格,表格內容也不一定遵守column的schema。這個evernote有我的一些觀察和一些畸形表格”樣本” : https://www.evernote.com/l/AMe-3Qfov0xE4Yb63yOrvh7In82dIWOYGYI 。
- *本來想把這些表格都結構化,但我想不出一個好方法。不然就退一步只結構化非常正規的表格。再者從目前task來說結構化表格似乎不是絕對必要的,例如罪名似乎可以從非結構化表格抽取,我先就直接從純文本下手試著改善罪名抽取率看看。
-
- 如果有人對結構化表格有好方法的歡迎跳坑,畢竟結構化表格後可以更方便抽取到更多資訊。我
+ *我對於這些表格做了些觀察,沒有統一的格式,甚至有表格內還有表格的情況,就像word一樣可畫任意表格,表格內容也不一定遵守column的schema。這個evernote有我的一些觀察和一些畸形表格”樣本” : https://www.evernote.com/l/AMe-3Qfov0xE4Yb63yOrvh7In82dIWOYGYI 。我
不在下資工相關科系出身,誠徵對判決書有興趣的NLP陣
各路大神提供的Approach:
(13 行未修改)
,造成原本現成的詞彙解析程式運作不能 XD 因此使用divide-n-conquer重新修改處理流程中~
*超酷XD (Y)
- *對於一樓經驗表示完全可以理解XD**罪名(包含從表格內的) --> 煒清
- 抓取表格內容補足 宣告刑 欄位 -*抓取法官欄位
+ *對於一樓經驗表示完全可以理解XD
+ 抓取表格內容補足 宣告刑 欄位 -
+ *code: https://github.com/superChing/extract_declared_sentence
+ *做的事是把表格cell抽出來再用regular expression。
+ *recall我猜好像不高,而且也不知道怎麼評估有多少沒抓出來。*抓取法官欄位
*查詢被告政黨屬性
------
(51 行未修改)
2014-12-25 09:36 – 09:52 張淵智 r3883 – r3884
顯示 diff
(167 行未修改)
註1:covered指主文中被告匿名,無法確認哪位是哪位尾註2:need check目前剩下未列入主文的代理人或公司,還有名字英文三種出原始碼
字號、日期、案由、被告 by csferng
- https://https://github.com/csferng/AnalyzeVerdict社團
+ https:/(過期)/https://github.com/csferng/AnalyzeVerdict社團
*其他相關
*如果要顯示判決書稀少字
(21 行未修改)
2014-12-25 02:31 – 04:14 煒清 林 r3669 – r3882
顯示 diff
(113 行未修改)
*可以先觀察判決書這類表格的形式是否一致,比如說每個欄位都是由 "|(...)|" 這樣子的格式分隔開,表頭的各個欄位header亦同,但不同的地方是表頭是從 "┌(...)" 這樣子的 pattern 的下一列開始,而每一列內容則是從 "├(...)" 的下一列開始,按照這樣的規則應該可以把表格內容整併入指定的資料結構中供取用。 (不好意思,先把12/20那天的嘴砲討論先記錄一下,我還是優先會處理好職位身分的偵測,有需要再回來支援這邊的parsing)
- 我不在下資工相關科系出身,誠徵對判決書有興趣的NLP陣
+
+ 表格結構化?
+ *我對於這些表格做了些觀察,沒有統一的格式,甚至有表格內還有表格的情況,就像word一樣可畫任意表格,表格內容也不一定遵守column的schema。這個evernote有我的一些觀察和一些畸形表格”樣本” : https://www.evernote.com/l/AMe-3Qfov0xE4Yb63yOrvh7In82dIWOYGYI 。
+ *本來想把這些表格都結構化,但我想不出一個好方法。不然就退一步只結構化非常正規的表格。再者從目前task來說結構化表格似乎不是絕對必要的,例如罪名似乎可以從非結構化表格抽取,我先就直接從純文本下手試著改善罪名抽取率看看。
+
+ 如果有人對結構化表格有好方法的歡迎跳坑,畢竟結構化表格後可以更方便抽取到更多資訊。我
+ 不在下資工相關科系出身,誠徵對判決書有興趣的NLP陣
各路大神提供的Approach:
1.regular expression
(12 行未修改)
,造成原本現成的詞彙解析程式運作不能 XD 因此使用divide-n-conquer重新修改處理流程中~
*超酷XD (Y)
- *對於一樓經驗表示完全可以理解XD*抓取表格內容補足 宣告刑 欄位 -->花生
- *抓取法官欄位
+ *對於一樓經驗表示完全可以理解XD**罪名(包含從表格內的) --> 煒清
+ 抓取表格內容補足 宣告刑 欄位 -*抓取法官欄位
*查詢被告政黨屬性
------
(51 行未修改)
2014-12-23 00:40 – 00:41 張淵智 r3661 – r3668
顯示 diff
(129 行未修改)
*有的判決書一篇竟然就長達20~5萬字
,造成原本現成的詞彙解析程式運作不能 XD 因此使用divide-n-conquer重新修改處理流程中~
- *超酷XD (Y)*抓取表格內容補足 宣告刑 欄位 -->花生
+ *超酷XD (Y)
+ *對於一樓經驗表示完全可以理解XD*抓取表格內容補足 宣告刑 欄位 -->花生
*抓取法官欄位
*查詢被告政黨屬性
(52 行未修改)
2014-12-22 13:35 – 13:35 楊孟勳 r3649 – r3660
顯示 diff
(128 行未修改)
*抓取被告 工作/職位/關係 欄位--> Keith Ning
*有的判決書一篇竟然就長達20~5萬字
- ,造成原本現成的詞彙解析程式運作不能 XD 因此使用divide-n-conquer重新修改處理流程中~*抓取表格內容補足 宣告刑 欄位 -->花生
+ ,造成原本現成的詞彙解析程式運作不能 XD 因此使用divide-n-conquer重新修改處理流程中~
+ *超酷XD (Y)*抓取表格內容補足 宣告刑 欄位 -->花生
*抓取法官欄位
*查詢被告政黨屬性
(52 行未修改)
2014-12-22 08:34 – 08:37 Keith Ning r3612 – r3648
顯示 diff
(127 行未修改)
*資料擷取部份
*抓取被告 工作/職位/關係 欄位--> Keith Ning
- *抓取表格內容補足 宣告刑 欄位 -->花生
+ *有的判決書一篇竟然就長達20~5萬字
+ ,造成原本現成的詞彙解析程式運作不能 XD 因此使用divide-n-conquer重新修改處理流程中~*抓取表格內容補足 宣告刑 欄位 -->花生
*抓取法官欄位
*查詢被告政黨屬性
(26 行未修改)
註1:covered指主文中被告匿名,無法確認哪位是哪位尾註2:need check目前剩下未列入主文的代理人或公司,還有名字英文三種出原始碼
字號、日期、案由、被告 by csferng
- https://github.com/csferng/AnalyzeVerdict
- rn
- 【被告書社團
+ https://https://github.com/csferng/AnalyzeVerdict社團
*其他相關
*如果要顯示判決書稀少字
(21 行未修改)
2014-12-22 07:30 – 07:31 張淵智 r3584 – r3611
顯示 diff
(126 行未修改)
目*TO-DO list
*資料擷取部份
- *抓取被告 工作/職位/關係 欄位
- *抓取表格內容補足 宣告刑 欄位
+ *抓取被告 工作/職位/關係 欄位--> Keith Ning
+ *抓取表格內容補足 宣告刑 欄位 -->花生
*抓取法官欄位
*查詢被告政黨屬性
(54 行未修改)
2014-12-22 05:35 – 05:36 Keith Ning r3580 – r3583
顯示 diff
(112 行未修改)
有沒有大大有好想法處理這段?
- *可以先觀察判決書這類表格的形式是否一致,比如說每個欄位都是由 "|(...)|" 這樣子的格式分隔開,表頭的各個欄位header亦同,但不同的地方是表頭是從 "┌(...)" 這樣子的 pattern 的下一列開始,而每一列內容則是從 "├(...)" 的下一列開始,按照這樣的規則應該可以把表格內容整併入指定的資料結構中供取用。 (不好意思先12/20那天的嘴砲討論先記錄一下,我還是優先處理好職位身分的偵測部分,有需要再回來支援這邊的parsing)
+ *可以先觀察判決書這類表格的形式是否一致,比如說每個欄位都是由 "|(...)|" 這樣子的格式分隔開,表頭的各個欄位header亦同,但不同的地方是表頭是從 "┌(...)" 這樣子的 pattern 的下一列開始,而每一列內容則是從 "├(...)" 的下一列開始,按照這樣的規則應該可以把表格內容整併入指定的資料結構中供取用。 (不好意思,先把12/20那天的嘴砲討論先記錄一下,我還是優先會處理好職位身分的偵測,有需要再回來支援這邊的parsing)
我不在下資工相關科系出身,誠徵對判決書有興趣的NLP陣
各路大神提供的Approach:
(69 行未修改)
2014-12-22 03:27 – 03:35 Keith Ning r3442 – r3579
顯示 diff
(112 行未修改)
有沒有大大有好想法處理這段?
+ *可以先觀察判決書這類表格的形式是否一致,比如說每個欄位都是由 "|(...)|" 這樣子的格式分隔開,表頭的各個欄位header亦同,但不同的地方是表頭是從 "┌(...)" 這樣子的 pattern 的下一列開始,而每一列內容則是從 "├(...)" 的下一列開始,按照這樣的規則應該可以把表格內容整併入指定的資料結構中供取用。 (不好意思先12/20那天的嘴砲討論先記錄一下,我還是優先處理好職位身分的偵測部分,有需要再回來支援這邊的parsing)
我不在下資工相關科系出身,誠徵對判決書有興趣的NLP陣
各路大神提供的Approach:
(69 行未修改)
2014-12-21 08:39 – 09:19 張淵智 r3253 – r3441
顯示 diff
(85 行未修改)
判決書為了可讀性、整齊等等因素,會斷行。在資料處理上變得麻煩。
嘗試作了脫斷行符號的處理,另外判決書內含表格,決定先不動他:
- 100-102年地方法院判決包(脫符)7z由於目前正在處理抽取判決書欄位(第一段)的部份,欄位為(檔名/字號/時間/法院/檢察官起訴案由/被告名單),還有一些地方需要修。
- 處理中輸出的CSV
- 11-11 怒修,應該沒什麼大問題了(有四個案件沒抓到被告,但那四件都是很神奇的案子,判決結果都不受理,暫時放著):
+ 100-102年地方法院判決包(脫符)7z由於判決書欄位(第一段)的部份,欄位為(檔名/字號/時間/法院/檢察官起訴案由/被告名單),還有一些地方需要修。11-11 怒修,應該沒什麼大問題了(有四個案件沒抓到被告,但那四件都是很神奇的案子,判決結果都不受理,暫時放著):
欄位由左至右(檔名/字號/日期/法院/檢察官起訴案由/被告數/被告名單)
google試算表
- 11-28 抓了絕大部分被告的主罪,手動將判決書格式正規化,有些被告公司與代理人的部份沒處理好,有些代理人非被告,故主文不會將之列入(但有些會,判決書在這塊寫得很凌亂,還要想一下如何抽取)
+
+ 判決書欄位(第二段)的部份,11-28 抓了絕大部分被告的主罪,手動將判決書格式正規化,有些被告公司與代理人的部份沒處理好,有些代理人非被告,故主文不會將之列入(但有些會,判決書在這塊寫得很凌亂,還要想一下如何抽取)
12-
8抓了有罪被告的宣告刑,欄位(檔名/被告/罪名/徒刑/是否易科罰金/罰金/緩刑)->(連結)
+
+ 查詢g0v資料中心,發現有歷屆公職選舉資料(包含政黨屬性):
+ http://data.g0v.tw/dataset/92/resource/f52cb013-1a1c-467b-8a8c-0bef20d55936
+ 也許這是查詢政黨屬性的起步
Big TIssue遇上一個大麻煩,有一部份主文在寫被告罪刑時,用附表呈現的方式(也就是在書尾的地方寫一個表格列出),舉例:
(22 行未修改)
也可以跟其他專案整合一階段第三階段 擴充資料範圍
第一階段東西有刻出來的話,那地院就不是問題。接下來就是高等法院、最高法院的判決書處理,這時候就能夠加上案件從地方法院打到最高法院的歷審呈現。也可以爬其他相關的法律判決。
- 1*目前成果a判決
+ 1*
+ 目*TO-DO list
+ *資料擷取部份
+ *抓取被告 工作/職位/關係 欄位
+ *抓取表格內容補足 宣告刑 欄位
+ *抓取法官欄位
+ *查詢被告政黨屬性
+ ------
+ *處理高院/最高法院判決書
+ *製作與線上判決書同步更新的程式
+ *增加判決書涵蓋範圍(詐欺/圖利/財產不明/登載不實/背信)
+ *網站製作部份
+ *介面/內容規劃
+ *前端
+ *後端
+ *資料開放部份
+ *將100年後少數匿名判決書開放
+ *將99年前匿名判決書開放
+ *將起訴書開放
+ 前成果a判決
書Data package . csv:
地方法院&高等法院(2000-2014) 7z
(39 行未修改)
2014-12-19 18:56 – 18:58 張淵智 r3242 – r3252
顯示 diff
(133 行未修改)
判決書欄位(第二段部份),欄位(檔名/被告/罪名/是否易科罰金/罰金/緩刑):google試算表
- 註1:covered指主文中被告匿名,無法確認哪位是哪位尾註2:need check目前剩下未列入主文的代理人或公司,還有名字英文三種出字號、日期、案由、被告 by csferng
+ 註1:covered指主文中被告匿名,無法確認哪位是哪位尾註2:need check目前剩下未列入主文的代理人或公司,還有名字英文三種出原始碼
+ 字號、日期、案由、被告 by csferng
https://github.com/csferng/AnalyzeVerdict
rn
(24 行未修改)
2014-12-16 09:41 – 09:49 張淵智 r3198 – r3241
顯示 diff
(2 行未修改)
The Disclosure of Corruption Judgement, the Web
可能網址:blackmoney.g0v.tw 歡迎各種建議
- POREN:uncover.g0v.tw 有特務風
- *uncover.g0v.tw 之類的,感覺很有特務風XD
+ POREN:uncover.g0v.tw 之類的,感覺很有特務風XD
*緣起
(88 行未修改)
Big TIssue遇上一個大麻煩,有一部份主文在寫被告罪刑時,用附表呈現的方式(也就是在書尾的地方寫一個表格列出),舉例:
- 郭美瑩,犯如附表三編號至編號所示之罪,主文及宣告刑各如附表三編號至編號所載。
- (節錄列表)
- ┌─┬────┬─────────────────────────────┐
- │編│犯罪事實│主文及宣告刑 │
- │號│ │ │
- ├─┼────┼─────────────────────────────┤
- ││如附表一│郭美瑩共同連續犯行使偽造公文書罪,處有期徒刑壹年貳月;減為│
- │ │編號1 至│有期徒刑柒月。如附表二編號1 至編號5 所示之偽造印文、署押,│
- │ │5 所示 │及扣案之手機壹支(含電池壹個、SIM 卡壹張),均沒收。 │
- ├─┼────┼─────────────────────────────┤
+ 郭*美瑩,犯如附表三編號至編號所示之罪,主文及宣告刑各如附表三編號至編號所載。
+ (*
+ *節錄列表)
+ ┌*─┬────┬─────────────────────────────┐
+ │*編│犯罪事實│主文及宣告刑 │
+ │*號│ │ │
+ ├*─┼────┼─────────────────────────────┤
+ │*│如附表一│郭美瑩共同連續犯行使偽造公文書罪,處有期徒刑壹年貳月;減為│
+ │* │編號1 至│有期徒刑柒月。如附表二編號1 至編號5 所示之偽造印文、署押,│
+ │* │5 所示 │及扣案之手機壹支(含電池壹個、SIM 卡壹張),均沒收。 │
+ ├*─┼────┼─────────────────────────────┤
有沒有大大有好想法處理這段?
- 我不在下資工相關科系出身,誠徵對判決書有興趣的NLP高手助陣
+ 我不在下資工相關科系出身,誠徵對判決書有興趣的NLP陣
各路大神提供的Approach:
1.regular expression
- 2.machine learning
+ 2. & pattern(目前作法)machine learning
第二階段 網站上線
(11 行未修改)
-102年地方法院判決包7z
*
- ()11把9:一些當初抓跑掉的判決書補齊100-102年地方法院判決包(脫符)7z- 將 (ver1129:手動修正跑掉的格式所有地院判決【判決日期100-102年】丟到同一資料夾的版本t
+ ()11把9:一些當初抓跑掉的判決書補齊100-102年地方法院判決包(脫符)7z- 將 (ver1129:手動修正跑掉的格式所,1216發現做得不太好,很多地方沒脫到...有地院判決【判決日期100-102年】丟到同一資料夾的版本t
把判決書行
判決書欄位(第一段),欄位(檔名/字號/時間/法院/檢察官起訴案由/被告數/被告名單):google試算表
(29 行未修改)
2014-12-14 12:56 – 12:58 張淵智 r3181 – r3197
顯示 diff
(162 行未修改)
2014-12-08 13:42 – 14:15 張淵智 r2976 – r3180
顯示 diff
(76 行未修改)
絕民國100年以前大部分判決書,被告姓名與公司都被遮蓋起來,無法得知。據說司法院內部帳號可以看沒被遮蓋起來的版本。
- 11-28有寄信過去,不過還沒有回應
+ 11-28有寄信過去,不過還沒有回應:1208回應了,除了國家級研究案(如中研院申請),其他不予開放
第一階段 資料梳理、填充欄位(進行中)
(10 行未修改)
欄位由左至右(檔名/字號/日期/法院/檢察官起訴案由/被告數/被告名單)
google試算表
- 11-28 抓了絕大部分被告的主罪,手動將判決書格式正規化,有些被告公司與代理人的部份沒處理好,會再進一步切割分割。
-
- Big Trouble
- 遇上一個大麻煩,有一部份主文在寫被告罪刑時,用附表呈現的方式(也就是在書尾的地方寫一個表格列出),舉例:
+ 11-28 抓了絕大部分被告的主罪,手動將判決書格式正規化,有些被告公司與代理人的部份沒處理好,有些代理人非被告,故主文不會將之列入(但有些會,判決書在這塊寫得很凌亂,還要想一下如何抽取)
+ 12-
+ 8抓了有罪被告的宣告刑,欄位(檔名/被告/罪名/徒刑/是否易科罰金/罰金/緩刑)->(連結)
+ Big TIssue遇上一個大麻煩,有一部份主文在寫被告罪刑時,用附表呈現的方式(也就是在書尾的地方寫一個表格列出),舉例:
郭美瑩,犯如附表三編號至編號所示之罪,主文及宣告刑各如附表三編號至編號所載。
(33 行未修改)
判決書欄位(第一段),欄位(檔名/字號/時間/法院/檢察官起訴案由/被告數/被告名單):google試算表
- 尾斷行拿掉 albetaby nt90561
- https(過時)://github.com/nt90561/stripEOL
- t從判決書拿出字號、日期、案由、被告 by csferng
+ 判決書欄位(第二段部份),欄位(檔名/被告/罪名/是否易科罰金/罰金/緩刑):google試算表
+ 註1:covered指主文中被告匿名,無法確認哪位是哪位尾註2:need check目前剩下未列入主文的代理人或公司,還有名字英文三種出字號、日期、案由、被告 by csferng
https://github.com/csferng/AnalyzeVerdict
rn
- 【被告】__犯【罪名】罪。又犯【】罪。應執行【有期徒刑、罰易科金、緩刑】
- 【被告】__對於【罪名】罪
- 【被告】__犯如附表__所示之罪
-
-
- Appr
-
-
- *需求&臉書社團
+ 【被告書社團
*其他相關
*如果要顯示判決書稀少字
(21 行未修改)
2014-12-01 03:41 – 03:42 張淵智 r2942 – r2975
顯示 diff
(2 行未修改)
The Disclosure of Corruption Judgement, the Web
可能網址:blackmoney.g0v.tw 歡迎各種建議
+ POREN:uncover.g0v.tw 有特務風
*uncover.g0v.tw 之類的,感覺很有特務風XD
(164 行未修改)
2014-11-29 18:25 – 18:27 Poren Chiang r2893 – r2941
顯示 diff
(2 行未修改)
The Disclosure of Corruption Judgement, the Web
可能網址:blackmoney.g0v.tw 歡迎各種建議
+ *uncover.g0v.tw 之類的,感覺很有特務風XD
*緣起
(163 行未修改)
2014-11-28 23:25 – 23:26 張淵智 r2884 – r2892
顯示 diff
(126 行未修改)
-102年地方法院判決包7z
*
- ()11把9:一些當初抓跑掉的判決書補齊100-102年地方法院判決包(脫符)7z- 將 (ver11)9所有地院判決【判決日期100-102年】丟到同一資料夾的版本t
+ ()11把9:一些當初抓跑掉的判決書補齊100-102年地方法院判決包(脫符)7z- 將 (ver1129:手動修正跑掉的格式所有地院判決【判決日期100-102年】丟到同一資料夾的版本t
把判決書行
判決書欄位(第一段),欄位(檔名/字號/時間/法院/檢察官起訴案由/被告數/被告名單):google試算表
(38 行未修改)
2014-11-28 14:09 – 15:33 張淵智 r2655 – r2883
顯示 diff
(26 行未修改)
*
- *也許處理時也可以幫他加上工作ID
+ *資料ID暫時用檔名
+ 第一段的部份除了「案件標的」外,其他欄位已擷取:
+ google試算表
(41 行未修改)
絕民國100年以前大部分判決書,被告姓名與公司都被遮蓋起來,無法得知。據說司法院內部帳號可以看沒被遮蓋起來的版本。
+ 11-28有寄信過去,不過還沒有回應
第一階段 資料梳理、填充欄位(進行中)
(8 行未修改)
處理中輸出的CSV
11-11 怒修,應該沒什麼大問題了(有四個案件沒抓到被告,但那四件都是很神奇的案子,判決結果都不受理,暫時放著):
+ 欄位由左至右(檔名/字號/日期/法院/檢察官起訴案由/被告數/被告名單)
google試算表
+ 11-28 抓了絕大部分被告的主罪,手動將判決書格式正規化,有些被告公司與代理人的部份沒處理好,會再進一步切割分割。
+
+ Big Trouble
+ 遇上一個大麻煩,有一部份主文在寫被告罪刑時,用附表呈現的方式(也就是在書尾的地方寫一個表格列出),舉例:
+
+ 郭美瑩,犯如附表三編號至編號所示之罪,主文及宣告刑各如附表三編號至編號所載。
+ (節錄列表)
+ ┌─┬────┬─────────────────────────────┐
+ │編│犯罪事實│主文及宣告刑 │
+ │號│ │ │
+ ├─┼────┼─────────────────────────────┤
+ ││如附表一│郭美瑩共同連續犯行使偽造公文書罪,處有期徒刑壹年貳月;減為│
+ │ │編號1 至│有期徒刑柒月。如附表二編號1 至編號5 所示之偽造印文、署押,│
+ │ │5 所示 │及扣案之手機壹支(含電池壹個、SIM 卡壹張),均沒收。 │
+ ├─┼────┼─────────────────────────────┤
+
+ 有沒有大大有好想法處理這段?
我不在下資工相關科系出身,誠徵對判決書有興趣的NLP高手助陣
(7 行未修改)
也可以跟其他專案整合一階段第三階段 擴充資料範圍
第一階段東西有刻出來的話,那地院就不是問題。接下來就是高等法院、最高法院的判決書處理,這時候就能夠加上案件從地方法院打到最高法院的歷審呈現。也可以爬其他相關的法律判決。
- 1*目前成果a判決書Data package . csv:
+ 1*目前成果a判決
+ 書Data package . csv:
地方法院&高等法院(2000-2014) 7z
*解壓縮以後共2X個資料夾,H開頭為高等法院;L為地方
(5 行未修改)
()11把9:一些當初抓跑掉的判決書補齊100-102年地方法院判決包(脫符)7z- 將 (ver11)9所有地院判決【判決日期100-102年】丟到同一資料夾的版本t
把判決書行
- 判決書欄位(第一段),欄位(檔名/字號/時間/法院/檢察官起訴案由/被告名單):google試算表
+ 判決書欄位(第一段),欄位(檔名/字號/時間/法院/檢察官起訴案由/被告數/被告名單):google試算表
尾斷行拿掉 albetaby nt90561
- https://github.com/nt90561/stripEOL
+ https(過時)://github.com/nt90561/stripEOL
t從判決書拿出字號、日期、案由、被告 by csferng
https://github.com/csferng/AnalyzeVerdict
(8 行未修改)
*需求&臉書社團
- *相關專案
+ *其他相關
+ *如果要顯示判決書稀少字
+ 司法院對於非big5編碼的字會用造字的方式處理,並提供下載:
+ http://www.judicial.gov.tw/download/download01.asp#D01
+ 我自己使用的經驗,確實有些字因此顯示,但還是不全
+
+ *相關連結
+ FB貼文:中國國民黨政權涉及回扣貪汙一覽表(一)~(四)
+ 蘋論:彰化這一戰很關鍵
+ FB貼文:國民黨未來對台灣危害最大的將是朱立倫,他是馬英九加強版。
+ 八卦版文章:中國黨貪污一覽表
+
議員判刑資料中文處理工具簡介
(9 行未修改)
2014-11-14 09:52 – 09:53 張淵智 r2642 – r2654
顯示 diff
(123 行未修改)
*需求&臉書社團
*相關專案
- 議員判刑資料
+ 議員判刑資料中文處理工具簡介
+
政商透明化
(7 行未修改)
2014-11-10 19:16 – 19:26 張淵智 r2565 – r2641
顯示 diff
(82 行未修改)
嘗試作了脫斷行符號的處理,另外判決書內含表格,決定先不動他:
100-102年地方法院判決包(脫符)7z由於目前正在處理抽取判決書欄位(第一段)的部份,欄位為(檔名/字號/時間/法院/檢察官起訴案由/被告名單),還有一些地方需要修。
- 處理中輸出的CSV:
+ 處理中輸出的CSV
+ 11-11 怒修,應該沒什麼大問題了(有四個案件沒抓到被告,但那四件都是很神奇的案子,判決結果都不受理,暫時放著):
google試算表
(17 行未修改)
*
()11把9:一些當初抓跑掉的判決書補齊100-102年地方法院判決包(脫符)7z- 將 (ver11)9所有地院判決【判決日期100-102年】丟到同一資料夾的版本t
- 把判決書行尾斷行拿掉 albetaby nt90561
+ 把判決書行
+ 判決書欄位(第一段),欄位(檔名/字號/時間/法院/檢察官起訴案由/被告名單):google試算表
+
+ 尾斷行拿掉 albetaby nt90561
https://github.com/nt90561/stripEOL
t從判決書拿出字號、日期、案由、被告 by csferng
(22 行未修改)
2014-11-09 14:37 – 15:27 張淵智 r2440 – r2564
顯示 diff
(27 行未修改)
*
*也許處理時也可以幫他加上工作ID
+
第二段:被告部份
(48 行未修改)
判決書為了可讀性、整齊等等因素,會斷行。在資料處理上變得麻煩。
- 嘗試作了脫斷行符號的處理,有一些地方該斷行的會沒斷到(11/3修改一些小地方,應該切得更精準了),另外判決書內含表格,還要想該如何處理比較好。至少資料乾淨許多,這是處理過後的壓縮檔:
- 100-102年地方法院判決包(脫符)7z由於我不在下資工相關科系出身,誠徵對判決書有興趣的NLP高手助陣
+ 嘗試作了脫斷行符號的處理,另外判決書內含表格,決定先不動他:
+ 100-102年地方法院判決包(脫符)7z由於目前正在處理抽取判決書欄位(第一段)的部份,欄位為(檔名/字號/時間/法院/檢察官起訴案由/被告名單),還有一些地方需要修。
+ 處理中輸出的CSV:
+ google試算表
+
+ 我不在下資工相關科系出身,誠徵對判決書有興趣的NLP高手助陣
各路大神提供的Approach:
1.regular expression
(11 行未修改)
最高法院(1996-2014) 7z
1
- 00-102年地方法院判決包7z
- *
- 100-102年地方法院判決包(脫符)7z- 將所有地院判決【判決日期100-102年】丟到同一資料夾的版本t
+ -102年地方法院判決包7z
+ *
+ ()11把9:一些當初抓跑掉的判決書補齊100-102年地方法院判決包(脫符)7z- 將 (ver11)9所有地院判決【判決日期100-102年】丟到同一資料夾的版本t
把判決書行尾斷行拿掉 albetaby nt90561
https://github.com/nt90561/stripEOL
(23 行未修改)
2014-11-09 04:29 張淵智 r2439
顯示 diff
(126 行未修改)
2014-11-03 10:20 – 10:22 張淵智 r2409 – r2438
顯示 diff
(79 行未修改)
判決書為了可讀性、整齊等等因素,會斷行。在資料處理上變得麻煩。
- 嘗試作了脫斷行符號的處理,有一些地方該斷行的會沒斷到,另外判決書內含表格,還要想該如何處理比較好。至少資料乾淨許多,這是處理過後的壓縮檔:
- 100-102年地方法院判決包(脫符)7z由於我不是資工相關科系出身,誠徵對判決書有興趣的NLP高手助陣
+ 嘗試作了脫斷行符號的處理,有一些地方該斷行的會沒斷到(11/3修改一些小地方,應該切得更精準了),另外判決書內含表格,還要想該如何處理比較好。至少資料乾淨許多,這是處理過後的壓縮檔:
+ 100-102年地方法院判決包(脫符)7z由於我不在下資工相關科系出身,誠徵對判決書有興趣的NLP高手助陣
各路大神提供的Approach:
1.regular expression
(14 行未修改)
*
100-102年地方法院判決包(脫符)7z- 將所有地院判決【判決日期100-102年】丟到同一資料夾的版本t
- 把判決書行尾斷行拿掉 alpha版 by nt90561
+ 把判決書行尾斷行拿掉 albetaby nt90561
https://github.com/nt90561/stripEOL
t從判決書拿出字號、日期、案由、被告 by csferng
(22 行未修改)
2014-11-01 12:35 – 12:45 張淵智 r2328 – r2408
顯示 diff
(77 行未修改)
- 有個麻煩:
- 判決書為了可讀性、整齊等等因素,會斷行。在資料處理上變得麻煩。
- 由於我不是資工相關科系出身,誠徵對判決書有興趣的NLP高手助陣
+ 判決書為了可讀性、整齊等等因素,會斷行。在資料處理上變得麻煩。
+ 嘗試作了脫斷行符號的處理,有一些地方該斷行的會沒斷到,另外判決書內含表格,還要想該如何處理比較好。至少資料乾淨許多,這是處理過後的壓縮檔:
+ 100-102年地方法院判決包(脫符)7z由於我不是資工相關科系出身,誠徵對判決書有興趣的NLP高手助陣
各路大神提供的Approach:
1.regular expression
(10 行未修改)
* ex HKaohsiung高雄高等分院;LTaipei台北地方法院
最高法院(1996-2014) 7z
- 100-102年地方法院判決包7z
- *- 將所有地院判決【判決日期100-102年】丟到同一資料夾的版本t
+ 1
+ 00-102年地方法院判決包7z
+ *
+ 100-102年地方法院判決包(脫符)7z- 將所有地院判決【判決日期100-102年】丟到同一資料夾的版本t
把判決書行尾斷行拿掉 alpha版 by nt90561
https://github.com/nt90561/stripEOL
(23 行未修改)
2014-10-21 04:12 – 04:12 張淵智 r2323 – r2327
顯示 diff
(87 行未修改)
第二階段 網站上線
部份資料處理好之後,就可以開始想查詢網站的問題。
- 相對一般會google的問題,使用者知道問題但不知道答案;貪污查詢很可能面臨使用者「不知道問題也不知道答案」。問也許可以跟其他專案整合一階段第三階段 擴充資料範圍
+ 相對一般會google的問題,使用者知道問題但不知道答案;貪污查詢很可能面臨使用者「不知道問題也不知道答案」。問可以跟過去的新聞報導作連結
+ 也可以跟其他專案整合一階段第三階段 擴充資料範圍
第一階段東西有刻出來的話,那地院就不是問題。接下來就是高等法院、最高法院的判決書處理,這時候就能夠加上案件從地方法院打到最高法院的歷審呈現。也可以爬其他相關的法律判決。
1*目前成果a判決書Data package . csv:
(31 行未修改)
2014-10-18 11:06 – 11:12 張淵智 r2285 – r2322
顯示 diff
(110 行未修改)
*需求&臉書社團
+ *相關專案
+ 議員判刑資料
+ 政商透明化
+
我們歡迎下列各種夥伴:
*對判決書閱讀熟悉敏銳
(5 行未修改)
2014-10-18 04:45 – 05:20 張淵智 r2254 – r2284
顯示 diff
(17 行未修改)
*牽涉政治人物的案子
*跟企業財團有關的案子
+ 與金權政治相關的法律刑責:1.貪污 2.賄選 3.公務員財產不明 4.公務員登錄不實 5.公務員洩密
*預設欄位
(66 行未修改)
部份資料處理好之後,就可以開始想查詢網站的問題。
相對一般會google的問題,使用者知道問題但不知道答案;貪污查詢很可能面臨使用者「不知道問題也不知道答案」。問也許可以跟其他專案整合一階段第三階段 擴充資料範圍
- 第一階段東西有刻出來的話,那地院就不是問題。接下來就是高等法院、最高法院的判決書處理,這時候就能夠加上案件從地方法院打到最高法院的歷審呈現。
+ 第一階段東西有刻出來的話,那地院就不是問題。接下來就是高等法院、最高法院的判決書處理,這時候就能夠加上案件從地方法院打到最高法院的歷審呈現。也可以爬其他相關的法律判決。
1*目前成果a判決書Data package . csv:
地方法院&高等法院(2000-2014) 7z
(26 行未修改)
2014-10-17 17:12 – 17:12 張淵智 r2252 – r2253
顯示 diff
(118 行未修改)
2014-10-17 15:42 – 15:42 張淵智 r2248 – r2251
顯示 diff
(115 行未修改)
*對貪腐、貪污、官商勾結等相關議題有興趣
↓↓↓
- https://www.facebook.com/groups/876229695725086/a歡迎加入討論s:
+ https://www.facebook.com/groups/876229695725086/a歡迎加入討論s
2014-10-13 06:40 – 06:41 張淵智 r2205 – r2247
顯示 diff
(94 行未修改)
最高法院(1996-2014) 7z
100-102年地方法院判決包7z
- *- 將所有地院判決【判決日期100-102年】丟到同一資料夾的版本tt從判決書拿出字號、日期、案由、被告 by csferng
+ *- 將所有地院判決【判決日期100-102年】丟到同一資料夾的版本t
+ 把判決書行尾斷行拿掉 alpha版 by nt90561
+ https://github.com/nt90561/stripEOL
+ t從判決書拿出字號、日期、案由、被告 by csferng
https://github.com/csferng/AnalyzeVerdict
rn
(16 行未修改)
2014-10-12 06:55 – 08:51 張淵智 r1564 – r2204
顯示 diff
(25 行未修改)
*
- ID為另行加上
+ *也許處理時也可以幫他加上工作ID
第二段:被告部份
*
-
- *專案各階段
- 第零階段 從網路上爬貪污判決書(已完成)
- 第一階段 梳理資料、抽取欄位:
- 民國100 -1
- 2 年 , 地院判決書 (案由:貪污)
- 100-102年被告不匿名,易做後續處理
- 欄位:
- *姓名:[被告]
- *工作/職位/關係: [事實] (相對難)
- *罪名 : [主文]or[附錄]
- *有期徒刑 :[主文] 以月計算
- *易科罰金:[主文] 徒刑是否能夠換成罰金
- *緩刑:[主文] 是否有緩刑
- *涉貪金額:[主文][事實][附錄] 以元計算
工人智慧/範例:
(2 行未修改)
*工作/職位/關係:立法委員, 中國國民黨之中央政策委員會執行長
*罪名:恐嚇得利罪, 公務員財產不明罪
- *有期徒刑:88個月
+ *有期徒刑:88月
*易科罰金:FALSE
- *緩刑:FALSE
- *涉貪金額:63
- 00000
+ *緩刑:
+ 年*涉貪金額:63000000
*雖然林益世索賄8300萬,不過實際收到是6300萬。以6300萬計算。
*-
(13 行未修改)
*工作/職位/關係:沈若蘭之弟
*罪名:無罪
- pattern
- 【被告】__犯【罪名】罪。又犯【】罪。應執行【有期徒刑、罰易科金、緩刑】
- 【被告】__對於【罪名】罪
- 【被告】__犯如附表__所示之罪
+ *
+ *專案各階段
+ 第零階段 爬貪污判決書(已完成)
+ 2利14-8
+ 用iMacros從法律法源網爬所有案由為貪污的判決書,(csv檔)地方高、等最、高三審級皆以爬完。不律法源網的更新
+ 頻率沒有司法院資料庫高,但是他的搜索系統比較完整好用。
+ 判決書Data package . csv:
+ 地方法院&高等法院(2000-2014) 7z
+ *解壓縮以後共2X個資料夾,H開頭為高等法院;L為地方
+ * ex HKaohsiung高雄高等分院;LTaipei台北地方法院
+ 最高法院(1996-2014) 7z
+ 待解問題:
+ 絕民國100年以前大部分判決書,被告姓名與公司都被遮蓋起來,無法得知。據說司法院內部帳號可以看沒被遮蓋起來的版本。
- Approach:
+ 第一階段 資料梳理、填充欄位(進行中)
+ 由於發現到的遮蓋問題,決定先縮小處理範圍當作嘗試。民100-102年的判決書除了少數重審的案件外,其他都沒有匿名;而地院的內容相對單純,於是把他拉出來單獨打包:0-102年地方法院判決包7z
+ *將所有- 地院判決【判決日期100-102年】丟到同一資料夾的版本
+
+ 發
+ 有個麻煩:
+ 判決書為了可讀性、整齊等等因素,會斷行。在資料處理上變得麻煩。
+
+ 由於我不是資工相關科系出身,誠徵對判決書有興趣的NLP高手助陣
+ 各路大神提供的Approach:
1.regular expression
2.machine learning
-
- 搜尋系統構想:
- 1.搜尋人名可以出現上述欄位
- 2.有待構思
- 判決書Data packa88ge . csv:
+ 第二階段 網站上線
+ 部份資料處理好之後,就可以開始想查詢網站的問題。
+ 相對一般會google的問題,使用者知道問題但不知道答案;貪污查詢很可能面臨使用者「不知道問題也不知道答案」。問也許可以跟其他專案整合一階段第三階段 擴充資料範圍
+ 第一階段東西有刻出來的話,那地院就不是問題。接下來就是高等法院、最高法院的判決書處理,這時候就能夠加上案件從地方法院打到最高法院的歷審呈現。
+ 1*目前成果a判決書Data package . csv:
+ 地方法院&高等法院(2000-2014) 7z
+ *解壓縮以後共2X個資料夾,H開頭為高等法院;L為地方
+ * ex HKaohsiung高雄高等分院;LTaipei台北地方法院
+ 最高法院(1996-2014) 7z
100-102年地方法院判決包7z
- *將所有地院判決【判決日期100-102年】丟到同一資料夾的版本方地方法院&高等法院(2000-2014) 7z解壓縮以後共2X個資料夾,H開頭為高等法院;L為地方
- * ex HKaohsiung高雄高等分院;LTaipei台北地方法院高法院最高法院(1996-2014) 7zt目前成果:
- 從判決書拿出字號、日期、案由、被告
+ *- 將所有地院判決【判決日期100-102年】丟到同一資料夾的版本tt從判決書拿出字號、日期、案由、被告 by csferng
https://github.com/csferng/AnalyzeVerdict
+ rn
+ 【被告】__犯【罪名】罪。又犯【】罪。應執行【有期徒刑、罰易科金、緩刑】
+ 【被告】__對於【罪名】罪
+ 【被告】__犯如附表__所示之罪
- 需求:
- 自然語言處理
- UI/UX
- 社團:https://www.facebook.com/groups/876229695725086/
+
+ Appr
+
+
+ *需求&臉書社團
+ 我們歡迎下列各種夥伴:
+ *對判決書閱讀熟悉敏銳
+ *自然語言處理高手
+ *對網站提供內容有想法
+ *對貪腐、貪污、官商勾結等相關議題有興趣
+ ↓↓↓
+ https://www.facebook.com/groups/876229695725086/a歡迎加入討論s:
2014-10-12 04:15 – 05:51 張淵智 r1180 – r1563
顯示 diff
(1 行未修改)
(暫名,尚缺副標)
The Disclosure of Corruption Judgement, the Web
- blackmoney.g0v.tw
+ 可能網址:blackmoney.g0v.tw 歡迎各種建議
+ *緣起
+ *貪污是個表面上看起來沒什麼,實際上會對社會造成侵蝕的嚴重病灶
+ *有些人會講「水至清則無魚」、「無能比貪污更要不得」,但通常例子是官員收錢所以開始選擇性做事,有益人民的事情不作為,變成「無能」
+ *但是貪污不好查,接著想到有貪污法案,法院有判決書,也許可以從判決書切入
+ *然後發現判決書落落長,動輒數百頁,如果可以用簡單方式呈現那不就太好了嗎!
- 目標:
- 打造一個查詢貪污與判決結果的查詢網站
- 揭露台面上人物的貪污案底
- 簡單查詢、簡單得知結果
- 第一階段--梳理資料、抽取欄位:
+ *目標
+ *一個查詢貪污與判決結果的查詢網站
+ *不搞法理解釋、不提論述心證,用簡單幾個欄位呈現判決結果,告訴你「某某某當年就有貪污案底」
+ 一般民眾在意的點:
+ *金額大的案子
+ *牽涉政治人物的案子
+ *跟企業財團有關的案子
+
+ *預設欄位
+ 由於一個案件通常會有複數被告,因此抽取案件資料傾向於以人作為抽取重點,這裡我的想法是一個判決書以兩段資料呈現:第一段是判決書的欄位,一份判決書一筆;第二段是被告的欄位,每個被告都有自己的欄位,故筆數取決於被告人數
+ 以下是我想到覺得重要的欄位,歡迎各種建議
+
+ 第一段:判決書部份
+
+ *
+ ID為另行加上
+
+ 第二段:被告部份
+ *
+
+ *專案各階段
+ 第零階段 從網路上爬貪污判決書(已完成)
+ 第一階段 梳理資料、抽取欄位:
民國100 -1
2 年 , 地院判決書 (案由:貪污)
(62 行未修改)
2014-09-24 11:33 – 11:33 張淵智 r1174 – r1179
顯示 diff
(63 行未修改)
2.有待構思
- 判決書Data package . csv:
+ 判決書Data packa88ge . csv:
100-102年地方法院判決包7z
*將所有地院判決【判決日期100-102年】丟到同一資料夾的版本方地方法院&高等法院(2000-2014) 7z解壓縮以後共2X個資料夾,H開頭為高等法院;L為地方
(8 行未修改)
2014-09-04 03:34 – 03:36 張淵智 r1165 – r1173
顯示 diff
(20 行未修改)
*易科罰金:[主文] 徒刑是否能夠換成罰金
*緩刑:[主文] 是否有緩刑
- *賄額:[主文][事實][附錄] 以元計算
+ *涉貪金額:[主文][事實][附錄] 以元計算
工人智慧/範例:
(5 行未修改)
*易科罰金:FALSE
*緩刑:FALSE
- *賄額:63
+ *涉貪金額:63
00000
*雖然林益世索賄8300萬,不過實際收到是6300萬。以6300萬計算。
(14 行未修改)
*工作/職位/關係:沈若蘭之弟
*罪名:無罪
- murmur:一般來說,所有被告應該分別介紹,而不會像此案只介紹林益世;又所謂公務人員財產不明罪是法界批評很凶的法條,原因之一它提供貪污者一個不吐實的動機:我只要什麼都推說不知道,你就只能判我這個。林益世就是這樣。
pattern
【被告】__犯【罪名】罪。又犯【】罪。應執行【有期徒刑、罰易科金、緩刑】
(23 行未修改)
2014-09-03 14:16 – 15:25 張淵智 r894 – r1164
顯示 diff
(7 行未修改)
打造一個查詢貪污與判決結果的查詢網站
揭露台面上人物的貪污案底
+ 簡單查詢、簡單得知結果
- 第一階段:
+ 第一階段--梳理資料、抽取欄位:
民國100 -1
2 年 , 地院判決書 (案由:貪污)
(1 行未修改)
欄位:
*姓名:[被告]
- *工作/職位 [事實] (相對難)
+ *工作/職位/關係: [事實] (相對難)
*罪名 : [主文]or[附錄]
- *有期徒刑 :[主文]
- *罰金:[主文]
- *緩刑:[主文]
- *賄額:[主文][事實][附錄]
+ *有期徒刑 :[主文] 以月計算
+ *易科罰金:[主文] 徒刑是否能夠換成罰金
+ *緩刑:[主文] 是否有緩刑
+ *賄額:[主文][事實][附錄] 以元計算
+ 工人智慧/範例:
+ 林益世貪污案一審
+ *姓名:林益世
+ *工作/職位/關係:立法委員, 中國國民黨之中央政策委員會執行長
+ *罪名:恐嚇得利罪, 公務員財產不明罪
+ *有期徒刑:88個月
+ *易科罰金:FALSE
+ *緩刑:FALSE
+ *賄額:63
+ 00000
+ *雖然林益世索賄8300萬,不過實際收到是6300萬。以6300萬計算。
+ *-
+ *姓名:沈若蘭
+ *工作/職位/關係:林益世之母
+ *罪名:無罪
+ *-
+ *姓名:彭愛佳
+ *工作/職位/關係:林益世之配偶
+ *罪名:無罪
+ *-
+ *姓名:沈煥章
+ *工作/職位/關係:沈若蘭之弟
+ *罪名:無罪
+ *-
+ *姓名:沈煥瑶
+ *工作/職位/關係:沈若蘭之弟
+ *罪名:無罪
+ murmur:一般來說,所有被告應該分別介紹,而不會像此案只介紹林益世;又所謂公務人員財產不明罪是法界批評很凶的法條,原因之一它提供貪污者一個不吐實的動機:我只要什麼都推說不知道,你就只能判我這個。林益世就是這樣。
pattern
- 【被告】__犯【罪名】罪。又犯【】罪。應執行【有期徒刑、罰金、緩刑】
+ 【被告】__犯【罪名】罪。又犯【】罪。應執行【有期徒刑、罰易科金、緩刑】
【被告】__對於【罪名】罪
【被告】__犯如附表__所示之罪
(21 行未修改)
2014-08-31 06:53 – 08:32 張淵智 r569 – r893
顯示 diff
(1 行未修改)
(暫名,尚缺副標)
The Disclosure of Corruption Judgement, the Web
- discorruption.g0v.tw
+ blackmoney.g0v.tw
(5 行未修改)
民國100 -1
2 年 , 地院判決書 (案由:貪污)
+ 100-102年被告不匿名,易做後續處理
欄位:
*姓名:[被告]
(4 行未修改)
*緩刑:[主文]
*賄額:[主文][事實][附錄]
-
+ pattern
+ 【被告】__犯【罪名】罪。又犯【】罪。應執行【有期徒刑、罰金、緩刑】
+ 【被告】__對於【罪名】罪
+ 【被告】__犯如附表__所示之罪
(5 行未修改)
1.搜尋人名可以出現上述欄位
2.有待構思
-
- 判決書Data package:
- 地方法院&高等法院(200)-2 147z
- https://drive.google.com/file/d/0B9fzCPAUltsqOElYc1N0TFRaSTg/edit?usp=sharing
- 最高法院
-
- (1996-2)14
- 7z
- https://drive.google.com/file/d/0B9fzCPAUltsqZVBLNE1zclRFYnM/edit?usp=sharing
- 目前成果:
+ 判決書Data package . csv:
+ 100-102年地方法院判決包7z
+ *將所有地院判決【判決日期100-102年】丟到同一資料夾的版本方地方法院&高等法院(2000-2014) 7z解壓縮以後共2X個資料夾,H開頭為高等法院;L為地方
+ * ex HKaohsiung高雄高等分院;LTaipei台北地方法院高法院最高法院(1996-2014) 7zt目前成果:
從判決書拿出字號、日期、案由、被告
https://github.com/csferng/AnalyzeVerdict
(5 行未修改)
2014-08-31 06:42 – 06:42 吳長鋼 r567 – r568
顯示 diff
(19 行未修改)
*緩刑:[主文]
*賄額:[主文][事實][附錄]
+
+
+
Approach:
(24 行未修改)
2014-08-31 06:15 – 06:15 張淵智 r562 – r566
顯示 diff
透析貪污判決--揭露與查詢網站
- (尚缺副標)
+ (暫名,尚缺副標)
The Disclosure of Corruption Judgement, the Web
- (暫名)
discorruption.g0v.tw
(42 行未修改)
2014-08-31 06:11 – 06:14 吳長鋼 r556 – r561
顯示 diff
透析貪污判決--揭露與查詢網站
+ (尚缺副標)
The Disclosure of Corruption Judgement, the Web
(暫名)
- discorruption
+ discorruption.g0v.tw
+
目標:
(40 行未修改)
2014-08-31 05:32 – 06:11 張淵智 r415 – r555
顯示 diff
透析貪污判決--揭露與查詢網站
The Disclosure of Corruption Judgement, the Web
-
(暫名)
+ discorruption
目標:
(5 行未修改)
2 年 , 地院判決書 (案由:貪污)
欄位:
- 姓名:[被告]
- 工作/職位 [事實] (相對難)
- 罪名 : [主文]or[附錄]
- 有期徒刑 :[主文]
- 罰金:[主文]
- 緩刑:[主文]
- 賄額:[主文][事實][附錄]
+ *姓名:[被告]
+ *工作/職位 [事實] (相對難)
+ *罪名 : [主文]or[附錄]
+ *有期徒刑 :[主文]
+ *罰金:[主文]
+ *緩刑:[主文]
+ *賄額:[主文][事實][附錄]
+
+ Approach:
+ 1.regular expression
+ 2.machine learning
搜尋系統構想:
1.搜尋人名可以出現上述欄位
- 2.
-
-
- 需求:
- 自然語言處理U
- I/UX
+ 2.有待構思
判決書Data package:
(7 行未修改)
目前成果:
- 今天進度:從判決書拿出字號、日期、案由、被告 by
+ 從判決書拿出字號、日期、案由、被告
https://github.com/csferng/AnalyzeVerdict
+
+ 需求:
+ 自然語言處理
+ UI/UX
社團:https://www.facebook.com/groups/876229695725086/
2014-08-31 03:09 – 03:57 張淵智 r338 – r414
顯示 diff
(20 行未修改)
搜尋系統構想:
- 1,搜尋人名可以出現上述欄位
+ 1.搜尋人名可以出現上述欄位
2.
(3 行未修改)
I/UX
- 臉書社團:https://www.facebook.com/groups/876229695725086/
+ 判決書Data package:
+ 地方法院&高等法院(200)-2 147z
+ https://drive.google.com/file/d/0B9fzCPAUltsqOElYc1N0TFRaSTg/edit?usp=sharing
+ 最高法院
+
+ (1996-2)14
+ 7z
+ https://drive.google.com/file/d/0B9fzCPAUltsqZVBLNE1zclRFYnM/edit?usp=sharing
+
+ 目前成果:
+ 今天進度:從判決書拿出字號、日期、案由、被告 by
+ https://github.com/csferng/AnalyzeVerdict
+ 社團:https://www.facebook.com/groups/876229695725086/
2014-08-30 12:48 張淵智 r337
顯示 diff
(31 行未修改)
2014-08-30 12:47 (unknown) r336
顯示 diff
(31 行未修改)
2014-08-30 12:46 – 12:47 張淵智 r313 – r335
顯示 diff
(24 行未修改)
- 人力需求:
- 自然語言處理高手U
+ 需求:
+ 自然語言處理U
+ I/UX
+
+ 臉書社團:https://www.facebook.com/groups/876229695725086/
2014-08-30 12:46 (unknown) r312
顯示 diff
(28 行未修改)
2014-08-30 12:43 – 12:46 張淵智 r278 – r311
顯示 diff
透析貪污判決--揭露與查詢網站
- Disclosure of Corruption Judgement, the Web
+ The Disclosure of Corruption Judgement, the Web
(暫名)
(9 行未修改)
姓名:[被告]
工作/職位 [事實] (相對難)
- 罪名 : [主文]
+ 罪名 : [主文]or[附錄]
有期徒刑 :[主文]
罰金:[主文]
緩刑:[主文]
- 賄額:
+ 賄額:[主文][事實][附錄]
搜尋系統構想:
1,搜尋人名可以出現上述欄位
2.
+
+
+ 人力需求:
+ 自然語言處理高手U
2014-08-30 09:45 – 10:00 張淵智 r204 – r277
顯示 diff
透析貪污判決--揭露與查詢網站
+ Disclosure of Corruption Judgement, the Web
(暫名)
(14 行未修改)
緩刑:[主文]
賄額:
+
+ 搜尋系統構想:
+ 1,搜尋人名可以出現上述欄位
+ 2.
2014-08-30 09:34 – 09:37 吳長鋼 r161 – r203
顯示 diff
(10 行未修改)
2 年 , 地院判決書 (案由:貪污)
欄位:
- 姓名
- 工作/職位
- 罪名
- 有期徒刑
- 罰金
- 緩刑
- 賄額
+ 姓名:[被告]
+ 工作/職位 [事實] (相對難)
+ 罪名 : [主文]
+ 有期徒刑 :[主文]
+ 罰金:[主文]
+ 緩刑:[主文]
+ 賄額:
2014-08-30 09:28 – 09:29 張淵智 r156 – r160
顯示 diff
(8 行未修改)
第一階段:
民國100 -1
- 2 年 , 地院判決書 (案由)
+ 2 年 , 地院判決書 (案由:貪污)
+ 欄位:
+ 姓名
+ 工作/職位
+ 罪名
+ 有期徒刑
+ 罰金
+ 緩刑
+ 賄額
2014-08-30 09:19 – 09:24 吳長鋼 r116 – r155
顯示 diff
(7 行未修改)
第一階段:
+ 民國100 -1
+ 2 年 , 地院判決書 (案由)
2014-08-30 09:16 – 09:16 張淵智 r112 – r115
顯示 diff
(7 行未修改)
第一階段:
-
- ㄍ
2014-08-30 09:16 吳長鋼 r111
顯示 diff
(6 行未修改)
揭露台面上人物的貪污案底
- 第一階段
+ 第一階段:
2014-08-30 09:16 張淵智 r110
顯示 diff
(7 行未修改)
第一階段
+
+ ㄍ
2014-08-30 09:15 – 09:16 吳長鋼 r103 – r109
顯示 diff
(5 行未修改)
打造一個查詢貪污與判決結果的查詢網站
揭露台面上人物的貪污案底
+
+ 第一階段
2014-08-30 09:11 – 09:15 張淵智 r52 – r102
顯示 diff
(4 行未修改)
目標:
打造一個查詢貪污與判決結果的查詢網站
- 揭露
+ 揭露台面上人物的貪污案底
2014-08-30 09:11 (unknown) r51
顯示 diff
(7 行未修改)
2014-08-30 09:03 – 09:11 張淵智 r1 – r50
顯示 diff
- Untitled
+ 透析貪污判決--揭露與查詢網站
- This pad text is synchronized as you type, so that everyone viewing this page sees the same text. This allows you to collaborate seamlessly on documents!
+ (暫名)
+
+ 目標:
+ 打造一個查詢貪污與判決結果的查詢網站
+ 揭露
2014-08-30 09:03 (unknown) r0
顯示 diff
+ Untitled
+ This pad text is synchronized as you type, so that everyone viewing this page sees the same text. This allows you to collaborate seamlessly on documents!