AIFR Group

Sentencing Information System Project 量刑資訊系統之AI標註與優化發展計畫

一、背景說明

刑事案件中，法官依據法律所規定的裁量原則與社會倫理判定犯罪者所應受的刑罰稱之為量刑(Sentencing)。但是如同一句名言：「人生有多難，量刑就有多難」，量刑的結果一般很難有個讓所有當事人或社會大眾都感到滿意。鑒於量刑常被批評為受到法官自由心證影響的黑盒子，導致有量刑歧異而使國民對於司法之信賴不足，司法院近十年來先後建置「量刑資訊系統」與「量刑趨勢建議系統」，藉以整合量刑資訊，盼提供以案件特徵為基礎的量刑標準供法官及人民參考。

但是現行的量刑資訊系統是先以傳統人工方式閱讀過往判決，經人工判讀後標註為某項「量刑因子」而儲存在資料庫中。法官或使用者再根據其案件的特性點選相關的條件，讓系統從資料庫中找出與當前判決有類似之判決結果做為參考。但過往的系統常被詬病需要點選太多詳細資訊到後來卻很難找到符合的判決。此外人工標註耗費的資源龐大，不容易即時更新判決的結果。

本計畫受司法院刑事廳委託，開發一個可以更新或取代現有量刑資訊系統的電腦系統，以期減少法官查詢類似判決書的時間，並且能用AI技術來取代人工標註。本計畫同時與清華大學科技法律研究所連孟琦教授、中正大學法律系盧映潔教授、謝國欣教授，共同執行，處理槍砲彈藥、妨害性自主、以及毒品三類案件。相關的研究結果未來亦有機會擴展至其他案件。

二、計畫內容簡介：AI自動標註系統

本計畫分法律部分與技術部分，前者由法律領域的研究團隊進行判決書的標註與研究。此處僅簡述技術部分的內容，且特別針對使用AI技術作自動標註與新版量刑資訊系統作說明。其他部分請見司法院相關的研究報告。

經由法律團隊的人工標註，三類案件都各已標註超過1000篇以上的判決，並且各自得到超過5000句以上的量刑因子。本計畫的自動標註流程包括基本的訓練與測試流程。一個句子會先被送到量刑審酌事項類型判斷(例如犯罪後之態度、犯罪所生之危險或損害、被害人的態度等等量刑因子)的分類器，接著才送到量刑評價判斷(如對被告有利/對被告不利/中性或不確定)的分類器，而這兩個分類器的判斷彼此間是獨立的。這樣做的好處是，如果某個句子同時可以歸屬於兩類以上的因子，亦可以被適當的標註而非互相排擠。最後，我們再根據每一個量刑審酌事項所得到文句分類結果，作綜合性判斷屬於整篇判決書的評價，如下圖。

(Caption): Flow Chart of Sentencing Project

為提升自然語言處理的AI模型準確度，本計畫研究團隊是使用源自google團隊開發的自然語言預訓練模型Bidirectional Encoder Representations from Transformers (BERT，基於變換器的雙向編碼器表示技術)來作自然語言處理的前端預訓練程式，訓練出具有深度雙向且無監督式的純文字語料模型，將裁判書中已經經由人工標註所得到的相關文字做訓練，並採用遷移式訓練模型，transfer learning model來提升文句的分類效果，將向量再送入遞歸神經網路(Recurrent Neural Network)作二分類或三分類的模型，以此了解法官量刑因子書寫的特色，使之能找出對應的文字分類。

AI語意分類模型的測試結果顯示，量刑審酌事項都有相當高的正確度(>97%)。不管是從預測的準確率或是否完整的找到相關的句子的能力上，代表我們的模型能夠順利的分辨這些類型的因子。而評價判斷模型的預測結果，正確度皆超過93%，顯示相當一致的結果。以下先以槍砲彈藥案件中判斷「犯罪後之態度」與「犯罪所生之危險與損害」為例：

(Caption): Prediction of Sentencing Project

接著我們利用這個文字分類模型對未標註的判決書進行測試。主要是針對判決書中以「爰以」或「爰審酌」開頭的段落，先以特定的關鍵字來進行斷句，然後將每句話輸入以上的模型來分辨是否屬於某個量刑因子或是否對被告有利或不利。以下以一篇實際的判決書測試的結果為例：

上圖為AI自動標註對於未標註的判決書之量刑審酌事項預測機率與判斷結果，以隨機選擇的兩篇判決書為例。其中黃底色的格子代表類型判斷中，機率被預測大於0.5的類型。灰底色的格子代表評價分類中機率相對較大的選項。最右邊的欄位代表AI自動標註的結果，其中「無」代表該句子在類型判斷中無法歸類於四類中任何一類，所以就不會作任何標註。黑色與紅色字分別代表AI自動標註正確或有錯誤的地方(經由人工事後判斷)。對於量刑資訊系統而言，這個自動標註的重點在於為「全篇判決」決定某些量刑審酌事項的結果，而非裡面每一句的判斷都需要準確。因此，即便有些許的標註可能有預測錯誤，但是對於整篇判決標註的影響應該比預期的還要小，這也是此種複雜的判決書難以避免的部分(甚至人工閱讀也可能有誤)。標註結果可以藉由本系統的標註修改平台進行人工修改，讓這些錯誤有機會修正，後來更可以反過來成為未來AI自動標註時的訓練資料。

三、計畫內容簡介：新型量刑資訊系統

本計畫對於量刑資訊系統的前端網頁設計理念是，以法官的使用方便性作為最優先的考慮(而不是從資訊工程角度的粗略資料呈現)。目標是法官只需要點選少數幾個加重減輕的條文或量刑審酌事項，就能快速得到過去類似判決的量刑統計結果提供法官參考。
(Caption): Sentencing Project Website
第一層在案件類型的頁面會看到右邊有法條與罪名，並且列出日期範圍，讓使用者可以明確知道所搜尋的內容是否是在其預定的範圍。在此處我們也設計了一個搜尋框，可以針對判決書的主文來進行搜尋。例如，本處以槍砲彈藥案件為範例，如果法官希望搜尋到針對「製造」輕型槍械的案件，只需要輸入「製造」兩個字就能找到關於持有的案件作為搜尋的目標之一。這樣不但可以分別出「製造」、「販賣」、「運輸」等不同的罪名，也可以搜尋其他在主文中可能有助於法官進一步區別的文字，例如「累犯」或「緩刑」等等。接著是量刑審酌事項的選項，可以在此選取量刑因子及程度，來做為篩選的條件。

而畫面的左半邊列出加重減輕的法條，這部分的加重減輕法條資訊來源是由電腦的關鍵字搜尋的結果來呈現。當游標接近「其他較少出現的法定加重/減輕條文」時，會列出本系統有搜尋過的法條與罪名，供使用的法官參考。初始設定是「暫不考慮」，以顯示所有的相關判決案件之結果，也就是會顯示出「全部案件的刑期分布」。紫色的長條圖代表每個區間的判決書數量，則是會使用時因為不同的篩選條件而有所調整。下表為以「槍砲彈藥刀械管制條例第8條第1項」在有刑法第47條第1項的加重事由並量刑因子「犯罪行為人之品行>對被告不利」作為篩選條件下，所得到的刑期分布為例。

本系統還有第二層與第三層，是為了想要進一步查詢相關的判決書內容而有的進階分類與搜尋結果，並判決書原文。除此之外，本系統包含一個標註修改的平台，在這個頁面上可以看到對於某一篇判決所已經有的人工標註結果，是用不同底色的螢光筆來強調出來(顏色後來可以調整)。未來透過AI自動標註判決的技術，將有利於進行其他更多幫助驗證學理與實務關聯性之分析。

四、研究團隊

王道維教授 (國立清華大學物理學系)
連孟琦教授 (國立清華大學科技法律研究所)
盧映潔教授 (國立中正大學法律學系)
謝國欣教授 (國立中正大學法律學系)

資料科學家 李亞倫 (清華大學資訊系統與應用研究所)
研究助理 林雲貂 (清華大學科技法律研究所)
技術團隊學生 劉弘祥 (清華大學電機工程研究所)
阮羿寧 (臺灣大學資料科學碩士學位學程)
蘇晨知 (清華大學服務科學研究所)
何捷睿 (清華大學藝術學院學士班)
法律團隊學生 郭家豪 (陽明交通大學科技法律研究所)
李子鋐 (荷蘭萊頓大學法學院進階法學碩士學位學程)
蔡佩諮、薛于庭、簡庭申 (清華大學科技法律研究所)
黃柏霖、謝旻宏、楊承旻、李鳳翔、呂亞儒 (中正大學法律學研究所)
孫霈瑄、陳亮瑜、陳薏鈞 (中正大學法律學系)