金錢政治無所遁形!g0v.tw 開放政治獻金紀錄,運用群眾智慧比對資料

作者 | 發布日期 2014 年 04 月 22 日 16:37 | 分類 網路 , 開放資料
ocr-page-of-open-campaign-finace

政治人物定期要向監察院定期繳交財產清單,有收受政治獻金也要照規定填寫清單,落實政治透明,杜絕貪污以及不當的政治獻金。但民眾想要求這些資料,卻被監察院的規定擋住-必須到監察院列印每位候選人政治獻金檔案。




面對監察院不想讓人民輕易取得這些資料的情形,有程式神人協助取得這些資料的 NGO,將影像檔分割成一格一格,並且寫好輸入介面,做出類似 captcha 的服務-開放政治獻金,讓坐在電腦螢幕前的網民,看幾眼,動動鍵盤,將原先的影像掃描檔數位化,方便後續的處理。

先前做過求職小幫手新聞小幫手等小幫手系列的 Ronnywang,將掃描過的表格,寫辨識軟體將每一格辨識出來,並且辨識出來的每一塊切成一小塊一小塊的圖片,可以方便後續將每一格的內容辨識出來。在駭客松前已經做出網站-開放政治獻金,讓鄉民辨識,輸入看到的文字或者數字。駭客松上陸續有開發者加入增加更多功能,並在駭客松過後持續加上新功能,以及號招更多人去監察院列印政治人物的政治獻金檔案。

g0v-ly-campaign-finance-ocr▲ g0v.tw 的 Facebook 貼文將人工辨識暱稱為宅宅文字辨識 (otaku character recognition ),呼籲大家動動鍵盤,協助數位化紙本的欄位,一起監督政治人物的政治獻金專戶

chang-champion-finance-of-organizations▲ 立法委員張慶忠的政治獻金檔案頁面。圖片來源:g0v.tw Facebook 粉絲頁

根據監察院陽光專區《政治獻金會計報告書查閱收費標準》

政治獻金會計報告書查閱收費標準

中華民國 98 年 1 月 6 日

監察院(98)院台申政字第 0981800001號令發布

第一條

本標準依政府資訊公開法第二十二條第二項規定訂定之。

第二條

查閱政治獻金會計報告書,依政黨、政治團體每年度或擬參選人各政治獻金專戶名稱,每二小時收取費用新臺幣二十元;不足二小時,以二小時計算。

第三條

申請影印或列印資料,紙張格式為 B4(含)尺寸以下者,每張另收取新臺幣二元;A3 尺寸者,每張另收取新臺幣三元。

第四條

本標準所定之費用,其收取應依預算程序辦理。

第五條

本標準自中華民國九十八年二月十三日施行。

監察院不願意給電子檔,要花一張 B4 以下尺寸每張 2 塊的價錢,在兩個小時之內印完。如此作法在電子化和網路化時代可是難以想像。監察院至今仍有不符合數位化時代的方式作業,只提供紙本的,無形中樹立高牆,阻礙民眾直接監督政治人物的政治獻金。公民想要監督只能用數位化工具動員鄉民力量,一邊表示我玩真的,要積沙成塔把政府做的資料自行數位化,壓迫政府做出改變。

當然有人認為,中文 OCR 已經相當發達,用人工方式辨識,相當耗時間人力。這其實並不衝突,可以輔助核對資料,或者主要用程式判斷,再輔以人工核對。另一個可能原因是能夠用在中文 OCR
辨識的開源程式不多,而 g0v.tw 由於理念因素,優先採用。目前有 9 筆政治獻金資料,與總數 6227 筆相比只完成一小部分,要將所有政治獻金都數位化還得努力。另外目前還沒將網站加上遊戲化的元素,打太久可能注意力就喪失了。

公務人員財產申報法,政府資訊公開法,政治獻金法,都是一系列監督政府的法令,使得施政能夠透明。但在台灣普遍詬病施政不透明,當官或是民意代表容易財產破表。接下來來看開放資料的先驅,英國是怎麼落實政府資訊公開,不只是政府而是有人民、媒體參與的例子。

英國衛報動員鄉民替國會議員查帳

2009 年每日電訊 (the Telegraph) 得到吹哨者內線消息,得知有不少位國會議員長年涉嫌浮報帳單,因而長期追蹤英國國會報假帳的消息。消息一出來造成英國國民對國會及政治人物的不信任感大增。2009 年 6 月18 日,英國國會被逼,依據 Freedom of Information Request,將 2004 至 2008 年之間,含有單據的 70 萬份文件,共 5,500 個 PDF 檔案釋出。

逐一閱覽單據想必會耗掉記者大部分的時間,當局大概覺得要查出所以然還會一段時間,那時候早就過了風頭能安心下莊。想不到衛報運用其資料部落格的人力,用 crowdsourcing 方式處理這些釋出的上萬份文件。在民氣可用的情況下,衛報為了時效性趕緊把網站弄上線,讓鄉民一頁一頁看過單據,辨識申報項目,標出可能有問題的單據。之後衛報記者能深入調查。這個群眾外包的網站雖然很快就上線,但設計上有遊戲化的因子,既然不能給錢,則給參與者競賽的樂趣,可以看到誰做最多的排行榜。幾百萬筆的單據影像,大家猜猜看最初 80 小時看完多少?共 17 萬份檔案!

progressbar-from-the Guardian-expenses-scandal▲ 進度條顯示目前離完成還差多少。圖片來源:Nieman Journalism Lab

bottums-from-the Guardian-expenses-scandal

▲ 調查的網友可以標注值得深入調查的單據。圖片來源:Nieman Journalism Lab

衛報並不是第一家報導英國國會報帳醜聞的媒體,但運用群眾智慧在 80 小時內看完所有 17 萬份檔案,大家猜結果是什麼呢?結果就是幾手所有議員回頭審視他們的花費,很多議員將不當報帳的款項退回。多名議員因詐欺被起訴,即使未被起訴,有些議員下次大選連任失利。衛報花了那些資源呢?他們原先就有分析人力,網站用 Django 架構架設,只需要花額外的 50 歐元向 Amazon 買額外運算能力,應付激增的流量。

top-user- from-the Guardians-expenses-scandal▲ 後來加上去的貢獻排行榜讓人有競賽的感覺。圖片來源:Nieman Journalism Lab

由勞伯.瑞福與達斯丁.霍夫曼主演的電影《大陰謀》 (All the President’s Men) ,描述華盛頓郵報記者追查水門案的故事。劇中情報來源,深喉嚨給兩位主角了不少帶有謎語性質的情報,其中對他們兩個人最有啟發的線索是「Follow the Money」,追尋金錢流向,最後找到尼克森身上。有一句拉丁文 Cui bono 也是在講類似的事情-誰受益。雖然查政治人物的政治獻金一時半刻有可能無法馬上查到什麼,但是資料在手,可以開啟無限可能。

立法院及司法院的情形

立法院的 iVOD 系統長期為人所詬病,並且不會保留超過三年的錄影。iVOD 這套影音平台,與最風行的 YouTube 平台相比簡值不能比。各個政府機關要創立開放資料平台,立法院也將招標,做立法院開放資料平台的駭客松團隊將參與標案,拭目以待了。

ly-bid-of-open-data-portal▲ 立法院開放資料平台招標公告,今日 (4/22) 截標

司法院的判決書由於實務認定為政府文書,不具有著作權,已經有評律網著手與其他資料混搭分析,像是研究那位律師勝訴率高。

延伸閱讀

發表迴響