รู้จัก “คณิตศาสตร์อานุภาพทำลายล้างสูง” (3): ปัญหาในระบบยุติธรรม

สฤณี อาชวานันทกุล

สองตอนที่ผ่านมาผู้เขียนยกตัวอย่าง “แบบจำลองทำลายล้างสูง” ตามแนวคิดของ เคธี โอนีล (Cathy O’Neil) ผู้เขียนหนังสือ “Weapons of Math Destruction” ซึ่งเกิดจากการใช้ big data ไปผิดทิศผิดทาง สะสมข้อมูลมาป้อนแบบจำลองทางคณิตศาสตร์ที่เขียนด้วยอคติหรือความไม่เข้าใจในหลักสถิติ ทำให้แบบจำลองมีลักษณะ 1. คนไม่รู้ว่าผลลัพธ์คำนวณออกมาอย่างไร 2. ไม่เป็นธรรม และสร้างความเสียหายสูงมาก และ 3. ขยายขนาดได้ (scalable) เพิ่มความเสี่ยงที่ความเสียหายและไม่เป็นธรรมจะถูกผลิตซ้ำในวงกว้าง

คราวที่แล้วยกตัวอย่างการใช้แบบจำลองแย่ๆ ในแวดวงการศึกษา วันนี้ลองหันมาดูปัญหาในระบบยุติธรรมที่โอนีลอธิบายในหนังสือกันบ้าง

เพราะสังคมไทย ในฐานะประเทศยังไม่พัฒนาเท่าไรและยังมีความเหลื่อมล้ำค่อนข้างสูง แต่ชอบตื่นเต้นเออออห่อหมกไปกับเทคโนโลยีใหม่ๆ โดยไม่ครุ่นคิดถึง “เงื่อนไข” ที่จำเป็นต่อการทำให้มันสร้างประโยชน์มากกว่าโทษทางสังคม ก็สุ่มเสี่ยงที่จะเจอปัญหาจาก “คณิตศาสตร์ทำลายล้างสูง” เช่นกัน

เพราะอคติและความไม่เข้าใจสถิติยังแพร่หลายทุกระดับ และโดยรวมคนยังไม่สำเหนียกว่า ไม่มีแบบจำลองใดๆ ในโลกที่เป็นกลางสมบูรณ์แบบ ไร้ซึ่งอคติใดๆ เพราะแบบจำลองเหล่านี้ถูกเขียนขึ้นโดย “คน” ทั้งสิ้น

โอนีลชี้ว่า ระบบยุติธรรมในสหรัฐอเมริกาก็เป็นอีกวงการที่ประสบภัยจากแบบจำลองอานุภาพทำลายล้างสูง ปัจจุบันศาลใน 24 มลรัฐ (จากทั้งหมด 50 มลรัฐ) ในอเมริกาใช้แบบจำลองการทำผิดซ้ำ (recidivism model) ซึ่งเป็นแบบจำลองทางคณิตศาสตร์ ในการพิจารณาความเป็นไปได้ที่อาชญากรผู้ต้องโทษจำคุกจะกลับไปทำผิดซ้ำอีก หลังจากที่พ้นโทษออกไปแล้ว

ศาลหลายแห่งใน 24 มลรัฐใช้ผลลัพธ์การคาดการณ์จากแบบจำลองนี้ในการกำหนดโทษ ฉะนั้นมันจึงส่งผลต่อชีวิตของคนจำนวนมากที่เดินเข้าเรือนจำ

ถึงแม้ว่าแบบจำลองนี้โดยรวมจะทำให้การกำหนดโทษของผู้พิพากษามีความ ‘สม่ำเสมอ’ มากกว่าที่แล้วมา (ไม่ต้องมาตั้งข้อสังเกตกันว่า ผู้พิพากษาคนไหน ‘ลำเอียง’ หรือไม่เพียงใด) โอนีลชี้ว่าบ่อยครั้งมันก็อำพรางอคติและสมมุติฐานที่ผิดและอันตรายไว้เบื้องหลังเทคโนโลยีสวยหรูดูดี

ดังตัวอย่างแบบจำลองที่เรียกว่า Level of Service Inventory—Revised หรือย่อว่า LSI-R

หัวใจของแบบจำลองชนิดนี้คือการให้นักโทษตอบแบบสอบถามขนาดยาว คำตอบของคำถามบางข้อ เช่น “ก่อนหน้าที่จะรับโทษครั้งนี้ คุณต้องโทษจำคุกมาแล้วกี่ครั้ง” “คนอื่นมีส่วนรู้เห็นเป็นใจในการก่ออาชญากรรมอย่างไร” และ “ยาเสพติดและสุรามีส่วนในการก่ออาชญากรรมของคุณหรือไม่ อย่างไร” ถูกให้น้ำหนักมากในการคำนวณโอกาสที่นักโทษจะออกไปทำผิดซ้ำ

สถิติการกระทำผิดซ้ำ และตัวอย่างคำถามในแบบสอบถาม มลรัฐโอไฮโอ ที่มา: Wall Street Journal
สถิติการกระทำผิดซ้ำ และตัวอย่างคำถามในแบบสอบถาม มลรัฐโอไฮโอ ที่มา: Wall Street Journal

ปัญหาที่เกิดขึ้นคือ เมื่อไล่อ่านคำถามต่างๆ ในแบบสอบถามนี้ ซึ่งล้วงลึกลงไปในรายละเอียดการใช้ชีวิต เราก็จินตนาการได้อย่างง่ายดายว่า นักโทษที่มาจากครอบครัวฐานะดีจะตอบคำถามแบบหนึ่ง นักโทษที่มาจากสลัมหรือละแวกยากจนจะตอบอีกแบบ ยกตัวอย่างเช่น นักโทษที่มาจากครอบครัวแถบชานเมืองที่มีชีวิตราบรื่นอาจตอบคำถาม “ครั้งแรกที่คุณข้องแวะกับตำรวจคือเมื่อไร” ว่า ไม่เคยถูกตำรวจจับเลยจนกระทั่งถึงคดีที่ทำให้เขาต้องมาอยู่ในคุก ในทางตรงกันข้าม นักโทษที่เป็นชายหนุ่มผิวดำน่าจะเคยถูกตำรวจหยุดและสั่งค้นตัวหลายสิบรอบก่อนจะถึงคดีที่ต้องโทษ ถึงแม้พวกเขาจะไม่เคยทำอะไรผิด เนื่องจากเป็นกลุ่มที่ถูกตำรวจเพ่งเล็งอยู่แล้ว (อคติของตำรวจผิวขาวจำนวนมากต่อคนผิวดำ เป็นปัญหาการเหยียดผิวที่ยังแก้ไม่ตกในหลายมลรัฐในอเมริกาสืบมาจนปัจจุบัน และมีส่วนเป็นชนวนให้เกิดเหตุประท้วงและจลาจลหลายครั้งในรอบหลายปีที่ผ่านมา)

เหตุประท้วงในเมือง Ferguson หลังจากที่ชายผิวดำวัย 18 ปี ถูกตำรวจยิงเสียชีวิต ที่มาภาพ: http://bizzfortune.com/2015/07/ferguson-a-year-after-the-riots-a-black-was-appointed-chief-of-police/
เหตุประท้วงในเมือง Ferguson หลังจากที่ชายผิวดำวัย 18 ปี ถูกตำรวจยิงเสียชีวิต ที่มาภาพ: http://bizzfortune.com/2015/07/ferguson-a-year-after-the-riots-a-black-was-appointed-chief-of-police/

ผลการศึกษาปี 2013 ของ New York Civil Liberties Union องค์กรที่ทำงานด้านสิทธิพลเมือง พบว่าถึงแม้ผู้ชายผิวดำและละติโน (พื้นเพจากอเมริกาใต้) วัย 14-24 ปี มีสัดส่วนเพียงร้อยละ 4.7 ของประชากรในกรุงนิวยอร์ก พวกเขากลับถูกตำรวจเรียกหยุดเพื่อตรวจค้นตัวสูงถึงร้อยละ 40.6 ของการสั่งหยุดตรวจค้นทั้งหมด ในจำนวนนี้มากกว่าร้อยละ 90 ของคนที่ถูกสั่งตรวจเป็นผู้บริสุทธิ์ ไม่ได้พกสิ่งผิดกฎหมายใดๆ เลย ขณะที่คนอื่นอาจถูกจับในข้อหาดื่มสุราทั้งที่อายุไม่ถึง หรือพกกัญชาติดตัว ซึ่งก็เป็นสิ่งเดียวกันกับที่ลูกคนรวยผิวขาวหลายคนทำ แต่ไม่เคยถูกจับเพราะตำรวจแทบไม่เคยสั่งค้นตัว

ด้วยเหตุนี้ ถ้าหาก “การข้องแวะ” กับตำรวจตั้งแต่อายุยังน้อยเป็นตัวแปรที่แบบจำลองนี้มองว่าเป็นสัญญาณบ่งชี้แนวโน้มที่จะกระทำผิดซ้ำ คนจนและคนผิวสีที่เป็นชนกลุ่มน้อยก็จะดู “มีความเสี่ยง” จากแบบจำลองนี้สูงกว่าคนผิวขาวและคนรวยมาก

คำถามในแบบสอบถามที่เอาไปใช้คำนวณไม่ได้หยุดเพียงเท่านั้น นักโทษถูกถามด้วยว่า เพื่อนและญาติของพวกเขามีประวัติอาชญากรหรือไม่ และก็อีกเช่นกันที่นักโทษจากครอบครัวชนชั้นกลางในเมืองจะมีแนวโน้มสูงกว่าคนจนที่จะตอบว่า “ไม่มี”

แบบสอบถามสำหรับ LSI-R ไม่ถามว่า “คุณมีสีผิวอะไร” ตรงๆ เพราะผิดกฎหมายอเมริกา แต่ข้อมูลมโหฬารที่นักโทษแต่ละคนต้องตอบก็ทำให้คำถามข้อนี้ไม่จำเป็นต้องถามเลย!

แบบจำลอง LSI-R ถูกคิดค้นและใช้จริงมาตั้งแต่ปี ค.ศ. 1995 และแบบสอบถามนักโทษที่เอาไปคำนวณก็มีนักโทษต้องตอบไปแล้วหลายพันคน นักสถิติใช้ผลแบบสอบถามในการออกแบบระบบที่ให้ ‘คะแนน’ คำตอบที่ถูกมองว่าเชื่อมโยงกับการกระทำผิดซ้ำ สูงกว่าคำตอบที่ถูกมองว่าไม่เชื่อมโยงเท่าไร หลังจากที่ตอบแบบสอบถามแล้ว คะแนนของนักโทษแต่ละคนจะถูกนำมาจัดหมวดหมู่เป็น “ความเสี่ยงสูง” “ความเสี่ยงปานกลาง” และ “ความเสี่ยงต่ำ” (ที่จะกระทำผิดซ้ำหลังพ้นโทษ)

ในบางมลรัฐอย่างเช่นโรดไอส์แลนด์ แบบทดสอบนี้ถูกใช้เพียงเพื่อหาตัวกลุ่มเป้าหมาย (คนที่เข้าข่าย “ความเสี่ยงสูง”) มาเข้าโครงการป้องกันการกระทำผิดซ้ำ แต่ในบางมลรัฐอย่างเช่น ไอดาโฮ และโคโลราโด ผู้พิพากษาใช้คะแนนจากแบบจำลองนี้เป็นส่วนหนึ่งในการพิจารณากำหนดโทษ!

ส่งผลให้คนผิวสีที่ยากจนมีแนวโน้มที่จะต้องโทษจำคุกหนักกว่าคนผิวขาวที่ร่ำรวยหลายเท่า

ตัวอย่างผู้ต้องหาสองคนที่ถูกจับในข้อหาเดียวกัน คือ "มีสารเสพติดผิดกฎหมายในครอบครอง" ถูกแบบจำลองจัดให้มีระดับความเสี่ยงต่างกัน ที่มา: https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing
ตัวอย่างผู้ต้องหาสองคนที่ถูกจับในข้อหาเดียวกัน คือ “มีสารเสพติดผิดกฎหมายในครอบครอง” ถูกแบบจำลองจัดให้มีระดับความเสี่ยงต่างกัน ที่มา: https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing

โอนีลชี้ว่า แบบจำลอง LSI-R ไม่เป็นธรรม เพราะแบบสอบถามครอบคลุมประเด็นมากมายเกี่ยวกับสภาพแวดล้อม ไม่ว่าจะเป็นพื้นเพ การเลี้ยงดูในวัยเยาว์ ถิ่นที่อยู่อาศัย ครอบครัว และเพื่อนๆ ซึ่งล้วนแต่เป็นรายละเอียดที่ไม่ควรเกี่ยวกับการทำคดีอาชญากรรมหรือการตัดสินของศาลเลย เพราะเกินเลยเรื่องข้อเท็จจริงของคดีนั้นๆ ไปมาก

(อ่านบทวิเคราะห์ความลำเอียงด้านสีผิวของแบบจำลองอีกโปรแกรม ได้ในข่าวชิ้นนี้ของ ProPublica)

ถ้าหากว่าในชั้นศาล ทนายโจทก์พยายามป้ายสีจำเลยด้วยการอ้างถึงประวัติอาชญากรรมของพี่ชายของเขา หรือชี้ว่าในละแวกบ้านที่เขาอยู่นั้นมีอัตราการเกิดอาชญากรรมสูงมาก ทนายจำเลยย่อมจะร้องคัดค้านต่อศาลแน่นอน และตุลาการ(ที่ทำหน้าที่อย่างถูกต้อง)ก็ย่อมเห็นด้วย

หลักการสำคัญประการหนึ่งของระบบยุติธรรมทุกแห่ง คือ เราทุกคนถูกตัดสินจากสิ่งที่เราลงมือทำ ไม่ใช่คนที่เราเป็น แต่แบบจำลอง LSI-R ไม่เพียงแต่ละเมิดหลักการนี้ แต่ยังละเมิดในทางที่ซ้ำเติมคนอีกด้วย

นักโทษที่ถูกให้คะแนน “ความเสี่ยงสูง” มีแนวโน้มมากกว่าคนอื่นที่จะมาจากถิ่นยากจนและไม่มีงานทำ เมื่อเขาถูกจัดเข้าหมวดหมู่นี้ เขาก็จะรับโทษในคุกนานกว่าคนอื่น ถูกแวดล้อมด้วยอาชญากรคนอื่นๆ เพิ่มความเสี่ยงที่เขาจะออกไปกระทำผิดซ้ำ และกลับเข้าคุกมาอีก ซึ่งก็จะกลายเป็นว่าเป็นเครื่องพิสูจน์ “ความสำเร็จ” ของแบบจำลอง (ว่ามันคาดการณ์ถูกว่าคนคนนี้จะทำผิดซ้ำ)

ทั้งที่แบบจำลองเองนั่นแหละที่มีส่วนสร้างวงจรอุบาทว์!