ThaiPublica > คอลัมน์ > ลวง พราง ล่วงรู้ (ข้อมูล)

ลวง พราง ล่วงรู้ (ข้อมูล)

16 เมษายน 2017


จรัล งามวิโรจน์เจริญ

ลวง(ด้วยข้อมูล): หลอกโดยทำสิ่งที่ดูไม่แน่นอนให้ดูแน่นอน

ถ้าคุณได้รับ email บอกว่า “นาย ก เดาได้ว่าใครจะชนะ The Mask Singer ในสัปดาห์นี้” โดยสัปดาห์แรกบอกว่าหน้ากากโพนี่จะเข้ารอบ เมื่อคุณดูจบคุณก็คิด “เออมันตรงนะ แต่ฟลุครึเปล่า” สัปดาห์ที่ 2 นาย ก email มาบอกอีกว่าหน้ากากทุเรียนจะชนะ คุณดูจบก็คิดอีก “เออมันใช่ แต่ขอดูอีกสัปดาห์ว่าจะตรงรึเปล่า” สัปดาห์ที่ 3 นาย ก email มาบอกว่าหน้ากากอีกาดำจะชนะซึ่งก็ตรง คราวนี้คุณเริ่มเชื่อและคิดว่า “เออนี่ไม่น่าจะใช่ดวงนะ” หลังจากนั้นนาย ก จึงส่ง email มาถามว่าถ้าคุณอยากรู้ว่าใครจะชนะในอาทิตย์ถัดไปด้วยผลที่แม่นแน่นนอนคุณต้องจ่าย 300 บาท(เพื่อที่คุณจะได้ไปโม้หรืออะไรก็แล้วแต่) ถ้าเป็นคุณ คุณจะจ่ายไหม?

หากจะวิเคราะห์สถานการณ์นี้ เราอาจมองได้ 3 มุมคือ มุมของคนที่โดนหลอกได้ง่ายๆ มุมมองของคนที่กำลังโดนหลอกแต่คิดได้(คนที่คิดได้)และมุมมองของคนที่คิดจะหลอก(งงเด้ งงเด้ ^^) ซึ่งมุมของคนที่โดนหลอกได้ง่ายๆ ก็อาจจะไม่ได้คิดอะไรมาก เพียงคิดว่าการเดาถูก 3 ครั้งนั้นดูน่าเชื่อถือและการจ่ายเงินเพียง 300 บาท ก็ไม่ใช่เรื่องเสียหายอะไร

ลองมาดูมุมมองของคนที่คิดได้บ้าง เขาจะคิดอีกแบบโดยจะมีกระบวนการคิดดังนี้ เมื่อคนที่คิดได้เห็นข้อมูลการทำนาย 3 ครั้งที่ถูกต้อง เขาจะคิดดูคร่าวๆ ว่าความน่าจะเป็นที่ใครจะเดาถูก 3 ครั้งติดๆ กันน่าจะเป็นเท่าไหร่ (อันนี้ต้องขุด probability ม. ปลายมาใช้)

สัปดาห์แรกๆ(รอบที่ 1: First Round ซึ่งมีผู้เข้าแข่งกันทั้งสิ้น 32 คนโดยแบ่งออกเป็น 4 กลุ่มย่อย A B C D กลุ่มละ 8 คน) ในแต่ละสัปดาห์หน้ากากผู้เข้าแข่งขัน 4 คนของแต่ละกลุ่มจะถูกเอามาชนกันเป็นคู่ๆ (2 สัปดาห์จะแข่งเสร็จ 1 กลุ่ม) ซึ่งใน 4 คนของแต่ละสัปดาห์จะมีคนเข้ารอบเพื่อไปสู่รอบที่ 2 (Group Semi-Final) ได้แค่ 2 คน (แต่ละคนมีโอกาสที่จะชนะ 50% เท่ากันทั้งคู่) ซึ่งในการแข่งรอบแรกนี้ผู้เข้าแข่งขันแต่ละคนต่างไม่เคยแข่งขันกันมาก่อน จึงทำให้ไม่สามารถคาดเดาได้ง่ายๆ ว่าใครจะมีโอกาสมากหรือน้อยกว่ากันเป็นพิเศษ เพราะฉะนั้นโอกาสเดาถูก 3 ครั้งติดกันจึงมีความน่าจะเป็นเท่ากับ 1 ใน 8 (50% x 50% x 50% = 12.5%) ดังนั้นการจ่ายเงิน 300 บาทเพื่อที่จะดูโอกาสทายถูกซึ่งเป็นไปได้น้อยลงเท่ากับ 1 ใน 16 (50% x 50% x 50% x 50% = 6.25%) จะคุ้มค่าไหม?

คราวนี้ลองนึกกลับว่ากระบวนการของคนที่คิดจะหลอก โดยการทายถูก 3 ครั้งจะเป็นอย่างไร ถ้าโอกาสทายถูกในแต่ละครั้งเป็น 50% (1 ใน 2) ในแต่ละคู่ท้าชิงถ้าจะทายให้ถูกแน่ๆ 100% ต้องเดาทั้ง 2 คำตอบซึ่งอาจจะทำโดยส่ง email คำทำนายแต่ละอันให้แต่ละกลุ่มประชากรพร้อมๆ กันเช่น

    1.ในสัปดาห์แรก นาย ก (คนที่จะหลอก) ส่ง email คำทำนายให้กลุ่มคน 10,000 คนว่า หน้ากากฟีนิกซ์จะชนะและก็ส่ง email คำทำนายให้อีกกลุ่มคน 10,000 คนว่า หน้ากากโพนี่จะชนะ
    2.ถ้าโพนี่ชนะจริง ในสัปดาห์ที่ 2 นาย ก ก็แบ่งครึ่งคนกลุ่มที่ได้รับคำทำนายว่าโพนี่ชนะเป็น 2 ส่วน (5,000/5,000) แล้วส่ง email คำทำนายให้กลุ่มคน 5,000 คนแรกว่า หน้ากากทุเรียนจะชนะและอีก 5,000 เดาว่าหน้ากากทักซิโด้ชนะ
    3.พอหน้ากากทุเรียนชนะจริง ในสัปดาห์ที่ 3 นาย ก ก็แบ่งครึ่งคนกลุ่มที่ได้รับคำทำนายว่าทุเรียนชนะเป็น 2 ส่วน (2,500/2,500) แล้วส่ง email คำทำนายให้กลุ่ม 2,500 คนแรกว่า หน้ากาอีกาดำจะชนะและอีก 2,500 เดาว่าหน้ากากพยาบาลชนะ(คลิกที่ภาพเพื่อขยาย)

เพียงแค่ทำอย่างนี้ไปเรื่อยๆ มันก็จะมีกลุ่มคนกลุ่มหนึ่งที่ได้รับคำตอบที่ถูกตลอด ซึ่งบังเอิญเป็นคุณ นาย ก ใช้ความได้เปรียบของการมีข้อมูลไม่เท่าเทียมกัน หรือ information asymmetry (ความได้เปรียบที่นาย ก เห็นทุกอย่างในขณะที่เหยื่อไม่เห็น) ในกรณีนี้หากมีเหยื่อหลงเชื่อ 10% จากจำนวนคนที่ได้รับ email ที่เดาถูกติดต่อกัน 3 สัปดาห์แล้วยอมจ่ายเงินจำนวน 300 บาท ก็จะทำให้คนที่หลอกคนอื่นได้เงินไปถึง 75,000 บาท ในเวลาเพียง 3 สัปดาห์ (10% ของ 2,500 = 250 ราย และยอมจ่ายเงิน 300 บาท ดังนั้น 250 x 300 = 75,000 บาท)

ขณะเดียวกันคนที่คิดได้เช่นคุณอาจจะใช้ inferential thinking หรือกระบวนการคิดที่อธิบายไปข้างต้นเพื่อตรึกตรองกระบวนการที่ผู้คิดจะหลอกใช้เพื่อทำให้ทายถูกถึง 3 ครั้ง ซึ่งการคิดแบบ inferential thinking นี้ต้องใช้การฝึกฝนและประสบการณ์ อีกทั้งเป็นกระบวนการที่มีประโยชน์ รู้ไว้ใช่ว่าเราจะได้ไม่โดนหลอก ซึ่งหลักการหลอกคนด้วยอุบายหลอกคนแบบ information asymmetry นี้จะมีใช้กับการแทงบอล แทงหวย และกิจการหลอกลวงอื่นๆ

พราง(ข้อมูล): โดยใช้ตัวเลขเหมารวมทำให้เข้าใจในทิศตรงข้าม

สมมุติว่ามีโฆษณาบอกยาลดความอ้วน “แมวน้อย” ดีกว่ายาลดความอ้วน “หมาน้อย” พร้อมผลการทดสอบดังนี้

    1.ยาลดความอ้วน “แมวน้อย” ใช้ได้ผลดี 83% จากการทดลอง 289 จาก 350 ราย
    2.ยาลดความอ้วน “หมาน้อย” ใช้ได้ผลดี 78% จากการทดลอง 273 จาก 350 ราย

คุณจะเชื่อมั้ย ?

ถ้าคุณถามเพิ่มว่า ยาได้ผลเหมือนกันทั้งผู้ชายผู้หญิงรึเปล่า ลองมาดูว่าผลจะเป็นอย่างไร

    1.ผู้หญิงใช้ยาลดความอ้วน “แมวน้อย” ใช้ได้ผลดี 87% จากการทดลอง 234 จาก 270 ราย
    2.ผู้หญิงใช้ยาลดความอ้วน “หมาน้อย” ใช้ได้ผลดี 93% จากการทดลอง 81 จาก 87 ราย
    3.ผู้ชายใช้ยาลดความอ้วน “แมวน้อย” ใช้ได้ผลดี 69% จากการทดลอง 55 จาก 80 ราย
    4.ผู้ชายใช้ยาลดความอ้วน “หมาน้อย” ใช้ได้ผลดี 73% จากการทดลอง 192 จาก 263 ราย

จะเห็นได้ว่าในกรณีกลุ่มผู้หญิง ยาลดความอ้วน “หมาน้อย” (93%) ใช้ได้ผลดีกว่ายาลดความอ้วน “แมวน้อย” (87%) ซึ่งตรงกันข้ามกับเมื่อดูรวมทั้งผู้ชายผู้หญิง (ยาลดความอ้วน “แมวน้อย” ใช้ได้ผลดีที่ 83% กับยาลดความอ้วน “หมาน้อย” ที่ใช้ได้ผลดีเพียงแค่ 78%) เราเรียกปรากฎการณ์นี้ (ที่ยาลดความอ้วน “แมวน้อย” ใช้ได้ดีโดยรวมซึ่งต่างจากผลลัพธ์ที่ยาลดความอ้วน “หมาน้อย” ใช้ได้ผลดีกว่าในกรณีกลุ่มผู้หญิง) ว่า Simpson’s paradox หากดูจากมุมมองตัวแปรทางเพศ (ชายกับหญิง) เราเรียกตัวแปรนี้ว่าตัวแปรซ่อน (lurking/confounding variable)

เพราะฉะนั้นเวลาเห็นตัวเลขภาพรวมอย่าด่วนสรุป (นักการเมืองมักจะใช้วิธีนี้ในการชักจูงให้คนมองเห็นอะไรตามที่ต้องการ) ให้ดูว่าสามารถมองโดยใช้ตัวแปร lurking/confounding variable ได้รึเปล่า การตั้งคำถามเพื่อค้นหาตัวแปรซ่อนเป็นเรื่องสำคัญต้องใช้ประสบการณ์การฝึกฝน เพราะจะช่วยให้เราเห็นความเป็นจริงแบบแยบยลที่ซ่อนอยู่ได้

ล่วงรู้(ข้อมูล): ด้วยการตรวจสอบข้อมูลโดยใช้ชุดตัวเลข

ช่วงปีค.ศ.1930 Frank Benford นักวิจัยฟิสิกส์สังเกตเห็นว่าหน้าแรกซึ่งเป็นเลข 1 ของหนังสือตารางลอการิทึม (Logarithm หรือ Log) มีสภาพเสื่อมโทรมมากกว่าหน้าสุดท้ายของหนังสือ (ต้องเข้าใจนะครับว่าสมัยก่อนการคำนวนหาว่า log ของตัวเลขต้องเปิดตาราง) เป็นนัยว่าตัวเลขนำหน้าด้วย 1 ถูกใช้บ่อยกว่าเลขอื่น Benford จึงเริ่มเก็บข้อมูลจากสิ่งรอบตัวเพื่อยืนยันว่า pattern นี้มีในธรรมชาติซึ่งเขาก็อ้างว่ามีจริง โดยเลข 1 มักจะถูกใช้เป็นเลขนำหน้าของสิ่งต่างๆ ถึงประมาณ 30% และเลข 9 มักจะถูกใช้เป็นเลขนำหน้าแค่ประมาณ 5% ยกตัวอย่าง ความยาวของแม่น้ำ สถิติของการเล่นเบสบอล การประมาณตัวเลข GDP ปี 2016 จำนวนประชากรในประเทศต่างๆ ทั่วโลก เป็นต้น

ในวงการตรวจสอบทุจริตในบัญชี (Forensic accounting) มีการใช้ Benford’s Law มาตรวจความผิดปกติของตัวเลขในบัญชี Benford’s Law มักจะใช้กับข้อมูลที่มีตัวเลขหลากหลาย (เช่น บัญชีตัวเลขค่าใช้จ่าย) หรือตัวเลขที่เกิดจากการเอาตัวแปรหลายตัวแปรมาบวกหรือคูณกัน (เช่น ราคาคูณกับปริมาณ) ถ้า Distribution หรือการกระจายตัวของตัวเลขนำหน้าในบัญชีแตกต่างจาก Benford’s Law อาจบ่งชี้ถึงความผิดปกติของบัญชีนั้น อย่างไรก็ดีมีตัวเลขบางอย่างที่มี Distribution ไม่ตาม Benford’s Law อาทิ lottery หมายเลขโทรศัพท์ วันที่ ค่าแก๊ส เป็นต้น

ตัวอย่างที่ใช้ในการจับการหลอกลวง มีบริษัทหนึ่งใช้ Benford’s Law (การตวรจเชคด้วยตัวเลขหลักแรกว่าจะมีเลข 1 มากที่สุดประมาณ 30% ของเลขหลักแรกทั้งหมดแล้วเลขหลักแรกของตัวเลขอื่นๆ จะไล่ลงมาตามลำดับ) ตรวจสอบยอดรายจ่ายในแต่ละรายการ พบว่ามีตัวเลขหนึ่งนำหน้าสูงกว่าปกติ (ตามที่ Benford distribution กำหนด) หลังจากตรวจสอบพบว่ามีการจ่ายเช็คหลายใบที่มีมูลค่าประมาณ 1,000 เหรียญเศษๆ มากกว่างวดบัญชีที่ผ่านมา (เช็คงวดบัญชีที่ผ่านมาจ่ายเชคที่มีค่าน้อยกว่า 100 เหรียญ) เจ้าหน้าที่ทางการเงินจึงถูกสอบสวน และสารภาพว่าเค้าออกเช็ครวมยอดรายจ่ายเล็กๆ เพื่อที่จะได้ใช้เช็คนัอยใบ ซึ่งการอธิบายด้วยเหตุผลดังกล่าวทำให้ดูเหมือนว่าการมีอัตราส่วนของตัวเลขนำหน้าไม่เป็นไปตาม Benford’s Law นั้นเป็นไปได้ อย่างไรก็ดี หลังจากมีการตรวจสอบอย่างละเอียดพบว่าเจ้าหน้าที่คนดังกล่าวเขียนเช็คเพื่อแอบจ่ายให้บริษัทของตัวเอง(ดูข้อมูลเพิ่มเติมที่นี่)

ปัจจุบันเราสามารถเข้าถึงข้อมูลและสถิติต่างๆ ได้ง่ายขึ้น ซึ่งมีทั้งที่เป็นประโยชน์ต่อการนำมาใช้ในการพัฒนาแต่ก็มีอีกมากที่เป็นข้อมูลที่นำมาใช้ในทางที่ผิดๆ เราจึงควรตั้งสติและพิจารณาข้อมูลที่ได้รับก่อนเชื่อเสมอ ท้ายนี้ผมอยากแนะนำ site เป็น course ที่อาจารย์ 2 คน Carl Bergstrom กับ Jevin West จาก University of Washington เปิดสอน course นี้เนื่องจากความเบื่อหน่ายข่าวสารที่ไร้สาระไม่มีมูล โดยตั้งใจว่าจะช่วยให้คนเรียนได้คิดอย่างมีวิจารณญานโดยใช้ข้อมูลมาช่วยคิดและตัดสินใจเรื่องต่างๆ ในชีวิตประจำวันได้ดียิ่งขึ้น