ThaiPublica > คอลัมน์ > แชมป์บอลโลกครั้งนี้คือใคร ทำนายได้ด้วยข้อมูล

แชมป์บอลโลกครั้งนี้คือใคร ทำนายได้ด้วยข้อมูล

23 มิถุนายน 2018


จรัล งามวิโรจน์เจริญ บริษัท เซอร์ทิส จำกัด

ช่วงนี้หลายคนคงเข้าสู่โหมดนอนดึก ไม่ก็ต้องตื่นกลางดึกเพื่อมาดูฟุตบอลโลกที่ 4 ปีจะจัดขึ้นเพียงครั้งเดียวเท่านั้น แน่นอนว่าผู้เข้าแข่งขันของแต่ละทีมต่างก็เตรียมความพร้อมมาเป็นอย่างดีเพื่อชิงถ้วยรางวัลในศึกการแข่งขันนี้ ทั้งการฟิตซ้อมร่างกาย ฝึกซ้อมทักษะและทีมเวิร์ก รวมไปถึงการวางแผนรูปแบบการเล่นในแต่ละนัด โดยศึกษาจากข้อมูลสถิติต่างๆ ยกตัวอย่างประเทศชั้นนำในด้านฟุตบอล เช่น เยอรมัน และอังกฤษ ก็ได้มีการนำข้อมูลทั้งที่เป็นวิดีโอและสถิติของนักเตะแต่ละคน รวมถึงรูปแบบการเล่นของทีมต่างๆ มาใช้ในการวิเคราะห์ เพื่อวางแผนกลยุทธ์ในการตอบโต้คู่ต่อสู้

ข้อมูลสถิติการแข่งขันและคุณลักษณะของทีมผู้เล่นไม่เพียงนำมาวางกลยุทธ์ในการแข่งขันได้เท่านั้น แต่ยังสามารถนำมาใช้ในการทำนายผลฟุตบอลโลกได้อีกด้วย วันนี้ผมจึงขอหยิบยกงานวิจัย 2 ชิ้นที่นำข้อมูลมาใช้วิเคราะห์และคาดการณ์ผลฟุตบอลโลกในปี 2018 นี้ ซึ่งผมว่าเป็นเรื่องที่น่าสนุกและน่าลุ้น เพราะท้ายที่สุดเราจะได้เห็นกันว่างานวิจัยชิ้นไหนทำนายได้แม่นยำมากกว่ากันในวันสิ้นสุดการแข่งขัน 15 ก.ค. นี้

1. Goldman Sachs’s Prediction

นักวิจัยจากสถาบันการเงินชื่อดัง Goldman Sachs ใช้ข้อมูลจากผลการแข่งขันฟุตบอลชิงแชมป์แห่งชาติยุโรป และการแข่งขันฟุตบอลโลกรอบคัดเลือกที่ผ่านมาตั้งแต่ปี ค.ศ. 2005 มาป้อนเข้าโมเดลประมาณ 4 รูปแบบ จำนวน 200,000 โมเดล เพื่อหาตัวแปรสำคัญที่ช่วยทำนายจำนวนประตูที่ยิงกันในแต่ละแมตช์ แล้วคัดกรองตัวแปรมาได้ประมาณ 53 ตัวแปร แบ่งเป็น 3 กลุ่ม ได้แก่

    1) กลุ่มตัวแปรที่เกี่ยวข้องกับทีม เช่น คุณลักษณะของทีม Elo ranking (บ่งบอก Performance ของทีม)
    2) กลุ่มตัวแปรที่เกี่ยวกับอัตราส่วนของแมตช์ที่ชนะต่อแมตช์ที่แพ้ใน 10 แมตช์ที่ผ่านมา จำนวนประตูที่ยิงเข้าในเกมล่าสุด และจำนวนประตูที่โดนคู่ต่อสู้ยิงในเกมล่าสุด
    3) กลุ่มตัวแปรที่เกี่ยวข้องกับผู้เล่น เช่น คุณลักษณะของผู้เล่น (ความสามารถในการเล่นบุกหรือเล่นรับ)

ยกตัวอย่าง ถ้าทีมเยอรมันต้องแข่งขันกับทีมอังกฤษ จากข้อมูลที่เกี่ยวข้องตามที่กล่าวมาข้างต้นจะทำนายว่าเยอรมันจะเป็นผู้ชนะ โดยดูจากโมเดลที่ทำนายจำนวนประตูที่ยิงของแต่ละทีม ซึ่งเยอรมันจะทำประตูได้ประมาณ 1.47 ประตู ส่วนอังกฤษจะทำประตูได้ประมาณ 1.28 ประตู

และเมื่อเรานำข้อมูลของทุกทีมที่เข้าร่วมกว่า 1,000,000 สถานการณ์ มาลองสร้างแบบจำลอง (Simulation) เพื่อทำนายหาสถานการณ์ของทีมที่จะเข้ารอบถัดไป ก็จะได้ผลการทำนายออกมาดังนี้ โดยโมเดลได้ทำนายไว้ว่าทีมบราซิลจะสามารถคว้าแชมป์ฟุตบอลโลกในครั้งนี้ โดยเอาชนะทีมเยอรมันได้ในรอบชิงชนะเลิศ

ที่มาภาพ : Stehn, S.J. et al., Goldman Sachs 2018 the world cup and economics

2. Groll et al

อีกหนึ่งงานวิจัยที่น่าสนใจเกิดจากความร่วมมือของนักวิจัยเยอรมันและเบลเยียม (Groll et al.) ได้ทำการวิเคราะห์ผลบอลจากการนำข้อมูลจากการแข่งขันฟุตบอลโลก 4 ครั้งที่ผ่านมาจากปี 2002-2014 และข้อมูลตัวแปรอื่นๆ อีก 16 ตัวแปรที่หลากหลาย เช่น

    1) กลุ่มเศรษฐศาสตร์ (GDP per capita, จำนวนประชากรของประเทศ)
    2) กลุ่มองค์ประกอบทางกีฬา (ODDSET Probability โอกาสที่จะชนะฟุตบอลโลกในปีนั้นๆ คำนวณโดยบ่อนทางการในประเทศเยอรมันนี, FIFA Rank การจัดลำดับของ FIFA)
    3) กลุ่มความเป็นเจ้าบ้าน (เป็นเจ้าบ้านหรือไม่ ทวีปที่อยู่ กลุ่มสมาพันธ์)
    4) กลุ่มองค์ประกอบทางโครงสร้างของทีม (จำนวนผู้เล่นที่มาจากสโมสรเดียวกัน อายุเฉลี่ยของผู้เล่น จำนวนผู้เล่นที่อยู่ในทีมที่เคยได้แชมป์ จำนวนผู้เล่นที่เล่นนอกประเทศ)
    5) กลุ่มองค์ประกอบของโค้ช (อายุของโค้ช อายุงาน ประสบการณ์ มีสัญชาติเดียวกันกับทีมที่คุมอยู่หรือไม่)

รวมถึงมีการนำตัวแปรต่างๆ เหล่านี้มาสร้างเป็นตัวแปรใหม่เพื่อบ่งบอกความสามารถของทีม แล้วเอามาประกอบในการสร้างโมเดลเพื่อทำนายจำนวนประตูที่แต่ละทีมจะยิงได้ในแต่ละแมตช์ และสร้างแบบจำลอง (Simulation) ของสถานการณ์ต่างๆ ของทีมที่จะเข้ารอบถัดไปเป็น 100,000 สถานการณ์ และนี่คือผลที่น่าจะเกิดได้ โดยมีทีมเยอรมันชนะบราซิลในรอบชิงชนะเลิศด้วยโอกาส 64%

ที่มาภาพ : : Groll A. et al., Prediction of the FIFA World Cup 2018 – A random forest approach with an emphasis on estimated team ability parameters

สิ่งที่สังเกตได้จากงานวิจัย 2 ชิ้นนี้คือ ความแตกต่างและความหลากหลายของข้อมูลที่นำมาใช้เป็นตัวแปรในการวิเคราะห์ ซึ่งงานของ Groll จะมีความหลากมิติมากกว่า ทั้งการใช้ตัวแปรที่ถูกสร้างจากโมเดลย่อยรวมถึงการใช้ข้อมูลทางเศรษฐศาสตร์ด้วย

อย่างไรก็ตาม ผลการทำนายนี้เป็นเพียงตัวอย่างที่แสดงให้เห็นถึงศักยภาพของการนำข้อมูลมาใช้ประโยชน์ในการศึกษาด้านวงการกีฬา ซึ่งจะว่าไปแล้วการทำนายผลในลักษณะนี้ก็มีการนำมาใช้กันแล้วพักหนึ่งในวงการพนันและเว็บไซต์พนันที่ถูกกฎหมายในต่างประเทศ เช่น FiveThirtyEight ทุกท่านอาจลองเข้าไปดูว่ามีการใช้ข้อมูลกับตัวแปรอะไรบ้างในการทำนาย แต่ขอบอกไว้ก่อนว่าอย่าไปซีเรียสกับคำทำนายมาก เพราะยังมีอีกหลายตัวแปรที่ไม่สามารถเก็บข้อมูลได้ เช่น นักกีฬาบาดเจ็บ นักเตะติดโทษแบนในนัดนั้นๆ และ ความเข้ากันของคนในทีม (Chemistry) เป็นต้น

สุดท้ายผมขอบอกไว้ว่าไม่ได้มีความตั้งใจที่จะชักจูงให้นำผลการทำนายไปเกี่ยวข้องกับการพนัน เพียงแค่ต้องการจะศึกษากระบวนการนำข้อมูลมาใช้ประโยชน์ในงานวิจัยซึ่งอาจนำไปใช้ในงานอื่นๆ ที่มีลักษณะใกล้เคียงกันได้ ที่สำคัญขอให้ทุกท่านสนุกสนานกับการเชียร์ฟุตบอลและการนำข้อมูลมาใช้ครับ

References:
http://www.goldmansachs.com/our-thinking/pages/world-cup-2018/multimedia/report.pdf

Groll et al., Prediction of the FIFA World Cup 2018 – A random forest approach with an emphasis on estimated team ability parameters
https://arxiv.org/pdf/1806.03208.pdf