Data Journalism – Why now? (Vol.1)

จรัล งามวิโรจน์เจริญ

หลังจากที่ผมได้นำเสนอข้อมูลในลักษณะบทความที่เกี่ยวกับ Data ไปแล้วถึง 4 ครั้ง วันนี้ผมขอนำเสนอบทความของผมในลักษณะการถาม-ตอบผ่านทางแชทแทน เพื่อเป็นการสร้างความเชื่อมโยงระหว่างผมกับคุณผู้อ่านและกระตุ้นต่อมความคิดให้คุณผู้อ่านได้ลองคิดตามมากขึ้น ผมขอแนะนำ chatbot ในจินตนาการ ‘ทุเรียนน้อย’ chatbot ช่างสงสัยและมีความตะมุตะมิอยู่ในตัว มาพูดคุยกับผมในเรื่อง Data Journalism ครับ

ทุเรียนน้อย:คิดยังไงถึงมาเขียน คอลัมน์ Data Driven Society ครับ

จรัล: จุดเริ่มต้นของคอลัมน์นี้ เกิดจากช่วง 2 ปีที่ผ่านมา ก่อนที่ผมจะกลับมาเมืองไทย ผมได้ติดตามข่าวคราวในไทยมากขึ้น ผมเห็นกระแสความคิดต่างๆ จาก Social Media และได้พูดคุยกับคนหลายรุ่น ผมเห็น content ในหลาย channel และพอจะเห็นภาพรวมว่าคนไทยแสดงความคิดเห็นกันเยอะ เอาอารมณ์ เอามัน เป็นหลัก แต่หลายครั้งขาดการเอาข้อมูลหรือเหตุผลมาประกอบในการแสดงความคิดเห็นกัน พอดีทาง Thaipublicaเปิดโอกาสให้ผมได้เขียนคอลัมน์ ผมก็เลยอยากแบ่งปันประสบการณ์ที่ได้เรียนรู้ตอนทำงานอยู่ที่อเมริกาเกี่ยวกับกระบวนการความคิดแบบต่างๆ (Thinking process) ที่ช่วยทำให้มองปัญหาได้หลายมุมมอง เช่น Analytical Thinking, Systems Thinking, Design Thinking มาพิจารณาสิ่งรอบตัวสัพเพเหระในไทย เพราะสุดท้ายงานที่เกี่ยวกับข้อมูลก็คืองานที่เอากระบวนการคิดกับเทคนิคในการสกัดข้อมูลให้เกิดประโยชน์มาใช้

ทุเรียนน้อย: ซึ่งการแชร์กระบวนความคิดต่างๆ ตรงนี้เกี่ยวข้องกับงานของพี่จรัลด้วยหรอครับ

จรัล: เกี่ยวครับ คนที่ทำงานเกี่ยวกับข้อมูลโดยเฉพาะงานทาง Data Science นั้นก็เหมือนทีมเชฟที่ทำงานเป็นทีมและเอาวิธีคิดหลายๆ แบบมาใช้ในการมองและตอบโจทย์ผู้บริโภค งานด้าน Data Science นี้จะช่วยสร้างอาหารจานสำคัญทางการสื่อสารที่เรียกว่า Data Journalism ซึ่งจะช่วยให้สังคมได้สัมผัสกับการนำข้อมูลมาใช้ในการค้นหาความจริงที่มีมูล (Evidence Based) และทำให้ได้เห็นตัวอย่างการใช้ข้อมูลอย่างฉลาด หรือ Data Literacy (ลองอ่านบทความแรก) ที่ชัดขึ้น ซึ่งงานนี้ก็ถือว่าเป็นอีกส่วนหนึ่งที่งานข่าวสอบสวน (Investigative Journalism) นำมาใช้ด้วย

ทุเรียนน้อย: แบบนี้น่าจะทำให้สื่อมีเนื้อหาในการนำเสนอที่หลากหลายขึ้นใช่ไหมครับ

จรัล: ใช่เลย ทุเรียนน้อย Data Journalism จะช่วยสื่อสร้างมุมมองและกระบวนการเล่าเรื่องแบบใหม่ ที่คนทั่วไปอาจมองไม่เห็น ยิ่งในปัจจุบันรูปแบบการนำเสนอของสื่อมีการปรับตัวและเปลี่ยนแปลงไป ไม่ได้มีแค่ตัวหนังสืออย่างเดียว คนรุ่นยุค smart phone มีการโต้ตอบ (Interactivity) กับสิ่งที่ดู ส่วนใหญ่เนื้อหาเป็นภาพและ Visualization โดยการนำข้อมูลอดีตกับปัจจุบันมาอธิบาย (Descriptive) เพื่อให้เกิดความกระจ่าง (Insight) และนำเสนอไอเดียที่ซับซ้อนให้ดูง่าย

ทุกวันนี้ผู้อ่านมีทางเลือกมากขึ้น คุณภาพของ content ต้องดีขึ้น ถ้าเราสร้าง content ของสื่อที่ดี (มีข้อมูล หลักฐาน ความจริงมาประกอบ) คนอ่านที่ได้เสพของดีๆ ก็เหมือนได้กินยาบำรุงชั้นดี คนอ่านจะเริ่มแยกแยะออกว่าอะไรดีไม่ดี เหมือน detox การเสพข่าว เริ่มสร้าง demand ของคนเสพที่ต้องการอ่าน content คุณภาพมากขึ้น เพราะฉะนั้น การนำเสนอข่าวต้องเปลี่ยน ถ้าเราอยากให้คน engage และคิดวิเคราะห์เพื่อหันมาใช้เหตุผลในการคิดมากขึ้น

ทุเรียนน้อย: เราได้ยินพี่จรัลพูดถึงคำว่า Data Journalism มาประมาณนึง แต่จริงๆ มันคืออะไรหรอครับ

จรัล: คำจำกัดความของ Data Journalism เริ่มจากคำว่า journalism หรือวารสารศาสตร์ตามความหมายของ American Press Institute คือ กิจกรรมการรวบรวม ประเมิน ผลิต นำเสนอ ข่าวสารและสารสนเทศ แต่ถ้าเราเปลี่ยนคำว่า “ข่าวสารและสารสนเทศ” เป็นคำว่า “ข้อมูล” ซึ่งมีตั้งแต่ตัวเลข การวิเคราะห์ตัวหนังสือ ภาพ เสียง สรุปแล้วเราก็จะได้คำจำกัดความของ Data Journalism ว่าคือกิจกรรมการรวบรวม ประเมิน ผลิต นำเสนอ ข้อมูล ด้วยเทคนิค Data Visualization หลากหลาย ซึ่งทำให้คนเข้าใจข้อมูลได้ง่ายขึ้น

ทุเรียนน้อย: แล้ว Data Journalism มีที่มายังไงครับ

จรัล: จริงๆ แล้ว idea การนำเสนอข่าวด้วยข้อมูลก็มีมานานแล้วแต่ไม่ชัดเจนว่าเริ่มเมื่อไหร่ หนังสืออ้างอิงของ Columbia Journalism School ‘The Art and Science of Data-driven Journalism’บอกว่าการนำข้อมูลมาใช้ในสื่อมีตั้งแต่สมัยโรมันและราชวงศ์ฮั่นแล้ว แต่ตัวอย่างแรกที่เห็นชัดเจนว่าคือ concept Data Journalism นั้นถูกนำเสนอโดย The Guardian แสดงอัตราการรับเข้านักเรียนกับค่าใช้จ่ายใน ค.ศ. 1821 คือนำเสนอข้อมูลเป็นจำนวนมากผ่านสื่อ และ New York Tribune ค.ศ. 1849 ที่นำข้อมูลแสดงการแพร่ระบาดของอหิวาตกโรคมาทำเป็นภาพให้คนอ่านเข้าใจได้ง่ายขึ้น

ภาพที่ 1: The Guardian นำเสนอข้อมูลอัตราการรับเข้านักเรียนกับค่าใช้จ่ายในปี ค.ศ. 1821
ที่มา: https://static.guim.co.uk/sys-images/Guardian/Pix/pictures/2011/09/25/ManchesterGuardianbackfull.jpg
ภาพที่ 2: New York Tribune นำเสนอข้อมูลการแพร่ระบาดของอหิวาตกโรคออกมาเป็นกราฟในปี ค.ศ. 1849
ที่มา: https://www.propublica.org/nerds/item/infographics-in-the-time-of-cholera?utm_content=buffer9314e&utm_medium=social&utm_source=plus.google.com&utm_campaign=buffer

นอกจากนี้ คำว่า Data Journalism เริ่มถูกนำมาใช้ในสื่อตอนช่วงปี ค.ศ. 2010 หนังสือพิมพ์ในประเทศอังกฤษ The Guardian (Data Blog) ประมวลข้อมูลลับเกี่ยวกับสงครามในอัฟกานิสถาน ที่ได้รับจาก Wikileaks กว่า 90,000 ชิ้น ชื่อ Afghanistan war logโดยสร้างเป็น Interactive graphics ซึ่งผู้อ่านสามารถเล่นกับข้อมูลได้ และทำให้ผู้อ่านเข้าถึงได้มากยิ่งขึ้น นี่แหละเป็นจุดเริ่มต้นของกระแส Data Journalism ที่หนังสือพิมพ์หรือ blog ระดับคุณภาพ เช่น New York Times(Upshot), Washington Post(Data Post), FiveThirtyEight, ProPublica ต่างหันมาให้ความสนใจและเริ่มทำต่อมาในปี ค.ศ. 2012 ได้เริ่มมีการมอบรางวัล DJA (Data Journalism Awards) ให้แก่ผลงานดีเด่นโดยผู้ชนะจะได้เงินรางวัล $1,801 เนื่องจากในปี ค.ศ. 1801 นั้นเป็นปีที่ pie chartถูกคิดค้นขึ้น ทำให้งานด้าน Data Journalism นี้มีการเผยแพร่มากขึ้น

นอกจากนี้ ช่วงที่ผ่านมา Google เริ่มเห็นความสำคัญของงานแขนงนี้ จึงก่อตั้ง Newslab เพื่อร่วมพัฒนาเครื่องมือให้นักข่าวได้ฝึกหัดเพื่อการสร้างสื่อในอนาคต โดยเน้นที่การใช้ข้อมูลในการสร้าง content ที่ดีและช่วยย่อยข้อมูลให้คนเข้าถึงมากขึ้น รวมถึงร่วมมือกับ HKU (University of Hong Kong) ทำ online class คือ “Data Journalism Fundamentals” ทำให้เริ่มมีการเผยแพร่ศาสตร์ด้านนี้มากขึ้น ส่วนอีกหลายสถาบันอย่าง Stanford Computational Journalism Lab , Columbia Journalism School, Syracuse Newhouse เองก็เริ่มมีหลักสูตรที่ผสมระหว่าง Computer Science กับ Big Data มาใช้ในงานสื่อ ทางฝั่งเอเชียก็มีความตื่นตัวพอสมควรซึ่งดูได้จากรายงาน Data Journalism in Asia และการส่งผลงานเข้าประกวด DJA 2017 โดยร้อยละ 20 เป็นผลงานจากประเทศแถบเอเชีย

ทุเรียนน้อย: นี่แสดงว่ามีคนสนใจศาสตร์ทางนี้มากขึ้นจริงๆ แล้วถ้าคนอยากจะเริ่มทำ Data Journalism พี่จรัลช่วยแนะนำได้ไหมครับว่าเราจะเริ่มจากจุดไหนดี

จรัล: ผมว่าฝึกฝนภาษาอังกฤษนี่สำคัญมากนะครับ (จริงจัง) เพราะของใหม่ๆ มักมีตัวอย่างและเนื้อหาอ้างอิงเป็นภาษาอังกฤษเยอะ เช่น Data Journalism tools จาก MIT Knight Science Journalism, Data Journalism blogหรือแรงบันดาลใจจากบทสัมภาษณ์ของ Helena Bengtssonซึ่งเป็น Guardian Editor ในงานเขียนเรื่อง Data Project, Integrating data journalism to newsrooms เป็นต้น

ทุเรียนน้อย:แล้วองค์ประกอบอื่นๆ ล่ะครับ คนที่จะทำงานด้าน Data Journalism ได้ต้องเป็นคนแบบไหน

จรัล: ผมคิดว่าสิ่งที่สำคัญของคนที่ทำข่าวหลายๆ ท่านคงจะมีอยู่แล้วก็คือ Mindset ของคนทำข่าว สำหรับมือใหม่ที่อยากจะเข้ามาร่วมในวงการนี้ก็ต้องมี Mindset แบบนี้เช่นกัน คือ กล้าที่จะเรียนรู้และทดลองสิ่งใหม่ๆ อยู่เสมอ

ทุเรียนน้อย: พี่จรัลช่วยอธิบายและยกตัวอย่างของคนที่มี Mindset เหมาะกับการทำงานด้าน Data Journalism ให้ฟังได้ไหมครับว่าเขาจะต้องทำอย่างไรบ้าง

จรัล: 4 องค์ประกอบที่สำคัญและต้องหมั่นเรียนรู้ ฝึกฝนคิดเพิ่มเติมเสมอ ก็คือ Tools, Data sources, Case studies, Line of inquiry โดย Tools คือ รู้จักการใช้เครื่องมือสำหรับเตรียมข้อมูล เช่น OpenRefine ใช้เพื่อทำความเข้าใจและปรับปรุงข้อมูลที่หายหรือที่ไม่สมบูรณ์ รู้จักใช้เครื่องมือในการวิเคราะห์และแสดงผล visualization ต่างๆ เช่น Excel เริ่มแบบง่ายๆ ด้วยการใช้กราฟกับ Pivot table ให้เป็นหรือลอง Google Fusion, Tableau Public (free version) จะช่วยทำให้เราเข้าใจข้อมูลตัวเลขมากขึ้น อีก tool หนึ่งคือ Overview ใช้เพื่อจัดการเอกสารและ TimelineCurator ช่วยในการบันทึกบทความที่ใช้ระหว่างทำข่าว

ทุเรียนน้อย: โห นี่ขนาดแค่ tool อย่างเดียวก็มีมากถึงขนาดนี้แล้วนะครับ แล้วพวก Data sources, Case studies, Line of inquiry จะไม่ยิ่งมีเยอะไปกว่านี้หรอครับ

จรัล: ในมุมมองของผมนะครับ การจะทำงานด้านนี้ได้ดีเราจำเป็นต้องมีความรอบรู้และฉลาดเลือกครับ อย่าง Data sources เนี่ย เราต้องค้นหาและทดลองใช้ข้อมูลรอง (Secondary data) ที่เก็บตาม open data sources ต่างๆ เช่น data.gov, data.go.thซึ่งเป็น open data ของไทย UNsite หรือข้อมูลของ webpage ที่หายไปอาจหาได้จาก archive.org ส่วนข้อมูลหลัก (Primary data) อาจจะต้องเก็บเองหรือขอความร่วมมือในการวิจัยกับหน่วยงานต่างๆ เป็นต้น

ส่วนพวก Case studies ก็คือการเรียนรู้ตัวอย่างงาน data journalism จากสำนักพิมพ์ต่างๆ หรือดูตัวอย่างจาก Data jounrnalism handbook, storybench ซึ่งมีตัวอย่างหลากหลาย และสิ่งสุดท้ายที่ขาดไม่ได้สำหรับคนอาชีพนี้ก็คือ Line of inquiry หรือ การขยันตั้งคำถามเหมือนนักสืบข่าว (Investigative Journalist) โดยใช้หัวข้อข่าวมาเป็นจุดเริ่มสมมติฐานในการค้นหาข้อมูลที่จะมาสนับสนุนหรือหักล้าง ยกตัวอย่าง หัวข้อสมมติ “โรคกลัวลูกลำบากกำลังสร้างปัญหาให้สังคมไทย?” แค่ห้วข้อเดียวก็สามารถตั้งคำถามมากมายจากคำหลักๆ หรือ Keyword ในประโยคได้ เช่น โรคนี้หน้าตาเป็นอย่างไร ทำไมถึงเรียกว่า “โรค” ใครมีส่วนเกี่ยวข้องบ้าง เป็นปัญหาอย่างไร เป็นต้น ซึ่งแต่ละคำถามอาจจะนำไปสู่แหล่งข้อมูล open data หรือการทำสำรวจความคิดเห็นเพื่อดูทัศนคติที่ต้องหามา ซึ่งจริงๆ แล้วกระบวนการนี้ก็คือการคิดวิเคราะห์อย่างมีวิจารณญาณ (Critical thinking) ที่พยายามจะหาเหตุผลและความเชื่อมโยงของเรื่องที่เกี่ยวข้องประกอบกันไปเป็น Line of inquiry ที่ Scientist, Engineer, Journalist ใช้ในการทำความเข้าใจปัญหา

ภาพที่ 3: แนวความคิดจาก Story-based inquiry – A manual for investigative journalists by Mark Lee Hunter

ทุเรียนน้อย:โห เรื่อง Data Journalism นี่มีอะไรมากกว่าที่ผมคิดมากเลยนะครับ ผมว่ายังไม่หมดแน่ๆ เลย แต่วันนี้ทุเรียนน้อยมีธุระต้องไปแล้วอะครับ ผมขอโทษจริงๆ คราวหน้าผมขอกลับมาถามพี่จรัลต่อได้ไหมครับ

จรัล: ได้เลยครับ ครั้งหน้าพี่จะมาตอบคำถามทุเรียนน้อยอีกนะครับ สวัสดีครับ