คอร์ลัม FUTURE perfect โดย ทีปกร วุฒิพิทยามงคล เรื่องมองข้อมูลอย่างสร้างสรรค์ : วัดแคลอรีและความสุขด้วยทวิตเตอร์

ห้องวิจัย Computational Story Lab ของมหาวิทยาลัยเวอร์มอนต์ มีสโลแกนว่า We do blatantly fun research หรือ “เราทำวิจัยงานที่สนุกจริงๆ เท่านั้น” และจากที่อ่านผลงานของเขา ผมก็ต้องยอมรับว่างานของเขาสนุกจริงๆ

จะว่าไป ยุคนี้ก็คล้ายกับเป็นยุคทองของการศึกษาด้านมนุษยวิทยาเลยนะครับ ด้วยจำนวนข้อมูลที่นักวิจัยสามารถเก็บได้จากโซเชียลเน็ตเวิร์ก และด้วย “ความพร้อมที่จะเปิดข้อมูล” ของผู้คนที่มากขึ้นๆ นักมนุษยวิทยาในยุคปัจจุบันจึงสามารถเข้าถึงขุมทรัพย์ฐานข้อมูลที่คนสมัยก่อนได้เพียงแต่ฝัน – งานของ Computational Story Lab เผยให้เราเห็นความรู้ หรือ Insight ที่ซ่อนอยู่ในกองข้อมูลเหล่านี้ ผ่านวิธีตีความและนำไปใช้อย่างสร้างสรรค์

ตัวอย่างเช่น ข้อมูลจากทวิตเตอร์ – เราก็รู้ว่าผู้คนเป็นสิบๆ ล้านคนทวีตกันทุกวัน และบางคนก็อาจทวีตถี่มากถึงวันละหลายร้อยครั้ง (ก่อนที่จะโดนบล็อกจากเพื่อนเพราะทวีตถี่เกินไป!) – เนื้อหาทวีตของพวกเขาสามารถบอกอะไรได้บ้าง?

อย่างแรกคือ เนื้อหาทวีตของพวกเขาสามารถบ่งบอกถึง “ระดับความสุข” ได้ เมื่อชาวทวีตคนหนึ่งรู้สึกยินดี เขาอาจทวีตคำที่แสดงออกถึงความสุขออกมา ในขณะที่เมื่อพวกเขารู้สึกย่ำแย่ พวกเขาก็อาจทวีตคำที่มืดหม่นออกมาเช่นกัน นักวิจัยจาก Computational Story Lab เริ่มต้นด้วยการแยกแยะ “คำที่แสดงออกถึงความสุข” และ “คำที่แสดงออกถึงความทุกข์” ด้วยการให้คน 10,000 คน ให้คะแนนกับคำแต่ละคำ (10,222 คำ) จนได้เป็นอันดับ “คำที่มีความสุข” ตีเป็นคะแนนออกมา พวกเขาพบว่า คำที่มีความสุขที่สุดคือคำว่า Laughter (ได้คะแนน 8.5) ส่วนคำอื่นๆ ที่แสดงออกถึงความสุขก็เช่น Rainbow (8.1), Smile (8.1), Music (8.02), Celebrating (8.0) ส่วนคำที่มีความทุกข์ที่สุดคือคำว่า Terrorists (1.3) และคำที่แสดงออกความทุกข์คำอื่นๆ ก็เช่น Rape (1.44), Kill (1.56), Cancer (1.54), War (1.8)

Advertisement

เมื่อได้อันดับของคำที่มีความสุขไปจนถึงคำที่มีความทุกข์มาแล้ว พวกเขาก็จัดการจับเอาคำเหล่านี้ไปจับคู่กับคำที่มีคนทวีตออกมาจริงๆ เมื่อดูในภาพใหญ่ เราก็จะได้สถิติที่น่าสนใจมากมาย เช่นเราจะรู้ว่าผู้คน (อย่างน้อยในทวิตเตอร์) รู้สึกอย่างรุนแรงแค่ไหนต่อเหตุการณ์ใดเหตุการณ์หนึ่ง ด้วยข้อมูลชุดนี้ พวกเขาค้นพบแพตเทิร์นอย่างเช่น

-วันปกติๆ ผู้คนจะมีความสุขอยู่ที่ราวๆ หกเต็มสิบ

-วันที่มีความสุขที่สุดในหนึ่งสัปดาห์คือวันเสาร์ ขณะที่วันที่มีความทุกข์ที่สุดคือวันอังคาร

Advertisement

-ช่วงเวลาที่ผู้คนมักจะรู้สึกดีที่สุดคือตอนตีห้าหรือหกโมงเช้า และรู้สึกแย่ที่สุดตอนห้าทุ่ม

-รัฐที่มีความสุขที่สุดในสหรัฐอเมริกาจากข้อมูลนี้ คือฮาวาย ขณะที่รัฐที่มีความทุกข์คือมิซซิสซิปปี้และหลุยส์เซียนา

-ภาคตะวันตกของสหรัฐมีความสุข ในขณะที่ภาคใต้ไม่มีความสุขเท่าไร

-วันที่มีความสุขที่สุดในหนึ่งปีคือวันคริสต์มาส ส่วนวันที่มีความทุกข์ที่สุดในรอบห้าปีคือวันที่เกิดเหตุยิงที่แซนดี้ฮุค, เกิดเหตุระเบิดที่งานมาราธอนที่บอสตัน, เหตุยิงกราดที่ไนต์คลับในออร์แลนโด, เหตุยิงที่ดัลลัส และผลการเลือกตั้งที่โดนัลด์ ทรัมป์ ได้รับชัยชนะ

ในเว็บไซต์ Hedonometer (มาตรวัดความสุข) [http://hedonometer.org] มีกราฟของความสุขตั้งแต่ปี 2009 จนถึงปัจจุบัน และมีการทำตำแหน่งเหตุการณ์สำคัญๆ (เช่น การก่อการร้าย หรือวันปีใหม่) ลงบนกราฟเพื่อให้เราดูได้ง่ายขึ้นด้วยว่าเหตุการณ์แต่ละครั้งมีผลต่อความสุขของชาวทวิตเตอร์ (ที่ใช้ภาษาอังกฤษ) มากหรือน้อยอย่างไร

ด้วยการใช้ข้อมูลชุดเดียวกัน Computational Story Lab ยังสามารถวัดระดับความสุขของภาพยนตร์โดยดูจากสคริปต์ได้ด้วย พวกเขาพบว่าภาพยนตร์ที่มีความสุขที่สุดคือ Sex and the City อันดับรองๆ ลงมาคือ Mary Poppins, Lost in Translation, White Christmas เป็นต้น ในขณะที่ภาพยนตร์ที่มีความทุกข์ที่สุด (จาก 1,033 อันดับ) คือ Omega Man รองลงมาคือ The Bourne Ultimatum, Day of the Dead และ The Thing

นอกจากจัดอันดับตามเรื่องแล้ว พวกเขายังสามารถทำกราฟเพื่อแสดงไทม์ไลน์ “ความสุข” ตามลำดับเหตุการณ์ในภาพยนตร์หรือในหนังสือได้อีกด้วย กราฟนี้สามารถระบุได้ค่อนข้างแม่นยำว่าช่วงเวลาที่มีความสุขที่สุดของภาพยนตร์อย่าง Aladdin คือตอนที่อลาดินพบตะเกียงวิเศษ และช่วงที่มีความทุกข์ที่สุดคือตอนที่อลาดินโดนจับโดยจาฟาร์ ผู้ร้ายของเรื่อง

หากไม่พูดเรื่องความสุข, ข้อมูลจากทวิตเตอร์ยังทำให้พวกเขาสามารถจัดอันดับ “รัฐที่มีสุขภาพดี” และ “รัฐที่มีสุขภาพย่ำแย่” ได้โดยดูจากปริมาณแคลอรีในอาหาร และลักษณะกิจกรรมที่ชาวทวีตในรัฐนั้นๆ ทวีตออกมา (เช่น เบคอน อาจได้คะแนนสุขภาพต่ำ ขณะที่แอปเปิลอาจได้คะแนนสูง, เดินเขา อาจได้คะแนนสุขภาพสูง ขณะที่ดูทีวีอาจได้คะแนนสุขภาพต่ำ) พวกเขาพบว่าในรัฐมิสซิสซิปปี้ กิจกรรมที่ผู้คนทำ (และทวีตออกมา) มากที่สุดคือการกิน ในขณะที่ในโคโลราโด กิจกรรมยอดนิยมคือการวิ่ง สกี ปีนเขา ปั่นจักรยาน เมื่อเทียบกับข้อมูลสุขภาพจริงๆ แล้วก็พบว่า มิสซิสซิปปี้นั้นเป็นรัฐที่มีอัตราความเสี่ยงต่อโรคเบาหวานและโรคหัวใจสูงสุด และมีความเสี่ยงที่จะน้ำหนักเกินจนเข้าข่ายอ้วน (obese) สูงเป็นอันดับสองของสหรัฐ ขณะที่โคโลราโดก็เป็นรัฐที่มีความเสี่ยงต่ำที่สุดทั้งสองอันดับ [ดูได้ที่ http://panometer.org]

ไม่ผิดที่เราจะคิดว่าวิธีการวิจัยข้อมูลโดยการดูจากทวิตเตอร์เพียงอย่างเดียวนั้นไม่ครบถ้วน และอาจมีความผิดพลาดได้สูง ซึ่งจริงๆ แล้ว ก็เป็นอย่างนั้น – แต่การวิจัยใดๆ ก็มีช่องโหว่ด้านความครบถ้วนของข้อมูลด้วยกันทั้งสิ้น (เช่น การทำโพล ก็อาจมีช่องโหว่ ทั้งในเรื่องความจริงใจของผู้ตอบ และจำนวนผู้ถูกสัมภาษณ์) – ความได้เปรียบของการวิจัยผ่าน
ทวิตเตอร์ หรือผ่านข้อมูลบนโซเชียลเน็ตเวิร์กใดๆ คือความฉับไวของข้อมูล และ “ความเปิดเผยอย่างเหลือเชื่อ” ของชาวโซเชียล

ในอนาคต ทีมวิจัยจาก Computational Story Lab บอกว่าพวกเขาจะพยายาม “เล่าเรื่องด้วยข้อมูล” หรือ “ค้นหาคำตอบด้วยข้อมูล” ต่อไป โดยจะจัดการกับปัญหาที่ยากและท้าทายขึ้น เช่น ปรากฏการณ์ข่าวปลอม “ชนะ” ข่าวจริงเมื่อไร และอย่างไร หรือเราสามารถทำนายวิกฤตเศรษฐกิจก่อนเกิดขึ้นจริงโดยดูจากข้อมูลโซเชียลเน็ตเวิร์กหรือไม่

ทั้งทวีต ทั้งสเตตัส ทั้งรูปถ่ายบนอินสตาแกรมของเรา เมื่อรวบรวมจนมีจำนวนมากพอ หลากหลายพอ ครบถ้วนพอแล้ว มันก็จะเปรียบเสมือน “สัญญาณ” อันล้ำค่า ที่จะอนุญาตให้เรามองไปยังอนาคต – ขึ้นอยู่กับว่า เรามีความสามารถ และวิธีการที่จะมองเห็นมันหรือเปล่า

QR Code
เกาะติดทุกสถานการณ์จาก Line@matichon ได้ที่นี่
Line Image