สิบปากว่าไม่เท่าตาเห็น แต่สิบตาเห็นก็อาจเชื่อไม่ได้อีกแล้วในยุคปัญญาประดิษฐ์
น่ายินดีที่ทุกวันนี้เมื่อมีรูปถ่ายอื้อฉาวใดๆ ปรากฏขึ้นบนโซเชียลมีเดีย ไม่ว่าจะเป็นรูปโป๊ของดารา, รูปผู้นำคนนั้นจับมือกับผู้ก่อการร้ายอีกคน, หรือรูปบุคคลสาธารณะทำอะไรมิดีมิงาม เราก็มักจะได้เห็นคอมเมนต์อย่าง “ตัดต่อหรือเปล่า” “ตัดต่อแน่ๆ ไม่เนียนเลย ดูที่หัวสิ มันเป็นเหลี่ยมๆ” บ่อยครั้ง ที่น่ายินดีก็เพราะนี่เป็นหนึ่งในความคิดพื้นฐานในการอ่านสื่อให้เป็น นั่นคือการพยายามตั้งคำถามกับสิ่งที่ปรากฏอยู่ตรงหน้า ไม่เชื่อโดยไม่รู้อีโหน่อีเหน่
ผมเชื่อว่าการตื่นตัวเรื่องรูปตัดต่อนั้นกลายเป็นเรื่องเมนสตรีมและเข้าถึงทุกคนไปแล้ว หากลองถามใครก็ตาม ทั้งลูกเด็กเล็กแดง ลุงป้าน้าอา หรือกระทั่งคนที่ดูไม่ประสีประสากับเทคโนโลยี ก็น่าจะได้คำตอบว่าพวกเขาก็ยัง “รู้” ว่ารูปตัดต่อนั้นมีอยู่จริง และเป็นเรื่องที่ควรต้องเฝ้าระวังกันเสียเป็นส่วนใหญ่
แน่นอนว่าการตัดต่อรูปนั้นไม่ได้เกิดขึ้นมาในยุคคอมพิวเตอร์ – มันเกิดขึ้นมาก่อนหน้านั้นนานนม และมักถูกใช้เป็นเครื่องมือทางการเมืองของผู้นำหลายประเทศ การตัดต่อรูปก่อนยุคคอมพิวเตอร์ต้องทำด้วยมือล้วนๆ และต้องใช้ทักษะของช่างที่ช่ำชองด้วยการฝึกฝนมาเข้มข้น แต่คอมพิวเตอร์และการแพร่หลายของโปรแกรมอย่างเช่นโฟโต้ช็อป (รวมไปถึงแอพพ์บนมือถือที่ทำให้การตัดต่อรูปเป็นเรื่องง่ายจนแค่คลิกไม่กี่ทีก็ทำได้) ก็ทำให้ความสามารถในการเปลี่ยนเรื่องปลอมให้เป็นรูปจริงเป็นเรื่องที่ใครๆ ก็เข้าถึงได้
ลองนึกถึงแอพพ์ อย่าง FaceApp ที่เปลี่ยนเพศ หรืออายุเรา หรือแอพพ์บางแอพพ์ที่ทำให้เรากลายเป็นคนหัวล้านได้ทันใจ แล้วมองย้อนกลับไปว่าเมื่อสักห้าปีสิบปีก่อน – การทำเรื่องเหล่านี้นั้นยากเย็นเกินคาดคิดสิครับ
ในทุกวันนี้เราตื่นตัวกับเรื่องรูปตัดต่อแล้ว แต่ในอนาคต เราอาจต้องตื่นตัวกับ “คลิปตัดต่อ” ด้วย เมื่อเทคโนโลยีปัญญาประดิษฐ์และคอมพิวเตอร์กราฟิกก้าวล้ำขึ้นไปอีกขั้น จนอาจทำให้ใครๆ ก็สามารถสร้างคลิปให้คนอื่น “พูดอะไรก็ได้”
เมื่อเดือนกรกฎาคมที่ผ่านมา ศุภศรณ์ สุวจนกรณ์ นักวิจัยจากห้องวิจัย GRAIL มหาวิทยาลัยวอชิงตัน ได้นำเสนอเทคโนโลยีการสร้างวิดีโอให้ใครก็ตาม “พูด” ตามเสียงที่ใส่เข้าไปได้อย่างสมจริง (เหมือนลิปซิงก์)
ในตัวอย่างงานวิจัยนี้ เขาทดลองใช้วิดีโอของบารัค โอบามา จำนวน 14 ชั่วโมง มาเป็นข้อมูลฐานให้ปัญญาประดิษฐ์เรียนรู้ แล้วหลังจากนั้นก็อินพุตเสียงใดๆ เข้าไปให้โอบามาพูดตาม ได้ผลลัพธ์ออกมาเป็นวิดีโอที่โอบามา ขยับปาก-ขยับหน้า ตามเสียงพูดได้อย่างเกือบแยกไม่ออกว่าไม่ใช่ของจริง (ผู้สนใจสามารถดูวิดีโอได้ที่ https://www.youtube.com/watch?v=9Yq67CjDqvw หรือค้น Synthesizing Obama: Learning Lip Sync from Audio)
นอกจากนั้น เมื่อปีที่ผ่านมา ก็มีเทคโนโลยีชื่อ Face2Face จากมหาวิทยาลัยสแตนฟอร์ด ร่วมกับมหาวิทยาลัยเออร์ลางเกน-นูเรมเบิร์ก ที่สามารถสร้างวิดีโอให้ใครก็ตาม มาพูดและแสดงสีหน้าตามเราได้ในแบบเรียลไทม์ด้วย (เหมือนมีคนคนนั้นมาพูดคำที่เราพูดเป๊ะๆ) โดยนักวิจัยใช้ใบหน้าของนักการเมืองอย่างจอร์จ บุช, วลาดิมีร์ ปูติน และโดนัลด์ ทรัมป์ มาทดลอง (วิดีโอ https://www.youtube.com/watch?v=ohmajJTcpNk หรือค้น Face2Face: Real-time Face Capture and Reenactment of RGB Videos (CVPR 2016 Oral))
สำหรับเสียงพูด ก็ยังมีซอฟต์แวร์ชื่อ Lyrebird ที่ให้ปัญญาประดิษฐ์ศึกษาเสียงของใครก็ตาม เพื่อให้สามารถปลอมเสียงพูดของคนคนนั้นได้ ซึ่งในตัวอย่าง ก็แสดงการเลียนเสียงของฮิลลารี คลินตัน โอบามา และทรัมป์ ให้ฟังกัน ถึงแม้ผลลัพธ์ที่ได้ในตอนนี้ยังไม่สมจริงและดูเป็นหุ่นยนต์ไปหน่อย แต่ในอนาคตเทคโนโลยีนี้ก็จะถูกพัฒนาให้สมจริงจนแยกไม่ออกขึ้นตามลำดับ (ลองค้นหา Politicians discussing about Lyrebird เพื่อฟัง)
ผมเห็นเรื่องนี้แล้วก็นึกถึงเทคนิคการหลอกลวงคุณย่าคุณปู่ชาวญี่ปุ่น ที่ชื่อว่าเทคนิค “นี่ผมเอง” ขึ้นมา-นี่เป็นวิธีการหลอกคนเฒ่าคนแก่อย่างง่ายๆ โดยโจรจะโทรไปที่บ้านของเป้าหมาย (ที่รู้มาก่อน ว่ามีแต่คนแก่อยู่ที่บ้าน) แล้วพูดว่า “นี่ผมเองนะ” เพื่อให้เป้าหมายเข้าใจว่าเป็นหลานๆ ของตัวโทรมา ก่อนที่จะบอกว่า “ผมกำลังลำบาก เงินขาดมือมาก (หรือข้ออ้างอะไรก็ว่าไป) หากจะกรุณา ช่วยโอนเงินมาให้หน่อยได้ไหมครับ ที่ (เบอร์บัญชี)” หากเป้าหมายไม่ติดใจนึกสงสัย โอนเงินให้ ก็ถือว่าหลอกลวงได้ประสบความสำเร็จ เราได้ยินเทคนิคนี้แล้วเราเองก็อาจคิดว่า “หลงเชื่อเข้าไปได้ยังไง” “ทำไมไม่รู้จักเสียงหลานของตัวเอง” แต่หากในอนาคตเรามีเทคโนโลยีที่สามารถเลียนเสียงได้สมจริงแล้ว การหลอกลวงแบบนี้อาจน่ากลัวยิ่งขึ้นก็ได้
ลองจินตนาการถึงโลกอนาคตที่เราไม่อาจเชื่อถือได้กระทั่งการวิดีโอคอลล์หาเพื่อน เพราะวิดีโอที่เราเห็นอยู่นั้นอาจไม่ใช่เพื่อนจริงๆ แต่เป็นวิดีโอที่ถูกสร้างขึ้นมาโดยปัญญาประดิษฐ์สิครับ คำถามถึงโลกอนาคตก็คือ “แล้วเราจะเชื่ออะไรได้บ้าง?”
ยิ่งไปกว่านั้น เมื่อเทคโนโลยีการปลอมแปลงวิดีโอสมจริงขึ้นเรื่อยๆ ข้ออ้างที่ว่า “มันเป็นวิดีโอตัดต่อ” ก็อาจถูกใช้โดยนักการเมืองหรือผู้มีอิทธิพลมากขึ้นเรื่อยๆ เช่นกัน (ถึงแม้วิดีโอนั้นจะเป็นของจริง) เช่น หากมีวันที่ประธานาธิบดีประเทศหนึ่งถูกเปิดโปงว่าซื้ออาวุธสงครามจากกลุ่มก่อการร้าย โดยมีวิดีโอเป็นหลักฐาน เขาก็อาจปฏิเสธได้ง่ายๆ ว่า นี่มันเป็นวิดีโอที่ถูกตัดต่อขึ้นมา เหมือนๆ กับที่ทุกวันนี้ เราก็ได้ยินคนปฏิเสธความจริงกันอย่างมากมายด้วยข้ออ้างที่ว่า “มันเป็นภาพตัดต่อ”
Business Insider แสดงความเป็นกังวลกับเทคโนโลยีเหล่านี้และบอกว่าพวกมันจะสร้างปัญหาตามมาอย่างมากมาย ทั้งจะทำให้สงครามข้อมูลระหว่างประเทศและภายในประเทศระอุขึ้น จะทำให้การกลั่นแกล้งไซเบอร์ (Cyberbullying) ทวีความรุนแรงขึ้น (เช่นปลอมเสียงใครสักคนให้สารภาพเรื่องน่าอาย) และจะทำให้อาชญากรรมทางเพศเข้มข้นขึ้น (เช่น สามารถสร้างวิดีโอโป๊ของดาราได้อย่างสมจริง)
โลกที่ความจริงกับความลวงเลื่อนเข้าหากันเรื่อยๆ จนเราอาจแยกแยะไม่ออกกำลังรออยู่ตรงหน้า และนี่ก็เป็นความท้าทายที่เราทุกคนต้องเผชิญ

