“เอ็มไอที” พัฒนาระบบ คุมคอมพิวเตอร์ด้วยความคิด

2.05.18 | 19:24 น.
(ภาพ-Lorrie Lejeune MIT)

ทุกครั้งที่เราอ่าน (ในใจ) หรือแม้แต่คิดถึงถ้อยคำ นักวิทยาศาสตร์ผู้เชี่ยวชาญด้านการพูดระบุว่า กล้ามเนื้อของเราทั้งในบริเวณกล่องเสียง, กราม และใบหน้า จะเกิดการเคลื่อนไหวเล็กน้อยที่สังเกตไม่เห็น เพื่อสร้าง “เสียง” ของคำหรือเนื้อความที่เราคิดหรืออ่านขึ้นภายในหัวของเรา นักวิทยาศาสตร์เรียกกระบวนการพูดไร้เสียงนี้ว่า “ซับโวคอลไลเซชัน” ซึ่งเกิดขึ้นกับคนเราเป็นประจำทุกวัน

ทีมวิจัยจากห้องปฏิบัติการ มีเดียแล็บ ของสถาบันเทคโนโลยีแห่งแมสซาชูเสตต์ (เอ็มไอที) นำเอากระบวนการ ซับโวคอลไลเซชัน” ดังกล่าวนี้มาใช้เพื่อพัฒนาระบบการสื่อสารกับคอมพิวเตอร์ผ่านอุปกรณ์สวมศีรษะที่ทำให้สามารถส่งและรับสัญญาณจากคอมพิวเตอร์ได้โดยไม่จำเป็นต้องแสดงท่าทางหรือใช้เสียงแต่อย่างใดทั้งสิ้น

ระบบดังกล่าวซึ่งเรียกว่า “ปัญญาเสริม” (Intelligence-Augmentation) หรือ “ไอเอ” ดำเนินการผ่านอุปกรณ์สำหรับสวมใส่กับศีรษะซึ่งทีมมีเดียแล็บตั้งชื่อว่า “อัลเทอร์อีโก” ช่วยให้ผู้ใช้สามารถสั่งงานและรับคำตอบจากคอมพิวเตอร์ได้โดยไม่ต้องออกท่าทางหรือออกเสียง จะประกอบด้วยเซนเซอร์อีเลคโทรดด้านใต้ของอุปกรณ์ที่แนบติดอยู่กับใบหน้า ซึ่งจะทำหน้าที่ตรวจจับและบันทึกความเคลื่อนไหวเล็กน้อยของกล้ามเนื้อใบหน้าและบริเวณกราม จากนั้นส่งข้อมูลดังกล่าวผ่านบลูทูธไปยังคอมพิวเตอร์ภายนอก ซึ่งติดตั้งซอฟท์แวร์ประมวลผลทำนองเดียวกับซอฟร์แวร์เปลี่ยนเสียงพูดให้เป็นตัวอักษร จากนั้นจึงประมวผลคำตอบส่งกลับไปยังอุปกรณ์อัลเทอร์อีโกผ่านบลูทูธอีกครั้ง

ที่น่าสนใจก็คือ อุปกรณ์อัลเทอร์อีโก ไม่จำเป็นต้องมีหูฟัง เนื่องจากใช้เทคโนโลยี “โบน คอนดัคชัน เฮดโฟน” ซึ่งอาศัยส่งแรงสั่นสะเทือนผ่านกระดูกเข้าสู่หูชั้นในของผู้ใช้โดยตรง ซึ่งเท่ากับเป็นการให้คำตอบเป็นเสียงภายในหัวของเราโดยตรงนั่นเอง

อาร์นาฟ คาปูร์ หัวหน้าทีมวิจัยโครงการนี้ ยกตัวอย่างการใช้งานอัลเทอร์อีโก ที่ตนเองเคยทดลองใช้ เช่นการคิดคำว่า “Time?” ก็สามารถได้คำตอบจากคอมพิวเตอร์กลับมาได้เป็น “10.45” ใช้คิดเพื่อตรวจสอบรายการโทรทัศน์ หรือใช้ในการรวมราคาสินค้าที่คิดจะซื้อในซุปเปอร์มาร์เก็ต รวมทั้งเคยลองใช้ในการโกงการเล่นเกมโกะกับเพื่อน โดยอาศัยคอมพิวเตอร์คำนวณหมากให้

Advertisement

ในการทดลองเบื้องต้น อัลเทอร์อีโก ให้ผลลัพธ์น่าพอใจทีเดียว ในการทดลองโดยอาศัยอาสาสมัคร 10 คน ให้อ่านรายการตัวเลข 750 ชุดที่เรียงแบบสุ่มโดยไม่ต้องออกเสียง เพื่อวัดความแม่นยำในการเปลี่ยนให้เป็นข้อมูลในคอมพิวเตอร์ พบว่า มีความแม่นยำถึง 92 เปอร์เซ็นต์ (ในขณะที่ระบบแปลเสียงพูดผ่านไมโครโฟนให้เป็นตัวอักษรของกูเกิลมีความแม่นยำราว 95 เปอร์เซ็นต์)

แพทตี้ เมส ศาสตราจารย์ของเอ็มไอที ซึ่งเป็นผู้ควบคุมทีมวิจัยชุดนี้ ระบุว่า วัตถุประสงค์ของการทดลอง เพื่อพัฒนารูปแบบใหม่ๆ และประสบการณ์แบบใหม่ ที่ทำให้คนทั่วไปยังคงได้ประโยชน์จากองค์ความรู้และบริการผ่านอินเตอร์เน็ตได้

โดยที่ไม่จำเป็นต้องจดจ่ออยู่กับคอมพิวเตอร์หรือสมาร์ทโฟนเหมือนที่เคยเป็นมานั่นเอง