/ Machine Learning

สรุป 5 เหตุการณ์สำคัญในโลก AI ประจำปี 2019

2019 เป็นปีที่ AI ก้าวหน้าไปมาก ผู้คนนอกวงการ AI เริ่มมีความเข้าใจเทคโนโลยีนี้มากขึ้น ทำให้ AI ถูกนำไปใช้ในชีวิตจริงแพร่หลายกว่าเดิม

ในบทความนี้จะพูดถึง 5 เหตุการณ์สำคัญด้าน AI ที่เกิดขึ้นในปีนี้

1) การพัฒนา Language Model อย่างก้าวกระโดด

Language Model เป็นรากฐานของการพัฒนา AI สำหรับการใช้งานด้านภาษา แต่เดิม Language Model ถูกพัฒนาด้วยเทคนิค Word2Vec และ GloVe ซึ่งยังไม่สามารถสร้างประโยคที่ใกล้เคียงมนุษย์ได้ ต่อมาในต้นปี 2018 มี Language Model ใหม่เกิดขึ้น 2 ตัวที่พัฒนาขึ้นกว่าเดิมมาก คือ

  • ULMFiT โดย Jeremy Howard และ Sebastian Ruder
  • ELMo โดย Allen Institute of AI และ University of Washington

ความก้าวหน้าอย่างก้าวกระโดดเริ่มขึ้นปลายปี 2018 เมื่อ Google ปล่อยโมเดล BERT ออกสู่สาธารณะ BERT เป็นโมเดลตัวแรกที่เป็น unsupervised และ deeply bidirectional สำหรับ pretrain งานด้านประมวลผลภาษา (NLP) โดยทำคะแนนความเข้าในการอ่าน (GLUE Benchmark) ได้สูงมาก

ต้นปี 2019 OpenAI ปล่อยโมเดล GPT-2 ออกสู่สาธารณะ ซึ่งสอนด้วยข้อมูล 40GB จากข้อความใน Reddit โดยโมเดลนี้สามารถแต่งนิยาย และเนื้อเพลง ในลักษณะที่คล้ายกับคนได้

หลังจากนั้นมีการพัฒนาโมเดลที่ทำคะแนนบน Benchmark ได้ดีขึ้นมาอีกหลายตัว โดยอาศัยแนวคิดจาก BERT และ GPT-2

เราอาจได้เห็นการพัฒนาที่ยิ่งใหญ่ของ AI ทางด้านภาษาในอนาคตอันใกล้ ในลักษณะเดียวกับการพัฒนาแบบก้าวกระโดดของ AI ใน Computer Vision ที่เคยเกิดขึ้นในอดีต

BERT
https://github.com/google-research/bert
GPT-2
https://openai.com/blog/better-language-models/

2) Face Recognition กับความเป็นส่วนตัว

Face Recognition สามารถบอกได้ว่าคนที่อยู่ในรูปคือใครโดยดูจากใบหน้า เป็นหนึ่งในเทคโนโลยีที่ถูกพูดถึงมากที่สุดใน AI เพราะดูเป็นเรื่องใกล้ตัว และมีตัวอย่างการใช้งานจริงให้เห็นตามข่าว

หลักๆ แล้วเทคโนโลยี Face Recognition มักถูกนำไปใช้เกี่ยวกับการรักษาความปลอดภัย เช่น ตรวจหาคนร้ายจากกล้องวงจรปิด แต่ในอีกมุมหนึ่ง เนื่องจากมันสามารถระบุตัวตนได้จากการตรวจจับใบหน้า และในปัจจุบันมีกล้องวงจรปิดอยู่ทั่วไป ทำให้ผู้คนกังวลเรื่องความเป็นส่วนตัว คนไทยอาจยังไม่ค่อยตระหนักถึงปัญหานี้มากนัก เพราะยังไม่มีการนำ Face Recognition มาใช้อย่างแพร่หลาย และประเทศไทยก็ไม่ได้มีการรณรงค์เรื่องความเป็นส่วนตัว

แต่ในสหรัฐอเมริกาและประเทศแถบยุโรป มีการถกเถียงกันในประเด็นเกี่ยวกับการปกป้องความเป็นส่วนตัวจาก Face Recognition อย่างจริงจัง หลายเมืองออกกฎหมายต่อต้าน Face Recognition เช่น San Francisco และหลายหน่วยงานพยายามออกกฏหมายเพื่อจำกัดการใช้งาน Face Recognition

สำหรับประเทศไทย พ.ร.บ.ข้อมูลส่วนบุคคล จะเริ่มบังคับใช้เดือนพฤษภาคม 2563 ซึ่งส่งผลต่อการใช้งาน Face Recognition ด้วย

3) รถยนต์ไร้คนขับที่ยังไม่ถึงเป้าหมาย

ถึงแม้เทคโนโลยีรถยนต์ไร้คนขับจะพัฒนาไปไกล แต่ก็ยังช้ากว่าที่คาดการณ์ไว้ ในอดีต บริษัทรถยนต์จำนวนหนึ่งคาดไว้ว่า ปี 2017 เราจะมีรถยนต์ไร้คนขับวิ่งบนท้องถนนแล้ว แต่ปัจจุบันรถยนต์ไร้คนขับวิ่งได้ในสภาพแวดล้อมที่จำกัดเท่านั้น

หนึ่งในความท้าทายที่ผู้พัฒนาเผชิญคือ บนถนนมีสถานการณ์เสี่ยงอันตรายหลากหลายรูปแบบ แต่เกิดขึ้นไม่บ่อย เมื่อเทียบกับสถานการณ์ไม่เสี่ยง ทำให้มีข้อมูลไม่เพียงพอในการสอน AI ให้ฉลาดเหมือนคน

อีกปัญหาหนึ่งคือ หลายบริษัทเลือกใช้ Lidar ซึ่งมีราคาแพงและมีจำนวนจำกัด เป็นเซนเซอร์หลักในการทำงาน ส่งผลให้บริษัทเหล่านั้นไม่สามารถติดตั้ง Lidar ได้มากพอ

เพื่อหลีกเลี่ยงปัญหาดังกล่าว มีบริษัทในประเทศจีนเลือกพัฒนาเทคโนโลยีรถยนต์ไร้คนขับด้วยวิธีที่ต่างออกไป นั่นคือ แทนที่จะสร้างรถยนต์ให้วิ่งบนถนนที่มีอยู่แล้ว บริษัทเหล่านี้ปรับปรุงเมืองและถนนใหม่ให้เหมาะแก่การทำงานของรถยนต์ไร้คนขับ เพื่อหลีกเลี่ยงสถานการณ์ที่คาดเดายากบนถนนปัจจุบัน

4) Deepfake ที่เหมือนจริงมาก

Deepfake คือเทคนิคการสร้างวิดีโอปลอมที่ดูเหมือนใครคนหนึ่งทำอะไร หรือพูดอะไรบางอย่าง โดยเหตุการณ์นั้นไม่ได้เกิดขึ้นจริง

เทคนิคนี้ถูกพัฒนามาจนถึงจุดที่วิดีโอปลอมมีลักษณะคล้ายกับวิดีโอจริงมากทั้งในแง่ภาพและเสียงจนแทบแยกไม่ออก ทำให้เกิดกระแสตื่นตระหนกว่า ในอนาคตเราจะเชื่อได้อย่างไรว่าเหตุการณ์ไหนเกิดขึ้นจริงหรือไม่จริง นอกจากเห็นด้วยตาตัวเอง

ตัวอย่างด้านมืดที่ถูกนำไปใช้แล้ว เช่น การสร้างวิดีโอโป๊โดยใช้ใบหน้าของดารา และการสร้างวิดีโอที่ใช้ใบหน้าคนดังออกมาพูดอะไรบางอย่าง

ตัวอย่างล่าสุดที่เป็นข่าวคือ วิดีโอที่ Mark Zuckerberg พูดว่า เค้าคนเดียวมีอิทธิพลมหาศาลจากการกุมข้อมูลของผู้คนบน social network ซึ่ง Mark ไม่ได้พูด แต่วิดีโอดูเหมือนของจริงมาก

Facebook ได้ประกาศลงทุน 10 ล้านดอลล่าร์สหรัฐ จัดการแข่งขันประกวด Deepfake detection เพื่อสร้างโมเดลแยกว่าวิดีโอไหนจริงหรือไม่จริง

งานนี้เป็นงานที่ท้าทายมาก เพราะเมื่อโมเดลถูกพัฒนาขึ้นเพื่อตรวจจับวิดีโอปลอม Deepfake ก็จะถูกพัฒนาให้มีประสิทธิภาพขึ้นเพื่อหลอกโมเดลเหล่านั้น ทำให้การแยกวิดีโอปลอมยากขึ้นเรื่อยๆ และเกิดความกลัวว่าจะมีวิดีโอปลอมที่แยกไม่ออกแพร่หลายในอนาคตอันใกล้

วิดีโอปลอม Mark Zuckerberg
https://www.vice.com/en_us/article/ywyxex/deepfake-of-mark-zuckerberg-facebook-fake-video-policy
Deepfakes Detection Challenge
https://www.vice.com/en_us/article/8xwqp3/facebook-deepfake-detection-challenge-dataset

5) Simulated data

AI ที่ฉลาดจำเป็นต้องเรียนรู้จากข้อมูลจำนวนมาก แต่ข้อมูลที่มีคุณภาพและอยู่ในรูปแบบที่ต้องการมีอยู่จำกัด ทำให้ผู้พัฒนาต้องมองหาทางเลือกอื่น

วิธีหนึ่งที่ทำได้คือสร้างข้อมูลขึ้นมาเอง (simulated data) จากสถานการณ์ที่จำลองขึ้นมา ตัวอย่างกรณีศึกษา เช่น

  • บริษัท DeepMind ในเครือของ Google สร้างโปรแกรม AlphaStar เพื่อเล่นเกมส์ StarCraft II โดยให้เรียนรู้จากจากการแข่งขันจำลอง ที่ยาวนานเทียบเท่าเวลาแข่งขันในโลกจริงกว่า 10,000 ปี และ AlphaStar สามารถเอาชนะผู้เล่นระดับโลกได้
  • สถาบันวิจัย OpenAI สร้างโปรแกรม OpenAI Five ให้เอาชนะผู้เล่นระดับโลกในเกมส์ Dota 2 ได้ด้วยเทคนิคเดียวกัน
  • Amazon พยายามพัฒนารถยนต์ไร้คนขับ Aurora โดยสอน AI ขับรถด้วยการจำลองโลกให้รถยนต์วิ่ง เสริมกับข้อมูลการวิ่งจริง เพื่อทดแทนข้อมูลที่มีอยู่จำกัด

แหล่งอ่างอิง

Biggest AI Stories of 2019
https://blog.deeplearning.ai/blog/the-batch-biggest-ai-stories-of-2019-driverless-cars-stall-deepfakes-go-mainstream-face-recognition-gets-banned

สรุป 5 เหตุการณ์สำคัญในโลก AI ประจำปี 2019
Share this

Subscribe to Code on the Hill