/ Machine Learning

ก้าวต่อไปของ AI ในปี 2020

คราวที่แล้วเราพูดถึงเหตุการณ์สำคัญในโลก AI สำหรับปี 2019 บทความนี้จะมาพูดถึงความก้าวหน้าของ AI ที่มีแนวโน้มจะเกิดขึ้นในปี 2020

1) โมเดลที่เรียนรู้ด้วยตัวเอง

ปัจจุบัน Machine Learning ที่ประสบความสำเร็จที่สุดคือ Supervised Learning ซึ่งเป็นการสร้างโมเดล โดยมนุษย์เป็นผู้สอนให้เรียนรู้จากตัวอย่างที่มีคำตอบ (label) วิธีนี้ต้องใช้ต้นทุนในการรวบรวมข้อมูลสูง เพราะต้องจ้างคนเพื่อจัดหาคำตอบที่ถูกต้องให้กับข้อมูล ซึ่งเปรียบเสมือนการให้คนมาสอนเด็กในการเรียนรู้สิ่งใหม่ๆ แต่ถ้าเราสังเกตเด็กให้ดีจะพบว่า เด็กสามารถเรียนรู้หลายอย่างได้จากการสังเกตสภาพแวดล้อมด้วยตนเอง โดยไม่ต้องให้ใครสอน คล้ายกับสิ่งที่ใน Machine Learning เรียกว่า Self-supervised Learning

ในอนาคต มีแนวโน้มว่า Self-supervised Learning จะถูกนำมาใช้มากขึ้น วิธีนี้เป็นวิธีสร้างโมเดลโดยการนำส่วนหนึ่งของข้อมูลออกไปเพื่อไม่ให้โมเดลเห็น จากนั้นกำหนดให้ส่วนนั้นเป็นคำตอบที่ต้องการ โมเดลจะเรียนรู้เพื่อค้นหาคำตอบที่หายไป วิธีนี้ไม่ต้องใช้คนกำหนดคำตอบที่ถูกต้อง เพราะคำตอบอยู่ในข้อมูลดั้งเดิม ตัวอย่างเช่น การสร้าง Language Model เพื่อเป็นโครงสร้างพื้นฐานให้ AI เข้าใจภาษา โมเดลนี้สามารถนำไปต่อยอดเพื่อใช้ในงาน NLP อื่นๆ เช่น งานแปลภาษา (Machine Translation)

2) จำลองสถานการณ์ที่พบได้ยาก

แม้ว่าเราจะอยู่ในยุคที่มีข้อมูลมากมาย แต่ข้อมูลที่ใช้ในการสอน AI ไม่เคยมีเพียงพอ อาจเป็นเพราะการเก็บรวบรวมข้อมูลบางอย่างทำได้ช้า หรือข้อมูลที่ต้องการมาจากเหตุการณ์ที่เกิดขึ้นไม่บ่อย เช่น

  • ต้องการตัวอย่างเหตุการณ์รถชน เพื่อนำไปสร้างรถยนต์ไร้คนขับ
  • ต้องการตัวอย่างเหตุการณ์ความวุ่นวายในตึก หรือโรงพยาบาล เพื่อนำไปสร้างระบบเตือนภัย

การสร้างโลกจำลอง (Simulation) ขึ้นมา เพื่อจำลองสถานการณ์ที่เกิดขึ้นได้ยาก และนำข้อมูลนี้ไปเสริมกับข้อมูลที่เก็บได้จากชีวิตจริง จะช่วยให้เราสร้าง AI ที่ทำงานได้หลากหลายสถานการณ์ยิ่งขึ้น ในอดีตที่ผ่านมาการจำลองสถานการณ์ถูกใช้มากที่สุดใน Reinforcement Learning แต่ในอนาคตอันใกล้จะถูกใช้ใน AI ทั่วไปมากขึ้น เพราะความต้องการด้านข้อมูลที่มีเพิ่มขึ้น

3) Hardware สำหรับ AI โดยเฉพาะ

งานด้าน AI จำนวนมากต้องใช้พลังประมวลผลมหาศาล โดยเฉพาะการสอนโมเดลด้วย Deep Learning ขนาดใหญ่ ปัจจุบันเราใช้การ์ดจอเป็นหลัก แต่นี่อาจยังไม่ใช่วิธีที่มีประสิทธิภาพที่สุด บริษัทยักษ์ใหญ่จำนวนหนึ่งจึงได้คิดค้นและผลิตชิปสำหรับทำงานทางด้าน AI โดยเฉพาะขึ้นมา ซึ่งมีประสิทธิภาพที่ดีกว่า ตัวอย่างเช่น Tensor Processing Unit (TPU) สำหรับงานด้าน AI โดย Google ซึ่งเปิดให้บุคคลทั่วไปเช่าได้บน Google Cloud

ในอนาคตเมื่อ AI ถูกนำไปใช้มากขึ้น เราจะได้เห็นผู้ผลิต hardware ออกชิปสำหรับทำงาน AI โดยเฉพาะกันมากขึ้น ในราคาที่ถูกลง ซึ่งจะช่วยให้ต้นทุนในการสร้างโมเดลและการนำ AI ไปใช้ต่ำลงด้วย

4) NLP ที่เข้าใกล้ความฉลาดของมนุษย์

ในปี 2019 เราได้เห็นความสำเร็จของโมเดล BERT ที่พัฒนาโดย Google และโมเดลอื่นๆ ที่ตามมา ซึ่งทำให้งาน AI ด้านภาษาก้าวหน้าไปมาก ในปีนี้ เราน่าจะได้เห็นผลของความก้าวหน้านี้ชัดเจนยิ่งขึ้น

ตัวอย่างเช่น ปัญหาหนึ่งในโลกยุคปัจจุบันคือ เรามีข้อมูลข่าวสารมากเกินไปจนอ่านไม่ทัน ทั้งยังบอกว่าข้อมูลไหนจริงหรือไม่จริงได้ยาก การสรุปใจความสำคัญ (Text Summarization) ซึ่งเป็นเทคโนโลยีหนึ่งทางด้าน AI จะช่วยให้เรากรองข้อมูลข่าวสารได้รวดเร็วขึ้น และตัดสินใจได้ดีขึ้นว่าควรเลือกอ่านอะไร

ปัจจุบันการสรุปใจความสำคัญด้วย AI ยังมีข้อจำกัดอยู่มาก แต่เมื่อเรามีโมเดล AI ด้านภาษาที่ดีพอ เราจะได้เห็นเทคโนโลยีนี้ถูกนำมาใช้งานอย่างแพร่หลาย

5) Beyond Deep Learning

ผู้ที่สนใจด้าน Machine Learning ทุกคนคงรู้แล้วว่า หลายปีที่ผ่านมา โมเดลที่ถูกสร้างด้วย AI ประเภท Deep Learning ได้รับความนิยมอย่างสูงมากเนื่องจากเหมาะแก่การแก้ปัญหาที่มีข้อมูลซับซ้อนหลายประเภท เช่น Computer Vision และ Natural Language Processing

ในขณะเดียวกัน Deep Learning ยังมีข้อจำกัดอยู่หลายประการ เช่น

  • ถึงแม้ Deep Learning จะตอบคำถามได้ดูฉลาดใกล้เคียงมนุษย์ แต่กลไกข้างในไม่ได้ใช้วิธีคิดเหมือนหรือใกล้เคียงกับสมองมนุษย์เลย ผลที่ตามมาคือ เมื่อเจอกรณีที่ตอบผิด จึงยากที่จะเข้าใจว่าทำไมตอบผิด
  • พื้นฐานของ Deep Learning เป็นการเรียนรู้ฟังก์ชันที่ค่อนข้างตรงไปตรงมา โดยจะตอบคำถามได้ถูกต้องถ้าตัวอย่างใหม่แตกต่างจากตัวอย่างที่โมเดลเคยเรียนไปไม่มาก ทำให้ Deep Learning ยังไม่สามารถเรียนรู้ระดับเดียวกับมนุษย์ได้

เราจึงหวังว่าจะมีหลักการหรือวิธีใหม่ๆ ในอนาคตที่จะเอาชนะข้อจำกัดเหล่านี้และนำ AI ไปสู่ next level

6) ความรับผิดชอบต่อข้อมูล

เมื่อยุคของ AI มาถึง ข้อมูลจำนวนมากถูกนำมาใช้เพื่อพัฒนาโมเดล ปัญหาสำคัญประการหนึ่งที่ตามมาคือ ข้อมูลหลายอย่างเป็นข้อมูลส่วนบุคคล การนำมาใช้จึงเสี่ยงต่อการละเมิดความเป็นส่วนตัว หลายประเทศตระหนักถึงปัญหานี้ และออกกฎหมายเพื่อคุ้มครองข้อมูลส่วนบุคคล ตัวอย่างที่เห็นได้ชัดคือ ยุโรปออกกฏหมาย GDPR ซึ่งคุ้มครองข้อมูลส่วนบุคคลอย่างเข้มงวด ประเทศไทยเองก็มี พ.ร.บ.ข้อมูลส่วนบุคคลที่กำลังบังคับใช้กลางปีนี้

สิ่งที่จะเกิดขึ้นในอนาคตอันใกล้เมื่อเราต้องการพัฒนา AI คือ เราจะไม่ได้พูดกันแค่เรื่องว่าจะเอาข้อมูลจากแหล่งไหนมาใช้ แต่เราต้องคำนึงถึงด้วยว่าเราจะนำข้อมูลเหล่านั้นมาใช้อย่างไร ให้ถูกต้องตามกฎหมายและจรรยาบรรณ

ก้าวต่อไปของ AI ในปี 2020
Share this

Subscribe to Code on the Hill