TextLogo-low-qualTextLogo-low-qualTextLogo-low-qualTextLogo-low-qual
    • หน้าแรกและบทความต่างๆ
      • AI ไกด์ทัวร์
      • เซ็ตอัพระบบ AI
      • งานวิจัยล่าสุดในวงการ AI
      • รีวิวแหล่งเรียนรู้ชั้นนำ
    • พูดคุยกับ Community
      • คุยกันภาษา AI
      • ชมรม Kaggle ประเทศไทย
    • คอร์ส: Deep Learning สำหรับนักปฏิบัติ (ยังไม่สมบูรณ์)
      • Workshop
    วิดิโอพื้นฐานความเข้าใจแก่นของ AI
    June 9, 2020
    Deep Learning Intuition
    กำเนิด Deep Learning : จากงานวิจัยในห้องแล็บ กลายเป็นเทคโนโลยีพลิกโลก (อัพเดต 2020)
    November 13, 2020

    AI, Machine Learning และ Deep Learning เกี่ยวข้องกันอย่างไร

    Published by The Neural Engineer at November 10, 2020
    Categories
    • AIGuideTour
    Tags
    • AI
    • Artificial Intelligence
    • Deep Learning
    • Machine Learning
    • Neural Networks
    • ปัญญาประดิษฐ์
    AI ML DL

    สำหรับเพื่อนๆ ที่เพิ่งเริ่มต้นศึกษาศาสตร์ด้านปัญญาประดิษฐ์ AI, Machine Learning หรือ Deep Learning อาจจะมีข้อสงสัยเล็กน้อยเกี่ยวกับชื่อเหล่านี้ว่าจริงๆ แล้วสามชื่อนี้คือเรื่องเดียวกันหรือไม่ หรือแตกต่างกันอย่างไรซึ่งเราจะมาคุยกันในบทความนี้ครับ

    ถ้าจะกล่าวโดยย่อที่สุดก็คือ AI นั้นเป็นชื่อที่กว้างที่สุดซึ่งหมายถึงศาสตร์แขนงใหม่ที่พยายามศึกษาและสร้างความฉลาดขึ้นมา (คำว่า “ศาสตร์” ในที่นี้มีความทำนองเดียวกันกับการเรียกในวิทยาศาสตร์ เศรษฐศาสตร์ หรือวิศวกรรมศาสตร์) และ Machine Learning ก็คือแขนงย่อยของ AI และ Deep Learning ก็เป็นแขนงย่อยของ Machine Learning อีกทีตามรูปข้างบนเลยครับ


    1. Artificial Intelligence (AI) หรือ ปัญญาประดิษฐ์

    อันที่จริงแล้วการสร้างคอมพิวเตอร์หรือหุ่นยนต์ให้ฉลาดในระดับเดียวกับมนุษย์น้ันเป็นทั้งสิ่งที่น่าตื่นเต้นและเป็น “ความฝัน” ของมนุษย์มาช้านานแล้วดังที่เราจะเห็นในนิยายวิทยาศาสตร์ชื่อดังที่เกี่ยวกับหุ่นยนต์ต่างๆ ครับ อนึ่งคำว่า Robot หรือหุ่นยนต์นั้นถูกประดิษฐ์ขึ้นมาครั้งแรกในราวปี 1920 (ราวๆ ร้อยปีพอดี) บนนิยายที่ชื่อ Rossum’s Universal Robots (R.U.R) ซึ่งแต่งโดย Karel Čapek ครับ เหล่าหุ่นยนต์ในนิยายวิทยาศาสตร์เหล่านี้สามารถพูดคุย มีอารมณ์ และวางแผนการต่างๆ ได้เช่นเดียวกับมนุษย์เลยทีเดียว

    ดังนั้นเมื่อมนุษย์เราสามารถสร้างคอมพิวเตอร์ขึ้นมาได้สำเร็จในช่วงปี 1940-1950 งานวิจัยด้าน AI ก็เริ่มต้นตามมาแทบจะทันทีเลยครับโดยนักวิจัยระดับโลกหลายท่านจากหลากหลายแขนงไม่ว่าจะเป็น คณิตศาสตร์ วิทยาการคอมพิวเตอร์ วิศวกรรมคอมพิวเตอร์ และ วิทยาศาสตร์ของสมอง (NeuroScience) ทุกคนมีความฝันแบบเดียวกันว่าอยากจะเข้าใจและประดิษฐ์ “ความฉลาด” ขึ้นมาให้ได้แบบเดียวกับที่ธรรมชาติให้กำเนิดมนุษย์ขึ้นมา ช่วงเวลานี้เป็นช่วงเวลาที่น่าตื่นเต้นมากๆ ของมนุษยชาติซึ่งเราจะมาคุยกันในบทความเกี่ยวกับประวัติศาสตร์ของ AI ในโอกาสถัดไปครับ

    ถึงแม้นพวกเราอาจจะเห็นในหนังฮอลลีวูดหลายเรื่องที่หุ่นยนต์นั้นมีอารมณ์หรือความรู้สึกในทำนองเดียวกันกับมนุษย์ แต่ในปัจจุบันนิยามของ “ความฉลาด” ที่เราต้องการสร้างขึ้นมานั้นจะเป็นลักษณะ “การให้เหตุผล” ที่ไม่มีอารมณ์มาเกี่ยวข้อง ในบทความนี้เราจะยึดแนวคิดของปรมาจารย์ระดับอาวุโสด้าน AI สองท่านคืออาจารย์ Stuart Russell และอาจารย์ Peter Norvig ที่ให้แง่คิดว่า “ความฉลาด” นั้นอย่างน้อยควรประกอบไปด้วยองค์ประกอบหลักๆ 4 ส่วนดังรูปครับ

    R.U.R

    R.U.R (1920) นิยายวิทยาศาสตร์หุ่นยนต์เรื่องแรกของโลกที่ให้กำเนิดคำว่า “Robot”

    องค์ประกอบหลักสี่ส่วนของ AI

    องค์ประกอบทั้งสี่ส่วนของ AI ที่ทำให้ AI สามารถตอบสนองต่อโลกภายนอกได้ในทำนองเดียวกับมนุษย์นั้นสามารถเข้าใจได้ง่ายๆ ดังนี้

    1. Sensor หรือ ส่วนรับข้อมูล การที่ AI หรือหุ่นยนต์จะตอบสนองต่อโลกภายนอกได้ ก่อนอื่นต้องสามารถรับข้อมูลจากโลกภายนอกได้ก่อน มนุษย์เรารับรู้แสง เสียง กลิ่น รสชาติ และการสั่นสะเทือนผ่านดวงตา หู จมูก ปาก และการสัมผัสทางร่างกาย ส่วนหุ่นยนต์เองก็สามารถรับข้อมูลต่างๆ เหล่านี้ได้เช่นเดียวกับมนุษย์โดยผ่าน Sensor แต่ละประเภทนั่นเอง เช่น ภาพจากกล้องหรือวิดิโอทำให้หุ่นยนต์รับข้อมูลภาพได้เช่นเดียวกับดวงตามนุษย์
    2. Learning หรือ ส่วนเรียนรู้และตีความข้อมูล เมื่อได้รับข้อมูล เช่น ภาพหรือเสียงจากโลกภายนอกแล้วก็จำเป็นต้องตีความว่า ภาพหรือเสียงนั้นคืออะไรและมีความหมายอย่างไรกันแน่ เช่น เป็นภาพและเสียงของคนที่กำลังพยายามพูดจาสื่อสารกับเรา (ซึ่งก็คือหุ่นยนต์หรือ AI) อยู่หรือไม่ จริงๆ แล้วสาขา Machine Learning (รวมทั้ง Deep Learning) นั้นก็คือแขนงความรู้ในส่วนนี้นั่นเอง
    3. Memory & Knowledge Base หรือ ส่วนฐานข้อมูลและหน่วยความจำ เช่นเดียวกับมนุษย์ที่มีสามารถจดจำข้อมูล ความรู้ต่างๆ ที่ผ่านมาในอดีตไว้ในสมอง คอมพิวเตอร์เองก็จำเป็นต้องมีส่วน Knowledge Base นี้ไว้เพื่อจดจำความรู้ต่างๆ ที่ได้เรียนรู้ในเวลาที่ผ่านมาเพื่อนำไปช่วยในการตีความในส่วน Learning หรือใช้ในการตัดสินใจแก้ปัญหาต่างๆ ในส่วน Planning & Decision Making
    4. Planning & Decision Making หรือ ส่วนวางแผนและตอบสนองไปยังโลกภายนอก เมื่อเข้าใจความหมายของข้อมูลจากโลกภายนอกเช่นภาพและเสียงโดยสมบูรณ์แล้ว (เช่น รับรู้ได้ว่ามีคนกำลังถามเส้นทางไปโรงพยาบาล) AI ก็จำเป็นต้องคิดว่าจะตอบสนองเช่นไรดี (เช่น คำนวนและสืบค้นหาโรงพยาบาลที่ใกล้ที่สุดจากฐานความรู้ และกลั่นเส้นทางนั้นออกมาเป็นคำพูดสื่อสารกลับไปยังผู้ถาม)

    อย่างไรก็ดี เนื่องจากในระยะ 5 ปีที่ผ่านมา ส่วน “Learning” (ส่วนที่สองในภาพ) ได้มีการพัฒนาอย่างก้าวกระโดด ข่าวดังทั้งหลายในวงการไม่ว่าจะเป็น Alpha Go ที่ชนะนักเล่นโกะระดับแชมป์โลก หรือการที่ Google โชว์ระบบ Duplex ที่ตอบโต้กับคนในการจองร้านอาหารได้ในระดับเดียวกับมนุษย์ หรือการที่เทคโนโลยี “รถยนต์ขับเคลื่อนด้วยตัวเอง” (Self-Driving Car) กำลังจะเป็นความจริงในไม่ช้า ทั้งหมดนี้ล้วนเกิดจากความก้าวหน้าในฝั่ง Learning ทั้งสิ้น ซึ่งความก้าวหน้าทั้งหมดนี้อยู่ภายใต้พลังของ Deep Learning และทำให้คนทั่วไป หรือข่าวต่างๆ อาจจะใช้คำว่า AI หรือ Machine Learning และ Deep Learning สลับกันเสมือนเป็นเรื่องเดียวกัน


    2. Machine Learning

    จากภาพด้านบน เราจะเห็นว่า Machine Leaning (หรือเรียกสั้นๆ ว่า ML) นั้นจริงๆ ก็คือองค์ประกอบในส่วนที่สองของ AI นั่นเอง ซึ่งเป็นส่วนที่สำคัญมากๆ เนื่องเพราะพวกเราเข้าใจกันดีอยู่แล้วตัวชี้วัดหนึ่งที่บอกว่ามษุษย์นั้นมีความฉลาดยิ่งกว่าสัตว์ประเภทอื่นๆ นั่นก็เพราะมนุษย์สามารถ “เรียนรู้” เรื่องต่างๆ ได้ในระดับสุดยอดนั่นเอง (ถ้ายังไม่เห็นภาพ ให้ลองนึกว่าทำไมปัจจุบันพวกเราต้อง “เรียน” หนังสือเป็นเวลาอย่างน้อย 20 ปีจนจบปริญญาตรี ทั้งนี้เป็นเพราะ “การเรียนรู้” เป็นส่วนประกอบที่สำคัญที่สุดส่วนนึงของสิ่งมีชีวิตที่ทรงปัญญาอย่างมนุษย์เรานั่นเอง)

    ในภาพใหญ่นั้นหน้าที่ของ ML มีดังต่อไปนี้

    • เรียนรู้สร้างความเข้าใจในสิ่งที่ไม่รู้จัก เมื่อ AI รับข้อมูลจากโลกภายนอกและไม่สามารถตีความได้ด้วยความรู้ที่มีอยู่ ยกตัวอย่างเช่นถูกสั่งให้เล่นหมากรุก ทั้งๆ ที่ไม่เคยเล่นมาก่อน ในสถานการณ์แบบนี้ AI จำเป็นต้องเรียนรู้ concepts ต่างๆ ใหม่ทั้งหมด ซึ่งการเรียนรู้ประเภทนี้ค่อนข้างยาก และปัญหาที่พวกเราเจอส่วนใหญ่จะสามารถเปลี่ยนเป็นปัญหาที่ง่ายกว่านี้ได้ (ปัญหาการ “ตีความ” ด้านล่าง) เทคนิกหนึ่งที่ใช้เรียนรู้แก้ปัญหานี้ในบางมุมเรียกว่า Reinforcement Learning ซึ่งทีมงาน ThAIKeras จะเล่าเรื่องนี้ในบทความ Series ของ Reinforcement Learning ในภายหลังครับผม
    • ตีความหมายของข้อมูลที่ได้รับจากโลกภายนอก ในการใช้งานจริงทั่วไปของ ML เรามักหมายถึงงานประเภทนี้ ซึ่งก็คือการ “ตีความว่าข้อมูลจากโลกภายนอก” คืออะไร โดยที่เรามีความเข้าใจเกี่ยวกับโลกภายนอกอยู่แล้ว อาทิเช่น
      • ตีความว่า “รูป” ที่เห็นคือรูปของอะไร ดังแสดงในภาพข้างล่างที่ ML สามารถบอกได้ว่าเค้าเห็นอะไรในชายหาดบ้าง ด้วยความมั่นใจเท่าไร (เพื่อนๆ ลองลากรูปไปทางด้านซ้ายหรือขวาดูครับ : Credit รูปจาก Google Opensource) โดยในงานนี้ ML จะถูกสอนมาก่อนแล้วว่าสิ่งต่างๆ ในโลกภายนอกที่เราสนใจมีอะไรบ้าง เช่นในตัวอย่างนี้คือ คน และ ว่าว การทำ self-driving car ก็ใช้การตีความแบบนี้ในการตรวจสอบคนเดินถนนและรถคันอื่นๆ แบบ Real-time ครับ
      • ตีความว่า “เสียง” ที่ได้ยินว่าเป็นประโยคภาษาอะไร และแปลว่าอะไร ผู้พูดต้องการจะสื่ออะไร ในงานนี้ก็เช่นกัน ML จะถูกสอนเรื่องคำศัพท์ต่างๆ ในแต่ละภาษาและตัวอย่างการอ่านออกเสียงมาก่อนแล้ว ทำให้สามารถตีความ “เสียงอื่นๆ” จากโลกภายนอกได้
      • ตีความหลายขั้นตอน เช่น “การอ่านและทำความเข้าใจเอกสาร” นั้น ML ต้องตีความว่าแต่ละรูปที่เห็นประกอบไปด้วยตัวอักษรอะไรบ้าง และตัวอักษรเหล่านั้นประกอบกันเป็นคำอะไรบ้าง และแต่ละคำมาเรียงกันเป็นประโยคนั้นมีความหมายว่าอย่างไรบ้าง และท้ายที่สุดเมื่อนำหลายๆ ประโยคในเอกสารนั้นมาเรียงต่อกัน เอกสารนี้ต้องการสื่อสารอะไรกันแน่
      • ปัญหาอื่นๆ ทั่วๆ ไปที่เห็นตามข่าวต่างๆ เช่น การ “ทำนายโรคจากข้อมูลคนไข้” หรือ การ “ทำนายว่าโฆษณาแบบไหนที่ทาง Facebook หรือ Youtube ควรแสดงให้ผู้ชมแต่ละคนดู” ล้วนเป็นปัญหาการตีความนี้ทั้งสิ้นคือ ML จะถูกสอนมาก่อนว่าการตีความนั้นเป็นไปได้ทั้งหมดกี่แบบ และตัวอย่างข้อมูลจากโลกภายนอกเป็นอย่างไร (เช่นข้อมูลคนไข้หรือข้อมูลผู้ชมโฆษณา ประกอบไปด้วยอะไรบ้าง)
      ปัญหาการตีความ หรือ Traditional ML นี้สามารถดูรายละเอียดเพิ่มเติมได้ในคอร์ส Deep Learning สำหรับนักปฏิบัติครับ ครับ
    object detection afterobject detection before

    อันที่จริงแล้วงานวิจัยด้าน Machine Learning หรือ ML นี้ก็ได้ทำกันมายาวนานหลายสิบปี และประสบความสำเร็จมากในระดับหนึ่ง ตัวอย่างที่เราคุ้นเคยกันดีก็คือ ในราวปี 1998 นั้น Google เองก็ถูกสร้างขึ้นจากปัญหาการตีความว่าผู้ใช้งานจะชอบเว็บไซต์ใดมากที่สุดจาก Keywords ที่ผู้ใช้กำหนด หรือการที่โปรแกรมอย่าง Netflix นั้นสามารถเลือกหนังที่ผู้ใช้งานแต่ละคนน่าจะชอบดูมาให้พวกเราพิจารณาอย่างอัตโนมัตินั้น ก็ล้วนเป็นความสำเร็จของ ML ทั้งสิ้น แต่ณ เวลานั้น ML ก็ยังไม่ได้รับความสนใจจากคนทั่วไปมากนัก ซึ่งทุกสิ่งทุกอย่างนั้นเปลี่ยนไปในราวๆ ปี 2012 ครับ จากการกำเนิดของ Deep Learning


    3. Deep Learning

    ศาสตร์หรือเทคนิกด้าน “Deep Learning” (DL) นั้นแม้นจะมีการพูดถึงมาบ้างตั้งแต่สมัยแรกๆ ของการพัฒนาศาสตร์ ML แต่ยังไม่ประสบความสำเร็จจริงจัง อย่างไรก็ดีตั้งแต่ราวๆ ปี 2012 เป็นต้นมานั้นระบบต้นแบบของ DL นั้นได้ถูกพัฒนาขึ้นเกือบสมบูรณ์ และมีประสิทธิภาพดีกว่าเทคนิกอื่นๆ ของ ML อย่างมาก ทำให้ DL (รวมทั้ง AI และ ML) กลายเป็น “กระแส” ดังระดับโลกและทำให้นิยามของ AI หรือ ML ที่คนทั่วไปรู้จักแทบจะหมายถึงผลงานของ DL ล้วนๆ เลยทีเดียว

    DL คืออะไรกันแน่ และปัจจัยอะไรทำให้ DL ประสบความสำเร็จอย่างสูง ??

    Deep Learning at Google

    Presentation ของ Jeff Dean จาก Google Brain ที่เล่าให้พวกเราฟังว่านับแต่ปี 2012 ที่ Google เริ่มนำ DL มาใช้ครั้งแรกนั้น ต่อมาการใช้งาน DL ก็เพิ่มขึ้นเป็นจรวด จนปัจจุบันทุก AI Algorithms บน Applications ที่สำคัญของ Google แทบจะเป็น DL ทั้งหมด

    ถ้ากล่าวอย่างรวบรัดจริงๆ แล้ว “Deep Learning” ก็คือโมเดลคณิตศาสตร์ที่พยายามจำลองหรือเลียนแบบสมองของคนเรานั่นเอง DL จึงมีชื่อเรียกอีกอย่างว่า Neural Networks ซึ่งเป็นชื่อดั้งเดิมหลายสิบปีก่อนที่จะมาเป็นชื่อ “Deep Learning” เช่นปัจจุบัน และการเขียนโปรแกรมของเราก็คือการสั่งให้คอมพิวเตอร์คำนวนสิ่งต่างๆ ตามที่ระบุไว้ในสมการของ Neural Networks นี่เอง

    อย่างไรก็ดีการสร้างโมเดลหรือแบบจำลองของสมองคนเรานี้ไม่ใช่เรื่องง่าย ในอดีต สมการคณิตศาสตร์ที่ถูกสร้างขึ้นมาเมื่อนำมาเขียนบนโปรแกรมคอมพิวเตอร์แล้วยังไม่มีประสิทธิภาพเพียงพอทำให้ใช้เวลาทำงานนานมาก กว่าที่ DL หรือ Neural Networks จะประสบความสำเร็จนี้ ได้มีการแก้ไขและปรับปรุงด้านคณิตศาสตร์กันหลายครั้งโดยนักวิจัยเก่งๆ ทั่วโลกเป็นเวลาอย่างน้อย 30 ปีหรือมากกว่า ประจวบกับอีกสองปัจจัยที่เกิดขึ้นในช่วงเดียวกันพอดี

    ปัจจัยแรกคือนวัตกรรมการประมวลผลแบบคู่ขนาน (Parallel Computing) ของคอมพิวเตอร์ได้ก้าวหน้าไปอย่างมากด้วยเทคโนโลยี GPU ของ Nvidia ทำให้การคำนวนที่ซับซ้อนในโมเดลคณิตศาสตร์ของ DL สามารถทำได้จริงอย่างรวดเร็วในทางปฏิบัติ และปัจจัยสุดท้ายก็คือโลกเข้าสู่ยุคเครือข่าย Internet ไร้สายอย่างสมบูรณ์ รวมทั้งนวัตกรรม SmartPhone บวกกับเทคโนโลยี 4G ทำให้ทุกคนบนโลกพกพาเครื่องคอมพิวเตอร์ขนาดจิ๋วไว้กับตัวและบันทึกข้อมูลตลอดเวลา ทำให้ปริมาณข้อมูลต่างๆ ในโลกนั้นเพิ่มขึ้นจากไม่กี่ปีก่อนอย่างมากมายมหาศาล และข้อมูลเหล่านี้นี่เองที่ DL นั้นนำมาเรียนรู้และนำมาใช้แก้ปัญหาต่างๆ ได้อย่างมีประสิทธิภาพ

    Big Data

    รูปนี้แสดงการเพิ่มของข้อมูลจำนวนมหาศาลในยุค Internet นี้ (ภาพได้รับอนุญาตจาก Flickr.com CC-By-2.0)


    สรุป

    บทความนี้ตั้งใจที่จะอธิบายความสัมพันธ์ ความเหมือนและความต่างของศัพท์สามคำที่ได้ยินกันบ่อยตามสื่อต่างๆ คือ AI, Machine Learning และ Deep Learning ก็หวังว่าเพื่อนๆ จะได้ความกระจ่างกันไปตามสมควรนะครับเพื่อนๆ สามารถพูดคุยและติดตามบทความล่าสุดที่อัพเดตทุก 10 วันได้ที่ facebook ของเราคร้าบผม


    The Neural Engineer
    The Neural Engineer
    คุณพ่อลูกหนึ่งที่หลงใหลในสถาปัตยกรรมนิวรอนและงานด้าน Machine Understanding — ติดตามบทความล่าสุดและพูดคุยกันได้ที่ https://www.facebook.com/thaikeras คร้าบ

    Related posts

    Deep Learning Intuition
    November 13, 2020

    กำเนิด Deep Learning : จากงานวิจัยในห้องแล็บ กลายเป็นเทคโนโลยีพลิกโลก (อัพเดต 2020)


    Read more
    March 8, 2019

    เชิญชวนเพื่อนๆ ที่สนใจ Kaggle มารวมกลุ่นกันครับ!


    Read more
    February 6, 2019

    Workshop : ทำโปรเจกต์ Data Science จากข้อมูลผู้รอดชีวิตในเรือไททานิกบน Kaggle


    Read more
    © 2018 ThAIKeras.com All Rights Reserved.