สำหรับเพื่อนๆ ที่เพิ่งเริ่มต้นศึกษาศาสตร์ด้านปัญญาประดิษฐ์ AI, Machine Learning หรือ Deep Learning อาจจะมีข้อสงสัยเล็กน้อยเกี่ยวกับชื่อเหล่านี้ว่าจริงๆ แล้วสามชื่อนี้คือเรื่องเดียวกันหรือไม่ หรือแตกต่างกันอย่างไรซึ่งเราจะมาคุยกันในบทความนี้ครับ
ถ้าจะกล่าวโดยย่อที่สุดก็คือ AI นั้นเป็นชื่อที่กว้างที่สุดซึ่งหมายถึงศาสตร์แขนงใหม่ที่พยายามศึกษาและสร้างความฉลาดขึ้นมา (คำว่า “ศาสตร์” ในที่นี้มีความทำนองเดียวกันกับการเรียกในวิทยาศาสตร์ เศรษฐศาสตร์ หรือวิศวกรรมศาสตร์) และ Machine Learning ก็คือแขนงย่อยของ AI และ Deep Learning ก็เป็นแขนงย่อยของ Machine Learning อีกทีตามรูปข้างบนเลยครับ
อันที่จริงแล้วการสร้างคอมพิวเตอร์หรือหุ่นยนต์ให้ฉลาดในระดับเดียวกับมนุษย์น้ันเป็นทั้งสิ่งที่น่าตื่นเต้นและเป็น “ความฝัน” ของมนุษย์มาช้านานแล้วดังที่เราจะเห็นในนิยายวิทยาศาสตร์ชื่อดังที่เกี่ยวกับหุ่นยนต์ต่างๆ ครับ อนึ่งคำว่า Robot หรือหุ่นยนต์นั้นถูกประดิษฐ์ขึ้นมาครั้งแรกในราวปี 1920 (ราวๆ ร้อยปีพอดี) บนนิยายที่ชื่อ Rossum’s Universal Robots (R.U.R) ซึ่งแต่งโดย Karel Čapek ครับ เหล่าหุ่นยนต์ในนิยายวิทยาศาสตร์เหล่านี้สามารถพูดคุย มีอารมณ์ และวางแผนการต่างๆ ได้เช่นเดียวกับมนุษย์เลยทีเดียว
ดังนั้นเมื่อมนุษย์เราสามารถสร้างคอมพิวเตอร์ขึ้นมาได้สำเร็จในช่วงปี 1940-1950 งานวิจัยด้าน AI ก็เริ่มต้นตามมาแทบจะทันทีเลยครับโดยนักวิจัยระดับโลกหลายท่านจากหลากหลายแขนงไม่ว่าจะเป็น คณิตศาสตร์ วิทยาการคอมพิวเตอร์ วิศวกรรมคอมพิวเตอร์ และ วิทยาศาสตร์ของสมอง (NeuroScience) ทุกคนมีความฝันแบบเดียวกันว่าอยากจะเข้าใจและประดิษฐ์ “ความฉลาด” ขึ้นมาให้ได้แบบเดียวกับที่ธรรมชาติให้กำเนิดมนุษย์ขึ้นมา ช่วงเวลานี้เป็นช่วงเวลาที่น่าตื่นเต้นมากๆ ของมนุษยชาติซึ่งเราจะมาคุยกันในบทความเกี่ยวกับประวัติศาสตร์ของ AI ในโอกาสถัดไปครับ
ถึงแม้นพวกเราอาจจะเห็นในหนังฮอลลีวูดหลายเรื่องที่หุ่นยนต์นั้นมีอารมณ์หรือความรู้สึกในทำนองเดียวกันกับมนุษย์ แต่ในปัจจุบันนิยามของ “ความฉลาด” ที่เราต้องการสร้างขึ้นมานั้นจะเป็นลักษณะ “การให้เหตุผล” ที่ไม่มีอารมณ์มาเกี่ยวข้อง ในบทความนี้เราจะยึดแนวคิดของปรมาจารย์ระดับอาวุโสด้าน AI สองท่านคืออาจารย์ Stuart Russell และอาจารย์ Peter Norvig ที่ให้แง่คิดว่า “ความฉลาด” นั้นอย่างน้อยควรประกอบไปด้วยองค์ประกอบหลักๆ 4 ส่วนดังรูปครับ
องค์ประกอบทั้งสี่ส่วนของ AI ที่ทำให้ AI สามารถตอบสนองต่อโลกภายนอกได้ในทำนองเดียวกับมนุษย์นั้นสามารถเข้าใจได้ง่ายๆ ดังนี้
อย่างไรก็ดี เนื่องจากในระยะ 5 ปีที่ผ่านมา ส่วน “Learning” (ส่วนที่สองในภาพ) ได้มีการพัฒนาอย่างก้าวกระโดด ข่าวดังทั้งหลายในวงการไม่ว่าจะเป็น Alpha Go ที่ชนะนักเล่นโกะระดับแชมป์โลก หรือการที่ Google โชว์ระบบ Duplex ที่ตอบโต้กับคนในการจองร้านอาหารได้ในระดับเดียวกับมนุษย์ หรือการที่เทคโนโลยี “รถยนต์ขับเคลื่อนด้วยตัวเอง” (Self-Driving Car) กำลังจะเป็นความจริงในไม่ช้า ทั้งหมดนี้ล้วนเกิดจากความก้าวหน้าในฝั่ง Learning ทั้งสิ้น ซึ่งความก้าวหน้าทั้งหมดนี้อยู่ภายใต้พลังของ Deep Learning และทำให้คนทั่วไป หรือข่าวต่างๆ อาจจะใช้คำว่า AI หรือ Machine Learning และ Deep Learning สลับกันเสมือนเป็นเรื่องเดียวกัน
จากภาพด้านบน เราจะเห็นว่า Machine Leaning (หรือเรียกสั้นๆ ว่า ML) นั้นจริงๆ ก็คือองค์ประกอบในส่วนที่สองของ AI นั่นเอง ซึ่งเป็นส่วนที่สำคัญมากๆ เนื่องเพราะพวกเราเข้าใจกันดีอยู่แล้วตัวชี้วัดหนึ่งที่บอกว่ามษุษย์นั้นมีความฉลาดยิ่งกว่าสัตว์ประเภทอื่นๆ นั่นก็เพราะมนุษย์สามารถ “เรียนรู้” เรื่องต่างๆ ได้ในระดับสุดยอดนั่นเอง (ถ้ายังไม่เห็นภาพ ให้ลองนึกว่าทำไมปัจจุบันพวกเราต้อง “เรียน” หนังสือเป็นเวลาอย่างน้อย 20 ปีจนจบปริญญาตรี ทั้งนี้เป็นเพราะ “การเรียนรู้” เป็นส่วนประกอบที่สำคัญที่สุดส่วนนึงของสิ่งมีชีวิตที่ทรงปัญญาอย่างมนุษย์เรานั่นเอง)
ในภาพใหญ่นั้นหน้าที่ของ ML มีดังต่อไปนี้
อันที่จริงแล้วงานวิจัยด้าน Machine Learning หรือ ML นี้ก็ได้ทำกันมายาวนานหลายสิบปี และประสบความสำเร็จมากในระดับหนึ่ง ตัวอย่างที่เราคุ้นเคยกันดีก็คือ ในราวปี 1998 นั้น Google เองก็ถูกสร้างขึ้นจากปัญหาการตีความว่าผู้ใช้งานจะชอบเว็บไซต์ใดมากที่สุดจาก Keywords ที่ผู้ใช้กำหนด หรือการที่โปรแกรมอย่าง Netflix นั้นสามารถเลือกหนังที่ผู้ใช้งานแต่ละคนน่าจะชอบดูมาให้พวกเราพิจารณาอย่างอัตโนมัตินั้น ก็ล้วนเป็นความสำเร็จของ ML ทั้งสิ้น แต่ณ เวลานั้น ML ก็ยังไม่ได้รับความสนใจจากคนทั่วไปมากนัก ซึ่งทุกสิ่งทุกอย่างนั้นเปลี่ยนไปในราวๆ ปี 2012 ครับ จากการกำเนิดของ Deep Learning
ศาสตร์หรือเทคนิกด้าน “Deep Learning” (DL) นั้นแม้นจะมีการพูดถึงมาบ้างตั้งแต่สมัยแรกๆ ของการพัฒนาศาสตร์ ML แต่ยังไม่ประสบความสำเร็จจริงจัง อย่างไรก็ดีตั้งแต่ราวๆ ปี 2012 เป็นต้นมานั้นระบบต้นแบบของ DL นั้นได้ถูกพัฒนาขึ้นเกือบสมบูรณ์ และมีประสิทธิภาพดีกว่าเทคนิกอื่นๆ ของ ML อย่างมาก ทำให้ DL (รวมทั้ง AI และ ML) กลายเป็น “กระแส” ดังระดับโลกและทำให้นิยามของ AI หรือ ML ที่คนทั่วไปรู้จักแทบจะหมายถึงผลงานของ DL ล้วนๆ เลยทีเดียว
DL คืออะไรกันแน่ และปัจจัยอะไรทำให้ DL ประสบความสำเร็จอย่างสูง ??
ถ้ากล่าวอย่างรวบรัดจริงๆ แล้ว “Deep Learning” ก็คือโมเดลคณิตศาสตร์ที่พยายามจำลองหรือเลียนแบบสมองของคนเรานั่นเอง DL จึงมีชื่อเรียกอีกอย่างว่า Neural Networks ซึ่งเป็นชื่อดั้งเดิมหลายสิบปีก่อนที่จะมาเป็นชื่อ “Deep Learning” เช่นปัจจุบัน และการเขียนโปรแกรมของเราก็คือการสั่งให้คอมพิวเตอร์คำนวนสิ่งต่างๆ ตามที่ระบุไว้ในสมการของ Neural Networks นี่เอง
อย่างไรก็ดีการสร้างโมเดลหรือแบบจำลองของสมองคนเรานี้ไม่ใช่เรื่องง่าย ในอดีต สมการคณิตศาสตร์ที่ถูกสร้างขึ้นมาเมื่อนำมาเขียนบนโปรแกรมคอมพิวเตอร์แล้วยังไม่มีประสิทธิภาพเพียงพอทำให้ใช้เวลาทำงานนานมาก กว่าที่ DL หรือ Neural Networks จะประสบความสำเร็จนี้ ได้มีการแก้ไขและปรับปรุงด้านคณิตศาสตร์กันหลายครั้งโดยนักวิจัยเก่งๆ ทั่วโลกเป็นเวลาอย่างน้อย 30 ปีหรือมากกว่า ประจวบกับอีกสองปัจจัยที่เกิดขึ้นในช่วงเดียวกันพอดี
ปัจจัยแรกคือนวัตกรรมการประมวลผลแบบคู่ขนาน (Parallel Computing) ของคอมพิวเตอร์ได้ก้าวหน้าไปอย่างมากด้วยเทคโนโลยี GPU ของ Nvidia ทำให้การคำนวนที่ซับซ้อนในโมเดลคณิตศาสตร์ของ DL สามารถทำได้จริงอย่างรวดเร็วในทางปฏิบัติ และปัจจัยสุดท้ายก็คือโลกเข้าสู่ยุคเครือข่าย Internet ไร้สายอย่างสมบูรณ์ รวมทั้งนวัตกรรม SmartPhone บวกกับเทคโนโลยี 4G ทำให้ทุกคนบนโลกพกพาเครื่องคอมพิวเตอร์ขนาดจิ๋วไว้กับตัวและบันทึกข้อมูลตลอดเวลา ทำให้ปริมาณข้อมูลต่างๆ ในโลกนั้นเพิ่มขึ้นจากไม่กี่ปีก่อนอย่างมากมายมหาศาล และข้อมูลเหล่านี้นี่เองที่ DL นั้นนำมาเรียนรู้และนำมาใช้แก้ปัญหาต่างๆ ได้อย่างมีประสิทธิภาพ
บทความนี้ตั้งใจที่จะอธิบายความสัมพันธ์ ความเหมือนและความต่างของศัพท์สามคำที่ได้ยินกันบ่อยตามสื่อต่างๆ คือ AI, Machine Learning และ Deep Learning ก็หวังว่าเพื่อนๆ จะได้ความกระจ่างกันไปตามสมควรนะครับเพื่อนๆ สามารถพูดคุยและติดตามบทความล่าสุดที่อัพเดตทุก 10 วันได้ที่ facebook ของเราคร้าบผม