ได้เวลาร่วมทำโปรเจกต์ Deep Learning บนโจทย์ Climate Change Modeling
สวัสดีครับ สำหรับเพื่อนๆ ที่มีความฝันอยากมีส่วนร่วมทำโปรเจกต์ Deep Learning หรือ Data Science บนโจทย์ที่มีนัยสำคัญระดับโลก หนึ่งในโจทย์ใหญ่ที่คนทั่วโลกให้ความสนใจก็คือ “ภาวะโลกร้อน”ที่ส่งผลต่อสิ่งมีชีวิตทุกอย่างบนโลก
วันนี้ Max Plank Institute และ Kaggle ได้ประกาศโปรเจกต์ใหม่ “การทำนายประเภทของก้อนเมฆผ่านภาพถ่ายดาวเทียม” (Understanding Clouds from Satellite Images) ที่เปิดโอกาสให้นักวิทยาศาสตร์และนักวิจัยทั่วโลก (รวมทั้งพวกเรา) มีส่วนร่วมและเรียนรู้ไปด้วยกันได้ที่นี่ครับ : https://www.kaggle.com/c/understanding_cloud_organization
โปรเจกต์นี้คืออะไรและเกี่ยวข้องกับโจทย์ภาวะโลกร้อนอย่างไร?
โจทย์นี้เริ่มมาจากในปี 2017 ผู้เชี่ยวชาญเรื่องเมฆและสภาพอากาศ 12 คนจาก Max-Plank-Institute for Meteorology ที่ฮัมบูร์ก และ Laboratoire de Météorologie Dynamique ในปารีส ได้ถกกันเกี่ยวกับประเภท บทบาท และการเปลี่ยนแปลงของ “shallow clouds” บนมหาสมุทร
Shallow clouds ที่เรียบง่ายเหล่านี้ (ดูรูปประกอบ) มีบทบาทที่สำคัญมากๆ เกี่ยวกับสภาพอากาศของโลกเรา เนื่องจาก shallow clouds จะสะท้อนแสงอาทิตย์กลับออกไปจำนวนมาก และมีส่วนร่วมกับปรากฏการณ์เรือนกระจกเพียงเล็กน้อย shallow clouds จึงเป็นส่วนสำคัยที่ทำให้โลกอากาศเย็นขึ้น (cooling the planet)
นักวิจัยทั้งหมดเห็นตรงกันว่าถ้าเราสามารถ “สร้างโมเดลที่อธิบายการเปลี่ยนแปลงของ Shallow Clouds” ได้เราจะมีโมเดลที่อธิบายสภาวะอากาศต่างๆ บนโลกได้ดีขึ้นเป็นอย่างมาก
อย่างไรก็ดีมีการศึกษาเรื่อง Shallow Clouds น้อยมาก อาจเรียกได้ว่าเราไม่รู้อะไรเกี่ยวกับมันเลย ก่อนอื่นนักวิจัยทั้ง 12 จึงได้ช่วยกันแบ่งประเภท Shallow Clouds ออกเป็น 4 ประเภทเรียกว่า Sugar (น้ำตาล), Flower (ดอกไม้), Fish (ปลา) และ Gravel (กรวด) ตามลักษณะรูปร่างของมัน และพบว่าการกระจายตัวของ Shallow Clouds ท้ั้ง 4 ประเภทนี้ต่างกันออกไปในพื้นที่ต่างๆ ของโลก
นักวิจัยเห็นตรงกันว่าถ้าเราสามารถติดตามการเปลี่ยนแปลงของเมฆแต่ละประเภทนี้ได้ในแต่ละช่วงเวลา (เช่น detect อัตโนมัติจากภาพถ่ายดาวเทียม) สิ่งนี้จะเป็นก้าวสำคัญในการทำโมเดลของ Shallow Clouds เหล่านี้และจะเป็นหนึ่งในกลไกสำคัญ (โมเดลย่อย) ของโมเดลการทำนายสภาพอากาศของโลก
ในปี 2018 จึงได้มีการระดมนักวิจัย 70 คนจากทั้งมหาวิทยาลัยที่ปารีสและฮัมบูร์กจัดทำ Workshop เพื่อแยกประเภทก้อนเมฆเหล่านี้ ซึ่งทั้ง 70 คนช่วยกันแยกประเภททั้งวัน (รวมแรงงานคนทั้งหมด 250 ชม.) สามารถทำสำเร็จไปได้เพียง 30,000 รูปเท่านั้น ซึ่งเป็นเสี้ยวเดียวของภาพถ่ายดาวเทียมที่เก็บมาจากทั่วโลก (และจะมีอีกมากในอนาคตที่เราต้องทำนาย)
การจะสเกลแรงงานผู้เชี่ยวชาญจาก 30,000 รูปไปเป็น 3 ล้านรูปนั้นทำไม่ได้ในทางปฏิบัติ แต่ภาพถ่ายทั้ง 30,000 รูปนี้เป็นจุดเริ่มต้นที่ดีสำหรับการสร้าง “โมเดล Deep Learning“ เพื่อเรียนรู้และแยกประเภทภาพถ่ายอื่นๆ แบบอัตโนมัติอีกหลายล้านรูปในอนาคต
เพื่อการนี้ทาง Max-Plank และ Kaggle จึงได้ร่วมมือจัดการแข่งขันนี้ขึ้นเพื่อให้ Data/Machine Learning Scientists จากทุกมุมในโลกมาร่วมและแข่งขันเพื่อสร้างโมเดลที่ดีที่สุดที่จะทำนาย “ตำแหน่ง” และ “ประเภท” ของเมฆทั้ง 4 แบบได้อย่างอัตโนมัติครับ
ในทาง Machine Learning ปัญหาประเภทนี้เรียกว่า “Image Segmentation” และใน ThaiKeras เราก็เคยได้สอนทำ Workshop ที่คล้ายๆ กันในงานด้านแฟชั่นซึ่งเพื่อนๆ สามารถย้อนดูและพูดคุยได้ที่นี่ครับ : https://www.kaggle.com/pednoi/image-segmentation
สุดท้ายนี้เพื่อนๆ ที่สนใจมีส่วนร่วม สามารถเข้าร่วมการแข่งขันเพื่อสร้างโมเดลได้ที่นี่ทันทีครับ https://www.kaggle.com/c/understanding_cloud_organization การแข่งขันเพิ่งเริ่มในไม่กี่วันที่ผ่านมาและจะสิ้นสุดในวันที่ 14 พฤศจิกายน 2562 อนึ่งการประสบความสำเร็จในการแข่งขันนี้ (หรือความร่วมมือในการสร้างโมเดล) ร่วมกันนี้จะเป็นก้าวสำคัญของ “การทำนายสภาพอากาศ” ที่แม่นยำขึ้น รวมทั้งทำให้เข้าใจปรากฏการณ์ต่างๆ บนโลกได้ดีขึ้นอย่างมากครับ
เพื่อนๆ ที่รู้จักนักอุตุนิยมวิทยาที่สนใจประยุกต์เข้ากับงาน AI หรือ Data Science รบกวนช่วยกดแชร์บทความนี้เพื่อให้นักวิจัยไทยเรามีส่วนร่วมกับงาน Frontier เหล่านี้มากขึ้นในอนาคตครับ
————————————————————
หมายเหตุ ผู้เขียนไม่ได้เป็นผู้เชี่ยวชาญด้านอุตุนิยมวิทยา ถ้าใช้ศัพท์ที่ผิดหรือไม่เหมาะสมต้องขออภัยผู้อ่านล่วงหน้าครับ
อ้างอิง: 1) บทความแนะนำการแข่งขันของ Stephan Rasp นักวิจัยของมหาวิทยาลัยมิวนิกหนึ่งในผู้จัดการแข่งขัน https://raspstephan.github.io/blog/sugar-flower-fish-gravel-kaggle/ 2) บทความวิจัยของโปรเจกต์นี้อย่างละเอียด : https://arxiv.org/abs/1906.01906 3) เพื่อนๆ สามารถทดลองช่วยแยกประเภทเมฆด้วยตนเองได้ที่นี่ https://www.zooniverse.org/projects/raspstephan/sugar-flower-fish-or-gravel
เปเปอร์อธิบายเรื่อง shapes ทั้ง 4 รวมทั้งสถิติที่เกี่ยวข้องอย่างละเอียดครับ
https://rmets.onlinelibrary.wiley.com/doi/pdf/10.1002/qj.3662
Keras Notebook ที่พร้อมให้เพื่อนได้ลองใช้ และทดลองทำด้วยตัวเองได้ทันทีครับ
https://www.kaggle.com/dimitreoliveira/cloud-segmentation-with-utility-scripts-and-keras