Keras Cheminformatics - สร้างโมเลกุลกราฟด้วย GAN
Keras มี Tutorial ใหม่ล่าสุดสำหรับ cheminformatics คือการสร้างโมเลกุลด้วยเทคนิค WGAN-GP (Wassterstien GAN with Gradient Penalty) ครับ
แรงบันดาลใจของงานในฝั่งนี้คือ งานต่างๆ ที่ต้องการทดลองบนโมเลกุลใหม่ๆ เช่นการหา ยาชนิดใหม่ (Drug Discovery) นั้นต้องมีการสร้างโมเลกุลที่มีคุณสมบัติทางเคมีที่ใกล้เคียงโมเลกุลที่เราต้องการ
อย่างไรก็ดีการหาโมเลกุลใหม่ๆ ที่ว่านั้น ด้วยเทคนิคในปัจจุบัน (เช่น Graph Matching, Node ordering heuristics) นั้นทำได้ไม่ง่าย
จากความสำเร็จของงานด้าน Deep Learning บน Graph Structure เลยเป็นที่มาที่ทำให้นักวิจัยสามารถออกแบบ GAN ที่ สร้าง molecule graph ใหม่ๆ ได้โดยตรงโดยตัดเทคนิคที่ซับซ้อนดังกล่าวออกไปเลยครับ
ผู้สนใจสามารถดู Keras Tutorial อย่างละเอียดได้ที่นี่
https://keras.io/examples/generative/wgan-graphs/
Colab
Tutorial นี้ได้รับแรงบันดาลใจจากงาน MolGAN
https://arxiv.org/pdf/1805.11973.pdf
อย่างไรก็ดีงานในกลุ่ม MolGAN นี้ยังไม่สามารถกำหนดลักษณะทางเคมีที่เราต้องการได้ชัดๆ เหมือนงาน GAN อื่นๆ เช่นกรณี FaceGAN เราสามารถกำหนดได้เลยว่าจะสร้าง หน้าบุคคลที่มีลักษณะอย่างไรบ้าง (ผู้ช่าย ผิวคล้ำ มีหนวด ใส่แว่น)
ซึ่งการสร้าง Molecule graph ใหม่ๆ ที่มีคุณสมบัติทางเคมีที่เรากำหนดเป้ะๆ ก็จะเป็นงานวิจัยล่าสุดที่คนในวงการกำลังพัฒนากันต่อไป
ถ้ามีใครสนใจร่วมทำงานนี้สามารถ เมลไปคุยกับนักวิจัยที่เบลเยี่ยม ผู้เชียน Tutorial คนนี้ได้ที่นี่ครับ
https://github.com/akensert (เป็นเพื่อนแอดมินเองครับ 😀 )
DeepMind เปิดเผยความลับ AlphaFold อย่างสมบูรณ์
ThaiKeras and Kaggle
โปรตีนคือหนึ่งในศูนย์กลางของสิ่งมีชีวิต การทำนายรูปร่าง 3 มิติของโปรตีนมีประโยชน์อย่างมหาศาลในการ ออกแบบและพัฒนายารักษาโรคต่างๆ เพราะจะทำให้เข้าใจฟังก์ชันของโปรตีนนั้นๆ
ในเดือนธันวาคม ปีที่แล้ว (2020) ทีม DeepMind ซึ่งอยู่ภายใน Google ได้สร้างปรากฏการณ์มหัศจรรย์ขึ้นในวงการชีววิทยา ด้วยการสร้างโมเดล Deep Learning ที่ชื่อว่า AlphaFold 2 ที่สามารถทำนายรูปร่าง 3 มิติของโปรตีนได้ในระดับแม่นยำสูงสุด
ซึ่งปัญหานี้เป็นปัญหาที่แก้ไขไม่ได้ในวงการชีวะมาไม่ต่ำกว่า 50 ปี และมีงานประชุมวิชาการที่ทีมวิจัยทั่วโลกมาแข่งขันทำนายรูปร่าง 3 มิตินี้ทุกปี ( https://www.predictioncenter.org/casp14/index.cgi ) ในลักษณะเดียวกับ ImageNet ของวงการ Machine Learning
โดย DeepMind เป็นหนึ่งในทีม AI ที่คนทั่วไปยอมรับว่าเก่งที่สุดในโลก ซึ่งก่อนหน้านี้สร้างโปรแกรม AlphaGo และ AlphaStar โค่นแชมป์โลกในวงการโกะ และขึ้นไปถึงระดับ Grandmaster ใน StarCraft 2
ในอดีตที่ผ่านมา ในการทำความเข้าใจรูปร่างโปรตีนจำเป็นต้องใช้เทคนิคที่ชื่อว่า X-ray crystallography หรือ cryo-electron microscopy ซึ่งกินเวลาและค่าใช้จ่ายเป็นอย่างมาก ทว่าโปรแกรม AlphaFold 2 ของ DeepMind นั้นทำนายรูปร่างได้ใกล้เคียงกับเทคนิคทั้งสองอย่างนี้เป็นอย่างมาก
ก่อนหน้านี้ DeepMind ให้สัมภาษณ์เกี่ยวกับ AlphaFold น้อยมาก และเป็นคำถามที่นักวิจัยทั่วโลกสงสัยว่า Google และ DeepMind จะเก็บความลับของ AlphaFold ไว้แต่เพียงผู้เดียวหรือไม่ (ลักษณะคล้ายกับที่ OpenAI ไม่ open GPT-3 และ DALL-E)
นั่นคือ DeepMind และ Google ต้องเลือกระหว่างรายได้ Exclusive มหาศาลถ้าจะไม่เปิดเผย หรือเลือกที่จะทำคุณงามความดีใหัโลก ด้วยการเปิดเผยโค้ดทั้งหมดให้ทุกคน (แบบเดียวกันกับที่เปิดเผยโค้ด Transformers และ Bert ซึ่งทำให้วงการ NLP ก้าวหน้าไปอย่างมาก มาก่อนหน้านี้)
ล่าสุดเมื่อวานนี้ (15 กค. 2021) ทาง DeepMind ก็ได้ประกาศข่าวดีให้ทั่วโลก นั่นคือ DeepMind ได้ตีพิมพ์เปิดเผยเทคนิค AlphaFold อย่างละเอียดใน Nature รวมทั้ง Open sourcecode ทั้งหมดบน GitHub ด้วยครับ
โดยโมดูลหลักของ AlphaFold นั้นเรียกว่า EvoFormer ซึ่งได้รับแรงบันดาลใจจาก Transformers และเทคนิค Self-Attention
สำหรับผู้สนใจสามารถอ่านงานอย่างละเอียดได้ฟรี ที่นี่
เปเปอร์ AlphaFold ตีพิมพ์ในวารสาร Nature โดย DeepMind
https://www.nature.com/articles/s41586-021-03819-2_reference.pdf
AlphaFold GitHub
https://github.com/deepmind/alphafold
อ่านเพิ่มเติม
- DeepMind’s AI for protein structure is coming to the masses - https://www.nature.com/articles/d41586-021-01968-y
- DeepMind wants to use its AI to cure neglected diseases - https://www.wired.co.uk/article/deepmind-alphafold-protein-diseases
- ‘It will change everything’: DeepMind’s AI makes gigantic leap in solving protein structures - https://www.nature.com/articles/d41586-020-03348-4
ความแม่นยำของ AlphaFold (นึกถึงกราฟของ Deep Learning กับการแข่งขัน ImageNet)
Update: AlphaFold Colab official จาก DeepMind https://colab.research.google.com/github/deepmind/alphafold/blob/main/notebooks/AlphaFold.ipynb
