การเตรียมตัวเพื่อสัมภาษณ์งานด้าน Machine Learning หรือ Data Science  

  RSS
The Neural Engineer
(@neural-engineer)
Boltzmann Machine

คู่มือเตรียมตัวสัมภาษณ์งาน Data Science/Machine Learning!

 

สวัสดีครับ Chip Huyen ได้เผยแพร่บทความสั้นๆ ที่น่าสนใจมากๆ สำหรับผู้ที่เตรียมตัวสัมภาษณ์งานด้าน Machine Learning และ Data Science โดย Chip ได้ชี้เป้าประเด็นของผู้สมัครงานหน้าใหม่ ที่มักมาจากฝั่ง Academic ให้เข้าใจความแตกต่างในงาน Business Use Cases ว่าการทำงานจริงไม่ได้เน้นเรื่องสร้างโมเดล (ซึ่งเป็นบทเรียนหลักที่เราเจอใน text book) แต่ต้องทำความเข้าใจภาพรวม 4 ด้านดังนี้ครับ

 

  1. Project Setup — ทำความเข้าใจ เป้าหมาย เงื่อนไขและข้อจำกัดต่างๆ การวัดผล และ ‘personalization’ เป็นต้น
  2. Data Pipeline — ทำความเข้าใจการออกแบบ input/output’ ’การเก็บข้อมูล ’storage’ ’การทำ preprocessing’ และ ประเด็นอ่อนไหวต่างๆ เช่น ความปลอดภัยของข้อมูล
  3. Modeling ทำความเข้าใจ การพัฒนาโมเดลจากง่ายไปยากทีละขั้น การนำเสนอผลลัพธ์ที่เข้าใจง่าย การคิด baseline’ ’การ debug’ ’การจัดการข้อมูลขนาดใหญ่ที่จัดเก็บใน memoryไม่เพียงพอ
  4. Serving / Deploying — ทำความเข้าใจ ข้อจำกัดของ machine ที่ใช้งานจริง จำนวนผู้ใช้งานในแต่ละช่วงเวลาความเร็วในการตอบสนองผู้ใช้งาน ความเป็นไปได้ที่โมเดลจะถูกนำไปใช้ในทางที่ผิด เป็นต้น

 

นอกจากนี้ Chip ยังได้ทิ้งท้ายด้วย Case Studies จากบริษัทชั้นนำไม่ว่าจะเป็น AirBNB, Uber, Booking.com และ 27คำถามตัวอย่างที่จะเป็นการทดสอบทักษะด้าน Data Science ของผู้สัมภาษณ์ได้เป็นอย่างดี อาทิเช่น

 

(สังเกตว่าแต่ละคำถามนั้นจงให้มีลักษณะสั้นและกำกวม ซึ่งเป็นสิ่งที่จะเจอในตอนสัมภาษณ์แน่นอนครับ การตีกรอบโจทย์ให้เคลียร์ด้วยตนเอง เป็นทักษะที่สำคัญมากทักษะหนึ่งในการทำงานจริง)

 

  • สมมติว่าเราทำงานที่ DuoLingo ที่เป็น Applications สอนภาษาต่างประเทศชื่อดัง โดย DuoLingo จะ recommend นิทานหรือเรื่องเล่าต่างๆ ที่ค่อยๆ ยากขึ้นเรื่อยๆ ตามระดับของผู้เรียน —- ถ้าเราเป็นผู้เขียน App เราจะมีวิธีวัดความซับซ้อนของนิทานหรือเรื่องเล่าต่างๆ อย่างไร จะเรียงจากง่ายไปยากได้อย่างไร  และเราสามารถออกแบบโปรแกรมที่ทำเนื้อเรื่องให้ยากขึ้น หรือง่ายลงได้ไหม?
  • สมมติเราทำงานที่ Twitter เราควรจะแนะนำผู้ใช้งานแต่ละคนว่าควร Follows ผู้ใช้คนไหน หรือตาม #hashtags trend อย่างไรบ้าง โดยเฉพาะผู้ใช้งานใหม่
  • ถ้าเราทำงานที่ Netflix และผู้ใช้งานหยุดดู series เรื่องหนึ่งไป เราจะทำนายได้ถูกต้องได้อย่างไรว่า ผู้ใช้งานคนนั้นหยุดดูเพราะเบื่อ หรือว่าหยุดดูชั่วคราวเพราะติดภารกิจอื่นๆ 

 

น่าสนใจใช่ไหมครับ เพื่อนๆ สามารถดาวน์โหลด pdf ได้ที่นี่เลยคร้าบ

https://github.com/chiphuyen/machine-learning-systems-design/blob/master/build/build1/consolidated.pdf

อ้างอิง
Posted : 01/12/2019 12:00 am
Share:

Please Login or Register