Notifications

Clear all

iMaterialist (Fashion) 2019 —- ได้เวลาให้ AI วิเคราะห์แฟชั่น และทำความรู้จัก Segmentation Model

Page 1 / 4 Next

ชมรม Kaggle ประเทศไทย

ไปที่ข้อความล่าสุด by The Neural Engineer 6 years ago

28 ข้อความ

2 Users

11 Likes

65 K Views

RSS

The Neural Engineer

(@neural-engineer)

Honorable Member Admin

เข้าร่วมเมื่อ: 8 years ago

ข้อความ: 412

Topic starter 15/06/2019 11:55 pm

บทความหลักที่อธิบายปัญหา รวมทั้งโปรแกรมทั้งหมดฉบับสมบูรณ์ดูได้ที่นี่ครับ

https://www.kaggle.com/pednoi/image-segmentation

มีคำถามอะไรเพิ่มเติมสามารถโพสต์ถามข้างล่างได้เลยครับผม

UPDATE (2020): ในส่วนล่างของบทความเราได้พูดคุยกับคุณ cc8 และได้แนะนำ segmentation model ที่ดีมากๆ อีกโมเดลหนึ่งชื่อว่า U-Net ครับผม

This topic was modified 7 years ago 4 times by The Neural Engineer

This topic was modified 6 years ago by The Neural Engineer

อ้างอิง

The Neural Engineer

(@neural-engineer)

Honorable Member Admin

เข้าร่วมเมื่อ: 8 years ago

ข้อความ: 412

Topic starter 22/08/2019 3:10 pm

ตัวอย่างเพิ่มเติมการใช้ Mask-RCNN กับปัญหา Wheat Detection (ตรวจจับรวงข้าว) https://www.kaggle.com/ipythonx/keras-global-wheat-detection-with-mask-rcnn/

----

เพิ่มเติมเรื่อง Segmentation

Introduction to Image Segmentation by Jeremy Jordan ครับ ละเอียดดีมาก

https://www.jeremyjordan.me/semantic-segmentation/

แล้วก็ Implementation ของ loss functions ต่างๆ ใน TF/Keras

https://lars76.github.io/neural-networks/object-detection/losses-for-segmentation/

ณ เดือน 8 2019 , Kaggle นั้นมี Segmentation Competitions ถึง 4 การแข่งขันพร้อมๆ กัน อาทิเช่น

ทำ segmentation ของ จุดผิดปกติในปอดคนเราว่าป่วยอยู่หรือไม่

หาจุดที่เหล็กขึ้นสนิม

detect เมฆบนฟ้าใน 4 รูปแบบเพื่อทำความเข้าใจความเชื่อมโยงระหว่างเมฆ อุณหภูมิ และภาวะโลกร้อน

เราจะมาเซอร์เวย์การแข่งขันนี้เหล่านี้กันในอนาคตครับ

This post was modified 7 years ago by The Neural Engineer

This post was modified 6 years ago by The Neural Engineer

ตอบกลับอ้างอิง

CC8

(@cc8)

Active Member

เข้าร่วมเมื่อ: 6 years ago

ข้อความ: 11

26/02/2020 6:55 am

เนื่องด้วยผมสนใจปัญหาด้าน multiclass image segmentation คล้ายกับงานที่ทางเว็บไซต์ได้นำเสนอใน Workshop : iFashion 2019 — ได้เวลาให้ AI วิเคราะห์แฟชั่นด้วย Keras Mask-RCNN โดยผมมีคำถามเกี่ยวกับการ Prepare Dataset ของปัญหา multiclass image segmentation ซึ่งผมมีข้อมูลรูปภาพ และส่วนของ Mask แต่ไม่รู้วิธีการทำ label ที่มีส่วนของ class และ mask ดังนั้นจึงอยากให้ช่วยแนะนำวิธีการเตรียม dataset ให้เป็นไฟล์ เช่นเดียวกับไฟล์ label_description.json , ไฟล์ train.csv (ที่มีข้อมูลของ imageId, EncodedPixel, Hight, Width, class), และไฟล์ sample_submission.csv เหมือนใน workshop หรือ แนะนำวิธีการอื่น ๆ เพื่อจัดการกับข้อมูลครับ

The Neural Engineer reacted

ตอบกลับอ้างอิง

The Neural Engineer

(@neural-engineer)

Honorable Member Admin

เข้าร่วมเมื่อ: 8 years ago

ข้อความ: 412

Topic starter 29/02/2020 9:39 am

สวัสดีครับคุณ @cc8 เพื่อความเข้าใจ รบกวนเล่าเพิ่มเติม (หรือแปะรูปตัวอย่าง) ในส่วนนี้ได้ไหมครับ

แต่ไม่รู้วิธีการทำ label ที่มีส่วนของ class และ mask

และคุณ @cc8 ทำปัญหาด้านใดอยู่ และมีข้อมูลในปัจจุบันอย่างไรครับ? (เข้าใจว่ามีแต่ jpg?)

ตอบกลับอ้างอิง

CC8

(@cc8)

Active Member

เข้าร่วมเมื่อ: 6 years ago

ข้อความ: 11

29/02/2020 11:22 am

สวัสดีครับคุณ @neural-engineer ผมทำปัญหาด้าน image segmentation ปัจจุบันผมมีข้อมูล ที่เป็นภาพ DICOM file และภาพ mask (png file) ที่ได้จาการเตรียมจาก DICOM structure contour คล้ายกับที่แสดง ดังภาพ

[img] [/img]

(ซ้าย)ภาพ DICOM file ที่จะเป็น input (ขวา) ภาพแสดง DICOM structure contour ที่ใช้เตรียม mask ที่แสดงด้านล่าง

[img] [/img]

ภาพ mask ที่จะใช้ train ส่วนของ tumor

ภาพประกอบจาก https://github.com/KeremTurgutlu/dicom-contour/blob/master/tutorial.ipynb

ปัญหาของผมคือผมต้องการ prepare dataset ในส่วนของ label ที่มีอยู่สองส่วน คล้ายกับที่ทางบอร์ดได้อธิบายไว้ใน work shop ได้แก่

ส่วนของ class ที่ประกอบไปด้วย category เป็นประเภทของส่วนที่ต้องการ segmentation เช่น tumor, brain, eye …
ส่วนของ mask ที่จะบอกว่าวัตถุคลาสต่าง ๆ ประกอบได้ด้วย pixel ไหนบ้าง

ซึ่งจากที่อ่านใน work shop ในขั้นตอน 2.4 Prepare Dataset ผมเห็นข้อมูลในส่วน ไฟล์ label_desscriptions.json , ไฟล์ train.csv (ที่มีข้อมูลของ imageId, EncodedPixel, Hight, Width, class), และไฟล์ sample_submission.csv

ผมเข้าใจว่าข้อมูลในลักษณะของผมสามารถเตรียมให้เป็นของมูลแบบใน work shop ก่อนจึงจะสามารถใช้เทรนโมเดลได้ จึงอยากรบกวนให้ช่วยอธิบายการเตรียมข้อมูลในลักษณะของผมหน่อยครับว่าจะต้องเตรียมข้อมูลอย่างไร เพื่อที่จะใช้เทรนโมเดลครับ

This post was modified 6 years ago by CC8

The Neural Engineer reacted

ตอบกลับอ้างอิง

The Neural Engineer

(@neural-engineer)

Honorable Member Admin

เข้าร่วมเมื่อ: 8 years ago

ข้อความ: 412

Topic starter 01/03/2020 12:44 pm

ขอบคุณคุณ @cc8 สำหรับข้อมูลเพิ่มเติมครับ

ตามที่คุณ cc8 เล่ามาแสดงว่าใน dicom 1 รูป เราอาจจะมี contour structure หลายรูป (หลายชนิด contour) ถูกต้องไหมครับ? ในไฟล์ label_descriptions.json นี้เราสามารถพิมพ์เขียนแบบ manual ได้เลยครับ เพราะหลักๆ คือการนิยาม class (ชนิดของ contour) เข้าใจว่ามีไม่กี่ประเภท ดังนั้นเราน่าจะสามารถพิมพ์เองได้ภายในเวลาอันสั้น

ส่วนใน train.csv นั้น จะมีอยู่ 1 column ที่ต้องเขียนฟังก์ชันนั่นคือ EncodedPixels ที่ใช้วิธี rle (run-length encoding) ซึ่งเป็นการเข้ารหัส mask แบบกระชับเพื่อประหยัดพื้นที่ครับ ซึ่งกรณีที่คุณ cc8 มี mask อยู่แล้วสามารถเรียกใช้ function mask2rle ได้เลยครับ ซึ่งสามารถ copy function ตาม kernel นี้ครับ

https://www.kaggle.com/paulorzp/rle-functions-run-lenght-encode-decode

เมื่อได้ rle แล้วเพื่อความชัวร์ ลองแปลง rle ที่ได้กลับเป็น mask แล้วลอง visualize ดูอีกครั้งเพื่อ recheck ความถูกต้องครับ เช่นตัวอย่างจาก kernel นี้ก็ได้ครับ

https://www.kaggle.com/titericz/building-and-visualizing-masks

สำหรับ columns อื่นๆ ใน train.csv เช่น height/width ก็เป็นเพียงขนาดของรูป หรือ class ซึ่งก็เป็นตามประเภทของ contour ซึ่งเราสามารถกำหนดได้ตามข้อมูลที่เรามีอยู่แล้ว

This post was modified 6 years ago 2 times by The Neural Engineer

ตอบกลับอ้างอิง

The Neural Engineer

(@neural-engineer)

Honorable Member Admin

เข้าร่วมเมื่อ: 8 years ago

ข้อความ: 412

Topic starter 01/03/2020 2:37 pm

ในการวนลูปสร้าง train.csv จาก file รูปที่เรามีทั้งหมดนั้น เราอาจใช้โมดูล glob ซึ่งจะช่วยในการ browse path ทั้งหมดได้ง่ายๆ เลยครับ ซึ่งในรูป contour structure ของแต่ละรูปควรจะมีชื่อ label ของ contour นั้นๆ กำกับอยู่ เช่น ถ้ารูปปกติชื่อ pic1.dcm รูปที่แสดง contour อาจจะชื่อ pic1_label1.dcm เป็นต้น ซึ่งแสดงคร่าวๆ ดัง pseudo code นี้ครับ

import glob
paths = glob.glob(DIR_DICOM+“*.dcm”)

class_list, h_list, w_list = [],[], []
rle_list = []
for path in paths:
    if normal_picture: continue

    img = read_dcm(path)  
    height, width = img.shape
    if ‘label1’ in path:
        class = label1
    elif .... : #all labels
    
    rle = mask2rle(....)

    class_list.append(class)
    h_list.append(height)
    w_list.append(width)
    rle_list.append(rle)


train_df = pd.DataFrame({"EncodedPixels": rle_list, "label": class_list, "width": w_list, "height": h_list})
train_df.to_csv('train.csv')

This post was modified 6 years ago by The Neural Engineer

ตอบกลับอ้างอิง

Page 1 / 4 Next

3 หมวดหมู่
76 กระทู้
451 ข้อความ
8 เข้าชมอยู่
853 สมาชิก

เครื่องหมายบนหมวดหมู่: อ่านทุกข้อความในกระทู้แล้ว ยังมีข้อความในกระทู้ที่ไม่ได้อ่าน

สัญลักษณ์บนกระทุ้: ยังไม่มีใครตอบ มีผู้ตอบแล้ว มีการคุยกันเร็วๆ นี้ ร้อนแรง ปักหมุด รอตรวจสอบ แก้ปัญหาแล้ว Private Closed

iMaterialist (Fashion) 2019 —- ได้เวลาให้ AI วิเคราะห์แฟชั่น และทำความรู้จัก Segmentation Model

Super Globals

Options and Features