|
4 weeks ago | |
---|---|---|
.. | ||
README.md | 4 weeks ago | |
assignment.md | 4 weeks ago |
README.md
Melatih Pengesan Stok
Sketchnote oleh Nitya Narasimhan. Klik imej untuk versi yang lebih besar.
Video ini memberikan gambaran keseluruhan tentang Pengesanan Objek menggunakan perkhidmatan Azure Custom Vision, yang akan dibincangkan dalam pelajaran ini.
🎥 Klik imej di atas untuk menonton video
Kuiz Pra-Kuliah
Pengenalan
Dalam projek sebelumnya, anda telah menggunakan AI untuk melatih pengklasifikasi imej - model yang boleh mengenal pasti sama ada imej mengandungi sesuatu, seperti buah masak atau tidak masak. Satu lagi jenis model AI yang boleh digunakan dengan imej ialah pengesanan objek. Model-model ini tidak mengklasifikasikan imej berdasarkan tag, sebaliknya mereka dilatih untuk mengenal pasti objek dan boleh mencarinya dalam imej, bukan sahaja mengesan bahawa imej itu wujud, tetapi juga di mana ia berada dalam imej. Ini membolehkan anda mengira objek dalam imej.
Dalam pelajaran ini, anda akan mempelajari tentang pengesanan objek, termasuk bagaimana ia boleh digunakan dalam runcit. Anda juga akan belajar cara melatih pengesan objek di awan.
Dalam pelajaran ini, kita akan membincangkan:
- Pengesanan objek
- Menggunakan pengesanan objek dalam runcit
- Melatih pengesan objek
- Menguji pengesan objek anda
- Melatih semula pengesan objek anda
Pengesanan Objek
Pengesanan objek melibatkan pengesanan objek dalam imej menggunakan AI. Tidak seperti pengklasifikasi imej yang anda latih dalam projek terakhir, pengesanan objek bukan tentang meramalkan tag terbaik untuk keseluruhan imej, tetapi untuk mencari satu atau lebih objek dalam imej.
Pengesanan Objek vs Pengklasifikasian Imej
Pengklasifikasian imej adalah tentang mengklasifikasikan keseluruhan imej - apakah kebarangkalian bahawa keseluruhan imej sepadan dengan setiap tag. Anda akan menerima kebarangkalian untuk setiap tag yang digunakan untuk melatih model.
Dalam contoh di atas, dua imej diklasifikasikan menggunakan model yang dilatih untuk mengklasifikasikan bekas kacang gajus atau tin pes tomato. Imej pertama ialah bekas kacang gajus, dan mempunyai dua hasil daripada pengklasifikasi imej:
Tag | Kebarangkalian |
---|---|
kacang gajus |
98.4% |
pes tomato |
1.6% |
Imej kedua ialah tin pes tomato, dan hasilnya adalah:
Tag | Kebarangkalian |
---|---|
kacang gajus |
0.7% |
pes tomato |
99.3% |
Anda boleh menggunakan nilai-nilai ini dengan peratusan ambang untuk meramalkan apa yang ada dalam imej. Tetapi bagaimana jika imej mengandungi beberapa tin pes tomato, atau kedua-dua kacang gajus dan pes tomato? Hasilnya mungkin tidak memberikan apa yang anda inginkan. Di sinilah pengesanan objek memainkan peranan.
Pengesanan objek melibatkan melatih model untuk mengenal pasti objek. Daripada memberikan imej yang mengandungi objek dan memberitahunya bahawa setiap imej adalah satu tag atau yang lain, anda menonjolkan bahagian imej yang mengandungi objek tertentu, dan menandainya. Anda boleh menandai satu objek dalam imej atau beberapa objek. Dengan cara ini, model belajar bagaimana rupa objek itu sendiri, bukan hanya bagaimana rupa imej yang mengandungi objek tersebut.
Apabila anda menggunakannya untuk meramalkan imej, bukannya menerima senarai tag dan peratusan, anda akan menerima senarai objek yang dikesan, dengan kotak sempadan dan kebarangkalian bahawa objek tersebut sepadan dengan tag yang diberikan.
🎓 Kotak sempadan ialah kotak di sekitar objek.
Imej di atas mengandungi kedua-dua bekas kacang gajus dan tiga tin pes tomato. Pengesan objek mengesan kacang gajus, mengembalikan kotak sempadan yang mengandungi kacang gajus dengan kebarangkalian bahawa kotak sempadan mengandungi objek tersebut, dalam kes ini 97.6%. Pengesan objek juga telah mengesan tiga tin pes tomato, dan menyediakan tiga kotak sempadan yang berasingan, satu untuk setiap tin yang dikesan, dan setiap satu mempunyai kebarangkalian peratusan bahawa kotak sempadan mengandungi tin pes tomato.
✅ Fikirkan beberapa senario berbeza di mana anda mungkin ingin menggunakan model AI berasaskan imej. Yang mana memerlukan klasifikasi, dan yang mana memerlukan pengesanan objek?
Bagaimana Pengesanan Objek Berfungsi
Pengesanan objek menggunakan model ML yang kompleks. Model-model ini berfungsi dengan membahagikan imej kepada beberapa sel, kemudian memeriksa sama ada pusat kotak sempadan adalah pusat imej yang sepadan dengan salah satu imej yang digunakan untuk melatih model. Anda boleh menganggap ini seperti menjalankan pengklasifikasi imej ke atas bahagian-bahagian imej yang berbeza untuk mencari padanan.
💁 Ini adalah penyederhanaan yang sangat drastik. Terdapat banyak teknik untuk pengesanan objek, dan anda boleh membaca lebih lanjut mengenainya di halaman Pengesanan Objek di Wikipedia.
Terdapat beberapa model berbeza yang boleh melakukan pengesanan objek. Salah satu model yang terkenal ialah YOLO (You only look once), yang sangat pantas dan boleh mengesan 20 kelas objek yang berbeza, seperti manusia, anjing, botol dan kereta.
✅ Baca tentang model YOLO di pjreddie.com/darknet/yolo/
Model pengesanan objek boleh dilatih semula menggunakan pembelajaran pemindahan untuk mengesan objek tersuai.
Menggunakan Pengesanan Objek dalam Runcit
Pengesanan objek mempunyai pelbagai kegunaan dalam runcit. Beberapa termasuk:
- Pemeriksaan stok dan pengiraan - mengenal pasti apabila stok rendah di rak. Jika stok terlalu rendah, pemberitahuan boleh dihantar kepada kakitangan atau robot untuk mengisi semula rak.
- Pengesanan pelitup muka - di kedai dengan polisi pelitup muka semasa acara kesihatan awam, pengesanan objek boleh mengenal pasti orang yang memakai pelitup muka dan yang tidak.
- Pengebilan automatik - mengesan barang yang diambil dari rak di kedai automatik dan mengenakan bayaran kepada pelanggan dengan sewajarnya.
- Pengesanan bahaya - mengenal pasti barang yang pecah di lantai, atau cecair yang tumpah, dan memberi amaran kepada kru pembersihan.
✅ Lakukan sedikit penyelidikan: Apakah beberapa lagi kegunaan pengesanan objek dalam runcit?
Melatih Pengesan Objek
Anda boleh melatih pengesan objek menggunakan Custom Vision, dengan cara yang serupa seperti anda melatih pengklasifikasi imej.
Tugas - mencipta pengesan objek
-
Cipta Kumpulan Sumber untuk projek ini yang dipanggil
stock-detector
-
Cipta sumber latihan Custom Vision percuma, dan sumber ramalan Custom Vision percuma dalam kumpulan sumber
stock-detector
. Namakan merekastock-detector-training
danstock-detector-prediction
.💁 Anda hanya boleh mempunyai satu sumber latihan dan ramalan percuma, jadi pastikan anda telah membersihkan projek anda dari pelajaran sebelumnya.
⚠️ Anda boleh merujuk kepada arahan untuk mencipta sumber latihan dan ramalan dari projek 4, pelajaran 1 jika diperlukan.
-
Lancarkan portal Custom Vision di CustomVision.ai, dan log masuk dengan akaun Microsoft yang anda gunakan untuk akaun Azure anda.
-
Ikuti Bahagian Cipta Projek Baru dalam panduan pantas Bina pengesan objek di dokumen Microsoft untuk mencipta projek Custom Vision baru. UI mungkin berubah dan dokumen ini sentiasa menjadi rujukan terkini.
Namakan projek anda
stock-detector
.Apabila anda mencipta projek anda, pastikan untuk menggunakan sumber
stock-detector-training
yang anda cipta sebelum ini. Gunakan jenis projek Object Detection, dan domain Products on Shelves.✅ Domain produk di rak direka khusus untuk mengesan stok di rak kedai. Baca lebih lanjut tentang domain yang berbeza dalam Dokumentasi Pilih Domain di Microsoft Docs
✅ Luangkan masa untuk meneroka UI Custom Vision untuk pengesan objek anda.
Tugas - melatih pengesan objek anda
Untuk melatih model anda, anda memerlukan satu set imej yang mengandungi objek yang ingin anda kesan.
-
Kumpulkan imej yang mengandungi objek untuk dikesan. Anda memerlukan sekurang-kurangnya 15 imej yang mengandungi setiap objek untuk dikesan dari pelbagai sudut dan dalam keadaan pencahayaan yang berbeza, tetapi lebih banyak lebih baik. Pengesan objek ini menggunakan domain Products on shelves, jadi cuba susun objek seolah-olah ia berada di rak kedai. Anda juga memerlukan beberapa imej untuk menguji model. Jika anda mengesan lebih daripada satu objek, anda memerlukan beberapa imej ujian yang mengandungi semua objek.
💁 Imej dengan pelbagai objek yang berbeza dikira ke arah minimum 15 imej untuk semua objek dalam imej.
Imej anda harus dalam format png atau jpeg, lebih kecil daripada 6MB. Jika anda menciptanya dengan iPhone sebagai contoh, ia mungkin imej HEIC resolusi tinggi, jadi perlu ditukar dan mungkin dikecilkan. Lebih banyak imej lebih baik, dan anda harus mempunyai bilangan yang serupa untuk objek masak dan tidak masak.
Model ini direka untuk produk di rak, jadi cuba ambil gambar objek di rak.
Anda boleh menemui beberapa imej contoh yang boleh anda gunakan dalam folder images untuk kacang gajus dan pes tomato.
-
Ikuti Bahagian Muat Naik dan Tag Imej dalam panduan pantas Bina pengesan objek di dokumen Microsoft untuk memuat naik imej latihan anda. Cipta tag yang relevan bergantung pada jenis objek yang ingin anda kesan.
Apabila anda melukis kotak sempadan untuk objek, pastikan ia ketat di sekitar objek. Ia mungkin mengambil masa untuk menggariskan semua imej, tetapi alat ini akan mengesan apa yang dianggap sebagai kotak sempadan, menjadikannya lebih pantas.
💁 Jika anda mempunyai lebih daripada 15 imej untuk setiap objek, anda boleh melatih selepas 15 kemudian menggunakan ciri Suggested tags. Ini akan menggunakan model yang dilatih untuk mengesan objek dalam imej yang tidak ditandai. Anda kemudian boleh mengesahkan objek yang dikesan, atau menolak dan melukis semula kotak sempadan. Ini boleh menjimatkan banyak masa.
-
Ikuti Bahagian Latih Pengesan dalam panduan pantas Bina pengesan objek di dokumen Microsoft untuk melatih pengesan objek pada imej yang telah ditandai.
Anda akan diberi pilihan jenis latihan. Pilih Quick Training.
Pengesan objek kemudian akan dilatih. Ia akan mengambil masa beberapa minit untuk latihan selesai.
Uji Pengesan Objek Anda
Setelah pengesan objek anda dilatih, anda boleh mengujinya dengan memberikan imej baru untuk mengesan objek di dalamnya.
Tugas - uji pengesan objek anda
-
Gunakan butang Quick Test untuk memuat naik imej ujian dan mengesahkan objek yang dikesan. Gunakan imej ujian yang anda cipta sebelum ini, bukan mana-mana imej yang anda gunakan untuk latihan.
-
Cuba semua imej ujian yang anda ada dan perhatikan kebarangkalian.
Latih Semula Pengesan Objek Anda
Apabila anda menguji pengesan objek anda, ia mungkin tidak memberikan hasil yang anda harapkan, sama seperti pengklasifikasi imej dalam projek sebelumnya. Anda boleh meningkatkan pengesan objek anda dengan melatih semula menggunakan imej yang salah dikesan.
Setiap kali anda membuat ramalan menggunakan pilihan ujian pantas, imej dan hasilnya disimpan. Anda boleh menggunakan imej-imej ini untuk melatih semula model anda.
-
Gunakan tab Predictions untuk mencari imej yang anda gunakan untuk ujian.
-
Sahkan sebarang pengesanan yang tepat, padamkan yang salah dan tambahkan sebarang objek yang hilang.
-
Latih semula dan uji semula model.
🚀 Cabaran
Apa yang akan berlaku jika anda menggunakan pengesan objek dengan barang yang kelihatan serupa, seperti tin pes tomato dan tin tomato cincang jenama yang sama?
Jika anda mempunyai barang yang kelihatan serupa, uji dengan menambahkan imej mereka ke pengesan objek anda.
Kuiz Pasca-Kuliah
Ulang Kaji & Kajian Kendiri
- Semasa anda melatih pengesan objek anda, anda mungkin telah melihat nilai untuk Precision, Recall, dan mAP yang menilai model yang telah dicipta. Baca lebih lanjut tentang nilai-nilai ini menggunakan bahagian Evaluate the detector dalam panduan Build an object detector quickstart di dokumen Microsoft
- Baca lebih lanjut tentang pengesanan objek di halaman Object detection di Wikipedia
Tugasan
Penafian:
Dokumen ini telah diterjemahkan menggunakan perkhidmatan terjemahan AI Co-op Translator. Walaupun kami berusaha untuk memastikan ketepatan, sila ambil perhatian bahawa terjemahan automatik mungkin mengandungi kesilapan atau ketidaktepatan. Dokumen asal dalam bahasa asalnya harus dianggap sebagai sumber yang berwibawa. Untuk maklumat yang kritikal, terjemahan manusia profesional adalah disyorkan. Kami tidak bertanggungjawab atas sebarang salah faham atau salah tafsir yang timbul daripada penggunaan terjemahan ini.