|
4 weeks ago | |
---|---|---|
.. | ||
README.md | 4 weeks ago | |
assignment.md | 4 weeks ago |
README.md
Latih Pengesan Kualiti Buah
Sketchnote oleh Nitya Narasimhan. Klik imej untuk versi yang lebih besar.
Video ini memberikan gambaran keseluruhan tentang perkhidmatan Azure Custom Vision, yang akan dibincangkan dalam pelajaran ini.
🎥 Klik imej di atas untuk menonton video
Kuiz sebelum kuliah
Pengenalan
Kebangkitan terkini dalam Kecerdasan Buatan (AI) dan Pembelajaran Mesin (ML) memberikan pelbagai keupayaan kepada para pembangun masa kini. Model ML boleh dilatih untuk mengenali pelbagai perkara dalam imej, termasuk buah yang belum masak, dan ini boleh digunakan dalam peranti IoT untuk membantu menyusun hasil tanaman sama ada semasa ia dituai, atau semasa pemprosesan di kilang atau gudang.
Dalam pelajaran ini, anda akan belajar tentang pengelasan imej - menggunakan model ML untuk membezakan antara imej pelbagai perkara. Anda akan belajar cara melatih pengelasan imej untuk membezakan antara buah yang baik dan buah yang buruk, sama ada terlalu masak, lebam, atau busuk.
Dalam pelajaran ini, kita akan membincangkan:
- Menggunakan AI dan ML untuk menyusun makanan
- Pengelasan imej melalui Pembelajaran Mesin
- Melatih pengelasan imej
- Uji pengelasan imej anda
- Latih semula pengelasan imej anda
Menggunakan AI dan ML untuk menyusun makanan
Memberi makan kepada populasi global adalah tugas yang sukar, terutamanya pada harga yang menjadikan makanan mampu milik untuk semua. Salah satu kos terbesar adalah buruh, jadi para petani semakin beralih kepada automasi dan alat seperti IoT untuk mengurangkan kos buruh mereka. Menuai secara manual adalah kerja yang intensif (dan sering kali memenatkan), dan kini digantikan oleh mesin, terutamanya di negara-negara kaya. Walaupun terdapat penjimatan kos menggunakan mesin untuk menuai, terdapat kelemahan - keupayaan untuk menyusun makanan semasa ia dituai.
Tidak semua tanaman masak secara seragam. Sebagai contoh, tomato masih boleh mempunyai buah hijau di pokok apabila sebahagian besar sudah sedia untuk dituai. Walaupun menuai buah yang belum masak ini adalah pembaziran, ia lebih murah dan mudah bagi petani untuk menuai semuanya menggunakan mesin dan membuang hasil yang belum masak kemudian.
✅ Lihatlah pelbagai buah atau sayur, sama ada yang tumbuh berhampiran anda di ladang atau taman, atau di kedai. Adakah semuanya masak dengan seragam, atau adakah anda melihat variasi?
Kebangkitan penuaian automatik memindahkan proses penyusunan hasil tanaman dari ladang ke kilang. Makanan akan bergerak di atas tali sawat panjang dengan pasukan pekerja yang memilih hasil tanaman yang tidak memenuhi standard kualiti yang diperlukan. Penuaian menjadi lebih murah berkat mesin, tetapi masih ada kos untuk menyusun makanan secara manual.
Evolusi seterusnya adalah menggunakan mesin untuk menyusun, sama ada dibina ke dalam mesin penuaian, atau di kilang pemprosesan. Generasi pertama mesin ini menggunakan sensor optik untuk mengesan warna, mengawal penggerak untuk menolak tomato hijau ke dalam tong sampah menggunakan tuas atau hembusan udara, meninggalkan tomato merah untuk terus bergerak di atas rangkaian tali sawat.
Dalam video ini, semasa tomato jatuh dari satu tali sawat ke tali sawat lain, tomato hijau dikesan dan ditolak ke dalam tong menggunakan tuas.
✅ Apakah keadaan yang diperlukan di kilang atau di ladang untuk sensor optik ini berfungsi dengan betul?
Evolusi terkini mesin penyusunan ini memanfaatkan AI dan ML, menggunakan model yang dilatih untuk membezakan hasil tanaman yang baik daripada yang buruk, bukan hanya berdasarkan perbezaan warna yang jelas seperti tomato hijau vs merah, tetapi juga perbezaan penampilan yang lebih halus yang boleh menunjukkan penyakit atau lebam.
Pengelasan imej melalui Pembelajaran Mesin
Pengaturcaraan tradisional adalah di mana anda mengambil data, menggunakan algoritma pada data, dan mendapatkan output. Sebagai contoh, dalam projek terakhir anda mengambil koordinat GPS dan geofence, menggunakan algoritma yang disediakan oleh Azure Maps, dan mendapatkan hasil sama ada titik itu berada di dalam atau di luar geofence. Anda memasukkan lebih banyak data, anda mendapatkan lebih banyak output.
Pembelajaran mesin membalikkan proses ini - anda bermula dengan data dan output yang diketahui, dan algoritma pembelajaran mesin belajar daripada data tersebut. Anda kemudian boleh mengambil algoritma yang telah dilatih, yang dipanggil model pembelajaran mesin atau model, dan memasukkan data baru untuk mendapatkan output baru.
🎓 Proses algoritma pembelajaran mesin belajar daripada data dipanggil latihan. Input dan output yang diketahui dipanggil data latihan.
Sebagai contoh, anda boleh memberikan model berjuta-juta gambar pisang yang belum masak sebagai data latihan input, dengan output latihan ditetapkan sebagai belum masak
, dan berjuta-juta gambar pisang masak sebagai data latihan dengan output ditetapkan sebagai masak
. Algoritma ML kemudian akan mencipta model berdasarkan data ini. Anda kemudian memberikan model ini gambar baru pisang dan ia akan meramalkan sama ada gambar baru itu adalah pisang masak atau belum masak.
🎓 Hasil daripada model ML dipanggil ramalan
Model ML tidak memberikan jawapan binari, sebaliknya ia memberikan kebarangkalian. Sebagai contoh, model mungkin diberikan gambar pisang dan meramalkan masak
pada 99.7% dan belum masak
pada 0.3%. Kod anda kemudian akan memilih ramalan terbaik dan memutuskan pisang itu masak.
Model ML yang digunakan untuk mengesan imej seperti ini dipanggil pengelasan imej - ia diberikan imej yang dilabelkan, dan kemudian mengelaskan imej baru berdasarkan label ini.
💁 Ini adalah penyederhanaan, dan terdapat banyak cara lain untuk melatih model yang tidak selalu memerlukan output yang dilabelkan, seperti pembelajaran tanpa pengawasan. Jika anda ingin belajar lebih lanjut tentang ML, lihat ML untuk pemula, kurikulum 24 pelajaran tentang Pembelajaran Mesin.
Latih pengelasan imej
Untuk melatih pengelasan imej dengan berjaya, anda memerlukan berjuta-juta imej. Namun, setelah anda mempunyai pengelasan imej yang dilatih dengan berjuta-juta atau berbilion imej pelbagai, anda boleh menggunakannya semula dan melatih semula menggunakan set imej kecil dan mendapatkan hasil yang hebat, menggunakan proses yang dipanggil pembelajaran pemindahan.
🎓 Pembelajaran pemindahan adalah di mana anda memindahkan pembelajaran daripada model ML yang sedia ada kepada model baru berdasarkan data baru.
Setelah pengelasan imej dilatih untuk pelbagai imej, bahagian dalamannya sangat baik dalam mengenali bentuk, warna dan corak. Pembelajaran pemindahan membolehkan model menggunakan apa yang telah dipelajarinya dalam mengenali bahagian imej, dan menggunakannya untuk mengenali imej baru.
Anda boleh menganggap ini seperti buku bentuk kanak-kanak, di mana setelah anda dapat mengenali separuh bulatan, segi empat tepat dan segi tiga, anda boleh mengenali bot layar atau kucing bergantung pada konfigurasi bentuk ini. Pengelasan imej boleh mengenali bentuk, dan pembelajaran pemindahan mengajarnya konfigurasi apa yang membuat bot atau kucing - atau pisang masak.
Terdapat pelbagai alat yang boleh membantu anda melakukan ini, termasuk perkhidmatan berasaskan awan yang boleh membantu anda melatih model anda, kemudian menggunakannya melalui API web.
💁 Melatih model ini memerlukan banyak kuasa komputer, biasanya melalui Unit Pemprosesan Grafik, atau GPU. Perkakasan khusus yang sama yang menjadikan permainan di Xbox anda kelihatan hebat juga boleh digunakan untuk melatih model pembelajaran mesin. Dengan menggunakan awan, anda boleh menyewa masa pada komputer berkuasa dengan GPU untuk melatih model ini, mendapatkan akses kepada kuasa pengkomputeran yang anda perlukan, hanya untuk masa yang anda perlukan.
Custom Vision
Custom Vision adalah alat berasaskan awan untuk melatih pengelasan imej. Ia membolehkan anda melatih pengelasan menggunakan hanya sejumlah kecil imej. Anda boleh memuat naik imej melalui portal web, API web atau SDK, memberikan setiap imej tag yang mempunyai klasifikasi imej tersebut. Anda kemudian melatih model, dan mengujinya untuk melihat sejauh mana ia berfungsi. Setelah anda berpuas hati dengan model tersebut, anda boleh menerbitkan versi yang boleh diakses melalui API web atau SDK.
💁 Anda boleh melatih model Custom Vision dengan hanya 5 imej setiap klasifikasi, tetapi lebih banyak adalah lebih baik. Anda boleh mendapatkan hasil yang lebih baik dengan sekurang-kurangnya 30 imej.
Custom Vision adalah sebahagian daripada rangkaian alat AI dari Microsoft yang dipanggil Cognitive Services. Ini adalah alat AI yang boleh digunakan sama ada tanpa latihan atau dengan sedikit latihan. Ia termasuk pengenalan dan terjemahan ucapan, pemahaman bahasa dan analisis imej. Ini tersedia dengan tahap percuma sebagai perkhidmatan di Azure.
💁 Tahap percuma lebih daripada mencukupi untuk mencipta model, melatihnya, kemudian menggunakannya untuk kerja pembangunan. Anda boleh membaca tentang had tahap percuma di Halaman Had dan Kuota Custom Vision di dokumen Microsoft.
Tugas - cipta sumber cognitive services
Untuk menggunakan Custom Vision, anda perlu mencipta dua sumber cognitive services di Azure menggunakan Azure CLI, satu untuk latihan Custom Vision dan satu untuk ramalan Custom Vision.
-
Cipta Resource Group untuk projek ini yang dipanggil
fruit-quality-detector
. -
Gunakan arahan berikut untuk mencipta sumber latihan Custom Vision percuma:
az cognitiveservices account create --name fruit-quality-detector-training \ --resource-group fruit-quality-detector \ --kind CustomVision.Training \ --sku F0 \ --yes \ --location <location>
Gantikan
<location>
dengan lokasi yang anda gunakan semasa mencipta Resource Group.Ini akan mencipta sumber latihan Custom Vision dalam Resource Group anda. Ia akan dipanggil
fruit-quality-detector-training
dan menggunakan skuF0
, yang merupakan tahap percuma. Pilihan--yes
bermaksud anda bersetuju dengan terma dan syarat cognitive services.
💁 Gunakan sku
S0
jika anda sudah mempunyai akaun percuma menggunakan mana-mana Cognitive Services.
-
Gunakan arahan berikut untuk mencipta sumber ramalan Custom Vision percuma:
az cognitiveservices account create --name fruit-quality-detector-prediction \ --resource-group fruit-quality-detector \ --kind CustomVision.Prediction \ --sku F0 \ --yes \ --location <location>
Gantikan
<location>
dengan lokasi yang anda gunakan semasa mencipta Resource Group.Ini akan mencipta sumber ramalan Custom Vision dalam Resource Group anda. Ia akan dipanggil
fruit-quality-detector-prediction
dan menggunakan skuF0
, yang merupakan tahap percuma. Pilihan--yes
bermaksud anda bersetuju dengan terma dan syarat cognitive services.
Tugas - cipta projek pengelasan imej
-
Lancarkan portal Custom Vision di CustomVision.ai, dan log masuk dengan akaun Microsoft yang anda gunakan untuk akaun Azure anda.
-
Ikuti bahagian cipta projek baru dalam panduan cepat membina pengelasan di dokumen Microsoft untuk mencipta projek Custom Vision baru. UI mungkin berubah dan dokumen ini sentiasa menjadi rujukan yang paling terkini.
Namakan projek anda
fruit-quality-detector
.Semasa mencipta projek anda, pastikan untuk menggunakan sumber
fruit-quality-detector-training
yang anda cipta sebelum ini. Gunakan jenis projek Classification, jenis klasifikasi Multiclass, dan domain Food.
✅ Luangkan masa untuk meneroka UI Custom Vision untuk pengelasan imej anda.
Tugas - latih projek pengelasan imej anda
Untuk melatih pengelasan imej, anda memerlukan pelbagai gambar buah, baik yang berkualiti baik dan buruk untuk ditag sebagai baik dan buruk, seperti pisang masak dan pisang terlalu masak. 💁 Pengelas ini boleh mengelaskan imej apa sahaja, jadi jika anda tidak mempunyai buah dengan kualiti berbeza, anda boleh menggunakan dua jenis buah yang berbeza, atau kucing dan anjing! Setiap gambar sebaiknya hanya menunjukkan buah tersebut, sama ada dengan latar belakang yang konsisten atau pelbagai latar belakang. Pastikan tiada apa-apa di latar belakang yang menunjukkan perbezaan antara buah masak dan tidak masak.
💁 Penting untuk tidak mempunyai latar belakang tertentu, atau objek tertentu yang tidak berkaitan dengan perkara yang diklasifikasikan untuk setiap tag. Jika tidak, pengklasifikasi mungkin hanya mengklasifikasikan berdasarkan latar belakang. Terdapat satu pengklasifikasi untuk kanser kulit yang dilatih menggunakan gambar tahi lalat biasa dan kanser. Gambar tahi lalat kanser semuanya mempunyai pembaris untuk mengukur saiz. Akhirnya, pengklasifikasi tersebut hampir 100% tepat mengenal pasti pembaris dalam gambar, bukan tahi lalat kanser.
Pengklasifikasi imej beroperasi pada resolusi yang sangat rendah. Sebagai contoh, Custom Vision boleh menerima imej latihan dan ramalan sehingga 10240x10240, tetapi melatih dan menjalankan model pada imej bersaiz 227x227. Imej yang lebih besar akan dikecilkan ke saiz ini, jadi pastikan objek yang anda klasifikasikan memenuhi sebahagian besar imej. Jika tidak, ia mungkin terlalu kecil dalam imej yang lebih kecil yang digunakan oleh pengklasifikasi.
-
Kumpulkan gambar untuk pengklasifikasi anda. Anda memerlukan sekurang-kurangnya 5 gambar untuk setiap label bagi melatih pengklasifikasi, tetapi lebih banyak adalah lebih baik. Anda juga memerlukan beberapa gambar tambahan untuk menguji pengklasifikasi. Gambar-gambar ini mestilah imej yang berbeza bagi objek yang sama. Sebagai contoh:
-
Gunakan 2 pisang masak, ambil beberapa gambar setiap satu dari pelbagai sudut, sekurang-kurangnya 7 gambar (5 untuk latihan, 2 untuk ujian), tetapi lebih banyak adalah lebih baik.
-
Ulangi proses yang sama menggunakan 2 pisang tidak masak.
Anda sepatutnya mempunyai sekurang-kurangnya 10 gambar latihan, dengan sekurang-kurangnya 5 pisang masak dan 5 pisang tidak masak, serta 4 gambar ujian, 2 masak, 2 tidak masak. Gambar anda mestilah dalam format png atau jpeg, dan bersaiz kurang daripada 6MB. Jika anda mencipta gambar menggunakan iPhone, contohnya, ia mungkin dalam format resolusi tinggi HEIC, jadi perlu ditukar dan mungkin dikecilkan. Lebih banyak gambar adalah lebih baik, dan anda sepatutnya mempunyai bilangan gambar masak dan tidak masak yang hampir sama.
Jika anda tidak mempunyai kedua-dua buah masak dan tidak masak, anda boleh menggunakan buah-buahan yang berbeza, atau mana-mana dua objek yang anda ada. Anda juga boleh mencari beberapa gambar contoh dalam folder images untuk pisang masak dan tidak masak yang boleh anda gunakan.
-
-
Ikuti bahagian muat naik dan tag gambar dalam panduan pantas bina pengklasifikasi di dokumen Microsoft untuk memuat naik gambar latihan anda. Tag buah masak sebagai
ripe
, dan buah tidak masak sebagaiunripe
. -
Ikuti bahagian latih pengklasifikasi dalam panduan pantas bina pengklasifikasi di dokumen Microsoft untuk melatih pengklasifikasi imej menggunakan gambar yang telah dimuat naik.
Anda akan diberikan pilihan jenis latihan. Pilih Latihan Pantas.
Pengklasifikasi akan mula dilatih. Proses ini akan mengambil masa beberapa minit untuk selesai.
🍌 Jika anda memutuskan untuk makan buah anda semasa pengklasifikasi sedang dilatih, pastikan anda mempunyai cukup gambar untuk ujian terlebih dahulu!
Uji pengklasifikasi imej anda
Setelah pengklasifikasi anda dilatih, anda boleh mengujinya dengan memberikan imej baru untuk diklasifikasikan.
Tugas - uji pengklasifikasi imej anda
-
Ikuti bahagian uji model anda dalam dokumentasi Microsoft untuk menguji pengklasifikasi imej anda. Gunakan gambar ujian yang anda cipta sebelum ini, bukan mana-mana gambar yang digunakan untuk latihan.
-
Cuba semua gambar ujian yang anda ada dan perhatikan kebarangkalian yang diberikan.
Latih semula pengklasifikasi imej anda
Apabila anda menguji pengklasifikasi anda, ia mungkin tidak memberikan hasil seperti yang anda jangkakan. Pengklasifikasi imej menggunakan pembelajaran mesin untuk membuat ramalan tentang apa yang ada dalam imej, berdasarkan kebarangkalian bahawa ciri-ciri tertentu dalam imej bermaksud ia sepadan dengan label tertentu. Ia tidak memahami apa yang ada dalam imej - ia tidak tahu apa itu pisang atau memahami apa yang menjadikan pisang itu pisang dan bukannya bot. Anda boleh memperbaiki pengklasifikasi anda dengan melatih semula menggunakan gambar yang salah diklasifikasikan.
Setiap kali anda membuat ramalan menggunakan pilihan ujian pantas, imej dan hasilnya akan disimpan. Anda boleh menggunakan imej-imej ini untuk melatih semula model anda.
Tugas - latih semula pengklasifikasi imej anda
-
Ikuti bahagian gunakan imej yang diramalkan untuk latihan dalam dokumentasi Microsoft untuk melatih semula model anda, menggunakan tag yang betul untuk setiap imej.
-
Setelah model anda dilatih semula, uji dengan imej baru.
🚀 Cabaran
Apa yang anda fikir akan berlaku jika anda menggunakan gambar strawberi dengan model yang dilatih untuk pisang, atau gambar pisang tiup, atau seseorang memakai kostum pisang, atau bahkan watak kartun kuning seperti seseorang dari Simpsons?
Cuba dan lihat apa ramalannya. Anda boleh mencari gambar untuk dicuba menggunakan Carian Imej Bing.
Kuiz selepas kuliah
Ulasan & Kajian Kendiri
- Semasa anda melatih pengklasifikasi anda, anda akan melihat nilai untuk Precision, Recall, dan AP yang menilai model yang telah dicipta. Baca tentang apa nilai-nilai ini menggunakan bahagian menilai pengklasifikasi dalam panduan pantas bina pengklasifikasi di dokumen Microsoft
- Baca tentang cara memperbaiki pengklasifikasi anda dari bahagian cara memperbaiki model Custom Vision anda di dokumen Microsoft
Tugasan
Latih pengklasifikasi anda untuk pelbagai buah-buahan dan sayur-sayuran
Penafian:
Dokumen ini telah diterjemahkan menggunakan perkhidmatan terjemahan AI Co-op Translator. Walaupun kami berusaha untuk memastikan ketepatan, sila ambil perhatian bahawa terjemahan automatik mungkin mengandungi kesilapan atau ketidaktepatan. Dokumen asal dalam bahasa asalnya harus dianggap sebagai sumber yang berwibawa. Untuk maklumat yang kritikal, terjemahan manusia profesional adalah disyorkan. Kami tidak bertanggungjawab atas sebarang salah faham atau salah tafsir yang timbul daripada penggunaan terjemahan ini.