update-translations
parent
5bb8cd6605
commit
f4262644f3
@ -1,123 +1,125 @@
|
||||
# Mbinu za Kujifunza Mashine
|
||||
# Mbinu za Kujifunza kwa Mashine
|
||||
|
||||
Mchakato wa kujenga, kutumia, na kudumisha mifano ya kujifunza mashine na data wanayotumia ni tofauti sana na mchakato wa maendeleo mengine. Katika somo hili, tutafafanua mchakato huo na kuelezea mbinu kuu unazohitaji kujua. Utajifunza:
|
||||
Mchakato wa kujenga, kutumia, na kutunza mifano ya kujifunza kwa mashine na data wanayotumia ni mchakato tofauti kabisa na workflows nyingi nyingine za maendeleo. Katika somo hili, tutaondoa mashaka kuhusu mchakato huu, na kutoa muhtasari wa mbinu kuu unazohitaji kujua. Utajifunza:
|
||||
|
||||
- Kuelewa michakato inayosimamia kujifunza mashine kwa kiwango cha juu.
|
||||
- Kuelewa michakato inayounga mkono kujifunza kwa mashine kwa kiwango cha juu.
|
||||
- Kuchunguza dhana za msingi kama 'mifano', 'utabiri', na 'data ya mafunzo'.
|
||||
|
||||
## [Jaribio la awali la somo](https://ff-quizzes.netlify.app/en/ml/)
|
||||
## [Jaribio la kabla ya somo](https://ff-quizzes.netlify.app/en/ml/)
|
||||
|
||||
[](https://youtu.be/4NGM0U2ZSHU "ML kwa wanaoanza - Mbinu za Kujifunza Mashine")
|
||||
[](https://youtu.be/4NGM0U2ZSHU "ML for beginners - Techniques of Machine Learning")
|
||||
|
||||
> 🎥 Bofya picha hapo juu kwa video fupi inayopitia somo hili.
|
||||
> 🎥 Bonyeza picha hapo juu kwa video fupi inayoelezea somo hili.
|
||||
|
||||
## Utangulizi
|
||||
|
||||
Kwa kiwango cha juu, sanaa ya kuunda michakato ya kujifunza mashine (ML) inajumuisha hatua kadhaa:
|
||||
Kwa kiwango cha juu, ufundi wa kuunda michakato ya kujifunza kwa mashine (ML) unajumuisha hatua kadhaa:
|
||||
|
||||
1. **Amua swali**. Mchakato mwingi wa ML huanza kwa kuuliza swali ambalo haliwezi kujibiwa kwa programu rahisi ya masharti au injini ya sheria. Maswali haya mara nyingi huzunguka utabiri kulingana na mkusanyiko wa data.
|
||||
2. **Kusanya na kuandaa data**. Ili uweze kujibu swali lako, unahitaji data. Ubora na, wakati mwingine, wingi wa data yako utaamua jinsi unavyoweza kujibu swali lako la awali. Kuonyesha data ni kipengele muhimu cha awamu hii. Awamu hii pia inajumuisha kugawanya data katika kikundi cha mafunzo na majaribio ili kujenga mfano.
|
||||
3. **Chagua mbinu ya mafunzo**. Kulingana na swali lako na asili ya data yako, unahitaji kuchagua jinsi unavyotaka kufundisha mfano ili kuakisi data yako vizuri na kufanya utabiri sahihi dhidi yake. Hii ni sehemu ya mchakato wa ML inayohitaji utaalamu maalum na, mara nyingi, majaribio mengi.
|
||||
4. **Fanya mafunzo ya mfano**. Kwa kutumia data yako ya mafunzo, utatumia algoriti mbalimbali kufundisha mfano kutambua mifumo katika data. Mfano unaweza kutumia uzito wa ndani ambao unaweza kubadilishwa ili kuzingatia sehemu fulani za data kuliko nyingine ili kujenga mfano bora.
|
||||
5. **Tathmini mfano**. Unatumia data ambayo haijawahi kuonekana (data yako ya majaribio) kutoka seti yako iliyokusanywa ili kuona jinsi mfano unavyofanya kazi.
|
||||
6. **Kuboresha vigezo**. Kulingana na utendaji wa mfano wako, unaweza kurudia mchakato kwa kutumia vigezo tofauti, au mabadiliko, yanayodhibiti tabia ya algoriti zinazotumika kufundisha mfano.
|
||||
7. **Tabiri**. Tumia pembejeo mpya kujaribu usahihi wa mfano wako.
|
||||
1. **Amua swali**. Michakato mingi ya ML huanza kwa kuuliza swali ambalo haliwezi kujibiwa na programu rahisi yenye masharti au mzunguko wa sheria. Maswali haya mara nyingi yanahusiana na utabiri unaotegemea mkusanyiko wa data.
|
||||
2. **Kusanya na andaa data**. Ili kujibu swali lako, unahitaji data. Ubora na, wakati mwingine, wingi wa data yako utaamua jinsi unavyoweza kujibu swali lako la awali. Kuonyesha data kwa njia ya picha ni sehemu muhimu ya hatua hii. Hatua hii pia inajumuisha kugawanya data kuwa kundi la mafunzo na la majaribio ili kujenga mfano.
|
||||
3. **Chagua njia ya mafunzo**. Kulingana na swali lako na asili ya data yako, unahitaji kuchagua jinsi unavyotaka kufundisha mfano ili kuonyesha data yako kwa usahihi na kutoa utabiri sahihi dhidi yake. Hii ni sehemu ya mchakato wako wa ML inayohitaji utaalamu maalum na mara nyingi majaribio mengi.
|
||||
4. **Fanya mafunzo ya mfano**. Ukitumia data yako ya mafunzo, utatumia algoritimu mbalimbali kufundisha mfano kutambua mifumo ndani ya data. Mfano unaweza kutumia uzito wa ndani unaoweza kubadilishwa ili kutoa kipaumbele kwa sehemu fulani za data juu ya nyingine ili kujenga mfano bora.
|
||||
5. **Tathmini mfano**. Unatumia data ambayo haujawahi kuona hapo awali (data yako ya majaribio) kutoka kwa mkusanyiko wako kuona jinsi mfano unavyofanya kazi.
|
||||
6. **Sahihisha vigezo**. Kulingana na utendaji wa mfano wako, unaweza kurudia mchakato kwa kutumia vigezo tofauti, au tofauti, vinavyoendesha tabia ya algoritimu zinazotumika kufundisha mfano.
|
||||
7. **Kifanya utabiri**. Tumia data mpya kujaribu usahihi wa mfano wako.
|
||||
|
||||
## Swali la kuuliza
|
||||
## Swali gani la kuuliza
|
||||
|
||||
Kompyuta zina ujuzi wa kipekee wa kugundua mifumo iliyofichwa katika data. Uwezo huu ni muhimu sana kwa watafiti wenye maswali kuhusu uwanja fulani ambayo hayawezi kujibiwa kwa urahisi kwa kuunda injini ya sheria za masharti. Kwa mfano wa kazi ya actuarial, mwanasayansi wa data anaweza kuunda sheria za mikono kuhusu vifo vya wavutaji sigara dhidi ya wasiovuta sigara.
|
||||
Kompyuta zina ujuzi maalum wa kugundua mifumo iliyofichwa ndani ya data. Huduma hii ni muhimu sana kwa watafiti wenye maswali kuhusu eneo fulani ambayo hayawezi kujibiwa kwa urahisi kwa kuunda mzunguko wa sheria kwa masharti. Kwa mfano, kazi ya kihesabu, mtaalamu wa data anaweza kuunda sheria zilizotengenezwa kwa mikono kuhusu vifo vya wavutaji sigara dhidi ya wasiovuta sigara.
|
||||
|
||||
Hata hivyo, wakati vigezo vingine vingi vinapojumuishwa katika hesabu, mfano wa ML unaweza kuwa bora zaidi katika kutabiri viwango vya vifo vya baadaye kulingana na historia ya afya ya zamani. Mfano wa kufurahisha zaidi unaweza kuwa kutabiri hali ya hewa kwa mwezi wa Aprili katika eneo fulani kulingana na data inayojumuisha latitudo, longitudo, mabadiliko ya hali ya hewa, ukaribu na bahari, mifumo ya mkondo wa ndege, na zaidi.
|
||||
Hata hivyo, wakati vigezo vingine vingi vinapowekezwa, mfano wa ML unaweza kuwa bora zaidi kutabiri viwango vya vifo vya baadaye kulingana na historia ya afya ya zamani. Mfano wa furaha zaidi unaweza kuwa kutabiri hali ya hewa kwa mwezi wa Aprili katika eneo fulani kulingana na data inayojumuisha latitude, longitude, mabadiliko ya tabianchi, umbali na bahari, mifumo ya mteremko wa upepo wa jet, na zaidi.
|
||||
|
||||
✅ Hii [slide deck](https://www2.cisl.ucar.edu/sites/default/files/2021-10/0900%20June%2024%20Haupt_0.pdf) kuhusu mifano ya hali ya hewa inatoa mtazamo wa kihistoria wa kutumia ML katika uchambuzi wa hali ya hewa.
|
||||
✅ Huu [jedwali la slaidi](https://www2.cisl.ucar.edu/sites/default/files/2021-10/0900%20June%2024%20Haupt_0.pdf) kuhusu mifano ya hali ya hewa unatoa mtazamo wa kihistoria wa kutumia ML katika uchambuzi wa hali ya hewa.
|
||||
|
||||
## Kazi za kabla ya kujenga
|
||||
|
||||
Kabla ya kuanza kujenga mfano wako, kuna kazi kadhaa unazohitaji kukamilisha. Ili kujaribu swali lako na kuunda dhana kulingana na utabiri wa mfano, unahitaji kutambua na kusanidi vipengele kadhaa.
|
||||
Kabla ya kuanza kujenga mfano wako, kuna kazi kadhaa unazohitaji kukamilisha. Ili kujaribu swali lako na kuunda nadharia inayotokana na utabiri wa mfano, unahitaji kutambua na kusanidi vipengele kadhaa.
|
||||
|
||||
### Data
|
||||
|
||||
Ili uweze kujibu swali lako kwa uhakika wowote, unahitaji kiasi kizuri cha data ya aina sahihi. Kuna mambo mawili unayohitaji kufanya katika hatua hii:
|
||||
Ili kujibu swali lako kwa uhakika wowote, unahitaji kiasi kizuri cha data ya aina sahihi. Kuna mambo mawili unayohitaji kufanya hapo:
|
||||
|
||||
- **Kusanya data**. Ukizingatia somo la awali kuhusu usawa katika uchambuzi wa data, kusanya data yako kwa uangalifu. Kuwa na ufahamu wa vyanzo vya data hii, upendeleo wowote wa asili ambao inaweza kuwa nao, na andika asili yake.
|
||||
- **Andaa data**. Kuna hatua kadhaa katika mchakato wa kuandaa data. Unaweza kuhitaji kuunganisha data na kuifanya kuwa ya kawaida ikiwa inatoka kwa vyanzo tofauti. Unaweza kuboresha ubora na wingi wa data kupitia mbinu mbalimbali kama kubadilisha maandishi kuwa namba (kama tunavyofanya katika [Clustering](../../5-Clustering/1-Visualize/README.md)). Unaweza pia kuzalisha data mpya, kulingana na ya awali (kama tunavyofanya katika [Classification](../../4-Classification/1-Introduction/README.md)). Unaweza kusafisha na kuhariri data (kama tutakavyofanya kabla ya somo la [Web App](../../3-Web-App/README.md)). Hatimaye, unaweza pia kuhitaji kuipangilia upya na kuichanganya, kulingana na mbinu zako za mafunzo.
|
||||
- **Kusanya data**. Ukizingatia somo la awali kuhusu usawa katika uchambuzi wa data, kusanya data yako kwa makini. Fahamu vyanzo vya data hii, upendeleo wowote unaoweza kuwa nao, na andika chanzo chake.
|
||||
- **Andaa data**. Kuna hatua kadhaa katika mchakato wa maandalizi ya data. Huenda ukahitaji kukusanya data na kuifanya iwe sawa ikiwa inatoka vyanzo tofauti. Unaweza kuboresha ubora na wingi wa data kwa njia mbalimbali kama kubadilisha mistari kuwa nambari (kama tunavyofanya katika [Kupanga Kundi](../../5-Clustering/1-Visualize/README.md)). Pia unaweza kuzalisha data mpya, kulingana na asili (kama tunavyofanya katika [Uainishaji](../../4-Classification/1-Introduction/README.md)). Unaweza kusafisha na kuhariri data (kama tutakavyofanya kabla ya somo la [Tovuti App](../../3-Web-App/README.md)). Hatimaye, unaweza kuhitaji kuipanga nasibu na kuchanganya, kulingana na mbinu zako za mafunzo.
|
||||
|
||||
✅ Baada ya kukusanya na kuchakata data yako, chukua muda kuona kama umbo lake litaruhusu kushughulikia swali lako lililokusudiwa. Inawezekana kwamba data haitafanya vizuri katika kazi yako uliyopewa, kama tunavyogundua katika masomo yetu ya [Clustering](../../5-Clustering/1-Visualize/README.md)!
|
||||
✅ Baada ya kukusanya na kuchakata data yako, chukua muda kuona kama muundo wake utakuruhusu kutatua swali ulilokusudia. Huenda data isitende vyema katika kazi uliyopewa, kama tunavyogundua katika masomo yetu ya [Kupanga Kundi](../../5-Clustering/1-Visualize/README.md)!
|
||||
|
||||
### Vipengele na Lengo
|
||||
### Sifa na Lengo
|
||||
|
||||
[Feature](https://www.datasciencecentral.com/profiles/blogs/an-introduction-to-variable-and-feature-selection) ni mali inayoweza kupimika ya data yako. Katika seti nyingi za data, huonyeshwa kama kichwa cha safu kama 'tarehe', 'ukubwa', au 'rangi'. Kigezo cha kipengele, ambacho kwa kawaida huwakilishwa kama `X` katika msimbo, kinawakilisha kigezo cha pembejeo ambacho kitatumika kufundisha mfano.
|
||||
[Sifa](https://www.datasciencecentral.com/profiles/blogs/an-introduction-to-variable-and-feature-selection) ni kipengele kinachopimika cha data yako. Katika seti nyingi za data huonyeshwa kama kichwa cha safu kama 'tarehe', 'ukubwa' au 'rangi'. Kigezo cha sifa yako, kawaida huwakilishwa kama `X` katika nambari, kinawakilisha kigezo cha kuingiza kitakachotumika kufundisha mfano.
|
||||
|
||||
Lengo ni kitu unachojaribu kutabiri. Lengo, ambalo kwa kawaida huwakilishwa kama `y` katika msimbo, linawakilisha jibu la swali unalojaribu kuuliza kuhusu data yako: katika Desemba, malenge ya **rangi** gani yatakuwa ya bei rahisi? Katika San Francisco, vitongoji gani vitakuwa na **bei** bora ya mali isiyohamishika? Wakati mwingine lengo pia hujulikana kama sifa ya lebo.
|
||||
Lengo ni kitu unachojaribu kutabiri. Lengo, kawaida huwakilishwa kama `y` katika nambari, linaonyesha jibu la swali unalojaribu kuuliza kwa data yako: mwezi wa Desemba, ni **rangi** gani za malenge zitakuwa nafuu zaidi? San Francisco, ni maeneo gani yatakuwa na **bei** bora zaidi ya mali isiyohamishika? Wakati mwingine lengo pia hurejelewa kama sifa ya lebo.
|
||||
|
||||
### Kuchagua kigezo cha kipengele
|
||||
### Kuchagua kigezo chako cha sifa
|
||||
|
||||
🎓 **Uchaguzi wa Kipengele na Uchimbaji wa Kipengele** Unajuaje ni kigezo gani cha kuchagua wakati wa kujenga mfano? Huenda ukapitia mchakato wa kuchagua kipengele au kuchimba kipengele ili kuchagua vigezo sahihi kwa mfano wenye utendaji bora. Hata hivyo, si sawa: "Uchimbaji wa kipengele huunda vipengele vipya kutoka kwa kazi za vipengele vya awali, wakati uchaguzi wa kipengele unarudisha sehemu ndogo ya vipengele." ([chanzo](https://wikipedia.org/wiki/Feature_selection))
|
||||
🎓 **Uchaguzi wa Sifa na Utoaji Sifa** Je, unajua jinsi ya kuchagua kigezo wapi wakati wa kujenga mfano? Huenda upite katika mchakato wa uchaguzi wa sifa au utoaji sifa kuchagua vigezo sahihi kwa mfano bora zaidi. Hata hivyo, si vitu sawa: "Utoaji sifa huunda sifa mpya kutoka kwa kazi za sifa za awali, wakati uchaguzi wa sifa hurudisha sehemu ndogo ya sifa." ([chanzo](https://wikipedia.org/wiki/Feature_selection))
|
||||
|
||||
### Onyesha data yako
|
||||
### Onyesha data yako kwa picha
|
||||
|
||||
Sehemu muhimu ya zana ya mwanasayansi wa data ni uwezo wa kuonyesha data kwa kutumia maktaba kadhaa bora kama Seaborn au MatPlotLib. Kuonyesha data yako kwa njia ya picha kunaweza kukuruhusu kugundua uhusiano uliofichwa ambao unaweza kutumia. Picha zako zinaweza pia kukusaidia kugundua upendeleo au data isiyo na uwiano (kama tunavyogundua katika [Classification](../../4-Classification/2-Classifiers-1/README.md)).
|
||||
Sehemu muhimu ya zana za mtaalamu wa data ni uwezo wa kuonyesha data kwa picha kwa kutumia maktaba bora kama Seaborn au MatPlotLib. Kuonyesha data kwa picha kunaweza kukufanya ugundue uhusiano wa siri unaoweza kutumia. Mchoro wako pia unaweza kusaidia kugundua upendeleo au data isiyo sawa (kama tunavyogundua katika [Uainishaji](../../4-Classification/2-Classifiers-1/README.md)).
|
||||
|
||||
### Gawanya seti yako ya data
|
||||
|
||||
Kabla ya mafunzo, unahitaji kugawanya seti yako ya data katika sehemu mbili au zaidi za ukubwa usio sawa ambazo bado zinawakilisha data vizuri.
|
||||
Kabla ya mafunzo, unahitaji kugawanya seti yako ya data katika sehemu mbili au zaidi za saizi isiyo sawa lakini bado zinazoonesha data vizuri.
|
||||
|
||||
- **Mafunzo**. Sehemu hii ya seti ya data inafaa kwa mfano wako ili kuufundisha. Seti hii inajumuisha sehemu kubwa ya seti ya data ya awali.
|
||||
- **Majaribio**. Seti ya majaribio ni kikundi huru cha data, mara nyingi hukusanywa kutoka data ya awali, unayotumia kuthibitisha utendaji wa mfano uliojengwa.
|
||||
- **Uthibitishaji**. Seti ya uthibitishaji ni kikundi kidogo cha mifano huru unayotumia kurekebisha vigezo vya mfano, au usanifu, ili kuboresha mfano. Kulingana na ukubwa wa data yako na swali unalouliza, huenda usihitaji kujenga seti hii ya tatu (kama tunavyobainisha katika [Time Series Forecasting](../../7-TimeSeries/1-Introduction/README.md)).
|
||||
- **Mafunzo**. Sehemu hii ya seti ya data imeundwa kwa mfano wako kufundisha. Seti hii inajumuisha sehemu kubwa ya seti ya awali.
|
||||
- **Majaribio**. Seti ya majaribio ni kundi huru la data, mara nyingi hutolewa kutoka kwa data ya awali, unayotumia kuthibitisha utendaji wa mfano ulioujengwa.
|
||||
- **Uthibitishaji**. Seti ya uthibitishaji ni kundi dogo la huru la mifano unayotumia kusahihisha hyperparameters, au usanifu, wa mfano ili kuboresha mfano. Kulingana na ukubwa wa data yako na swali unalouliza, huenda usihitaji kujenga seti hii ya tatu (kama tunavyoona katika [Utabiri wa Mfululizo wa Muda](../../7-TimeSeries/1-Introduction/README.md)).
|
||||
|
||||
## Kujenga mfano
|
||||
|
||||
Kwa kutumia data yako ya mafunzo, lengo lako ni kujenga mfano, au uwakilishi wa takwimu wa data yako, kwa kutumia algoriti mbalimbali ili **kufundisha**. Kufundisha mfano kunaupa data na kuruhusu kufanya dhana kuhusu mifumo inayotambua, kuthibitisha, na kukubali au kukataa.
|
||||
Ukishaji data yako ya mafunzo, lengo lako ni kujenga mfano, au uwakilishi wa takwimu wa data yako, kwa kutumia algoritimu mbalimbali **kufundisha**. Kufundisha mfano kumfanya afahamu data na kutoa makadirio kuhusu mifumo anaogundua, kuthibitisha, na kukubali au kukataa.
|
||||
|
||||
### Amua mbinu ya mafunzo
|
||||
### Amua njia ya mafunzo
|
||||
|
||||
Kulingana na swali lako na asili ya data yako, utachagua mbinu ya kuifundisha. Ukipitia [nyaraka za Scikit-learn](https://scikit-learn.org/stable/user_guide.html) - tunazotumia katika kozi hii - unaweza kuchunguza njia nyingi za kufundisha mfano. Kulingana na uzoefu wako, huenda ukajaribu mbinu kadhaa tofauti ili kujenga mfano bora. Unaweza kupitia mchakato ambapo wanasayansi wa data wanatathmini utendaji wa mfano kwa kuupa data ambayo haijawahi kuonekana, kuangalia usahihi, upendeleo, na masuala mengine yanayopunguza ubora, na kuchagua mbinu ya mafunzo inayofaa zaidi kwa kazi iliyopo.
|
||||
Kulingana na swali lako na asili ya data yako, utaamua njia ya kuifundisha. Kupitia [nyaraka za Scikit-learn](https://scikit-learn.org/stable/user_guide.html) - tunayochukua katika kozi hii - unaweza kuchunguza njia nyingi za kufundisha mfano. Kulingana na uzoefu wako, huenda utajaribu njia tofauti tofauti kujenga mfano bora zaidi. Huenda upite kwa mchakato ambapo wataalamu wa data hutathmini utendaji wa mfano kwa kuipatia data isiyoonekana, kuangalia usahihi, upendeleo, na masuala mengine yanayopunguza ubora, na kuchagua njia bora ya kufundisha kwa kazi iliyopo.
|
||||
|
||||
### Fanya mafunzo ya mfano
|
||||
### Fundisha mfano
|
||||
|
||||
Ukiwa na data yako ya mafunzo, uko tayari 'kuifaa' ili kuunda mfano. Utagundua kwamba katika maktaba nyingi za ML utapata msimbo 'model.fit' - ni wakati huu ambapo unatuma kigezo chako cha kipengele kama safu ya thamani (kwa kawaida 'X') na kigezo cha lengo (kwa kawaida 'y').
|
||||
Ukiwa na data yako ya mafunzo, uko tayari 'kuifit' ili kuunda mfano. Utaona katika maktaba nyingi za ML nambari 'model.fit' - ni wakati huu unapowasilisha parameter yako ya sifa kama safu ya maadili (kawaida 'X') na parameter ya lengo (kawaida 'y').
|
||||
|
||||
### Tathmini mfano
|
||||
|
||||
Mara mchakato wa mafunzo unapokamilika (inaweza kuchukua marudio mengi, au 'epochs', kufundisha mfano mkubwa), utaweza kutathmini ubora wa mfano kwa kutumia data ya majaribio kupima utendaji wake. Data hii ni sehemu ndogo ya data ya awali ambayo mfano haujawahi kuchambua. Unaweza kuchapisha jedwali la vipimo kuhusu ubora wa mfano wako.
|
||||
Mara mchakato wa mafunzo umekamilika (huenda ukachukua mizunguko mingi, au 'epochs', kufundisha mfano mkubwa), utaweza kutathmini ubora wa mfano kwa kutumia data ya majaribio kupima utendaji wake. Data hii ni sehemu ndogo ya data ya awali ambayo mfano haujawahi kuchambua. Unaweza kuchapisha jedwali la viashiria kuhusu ubora wa mfano wako.
|
||||
|
||||
🎓 **Kufaa kwa mfano**
|
||||
🎓 **Kufit wa mfano**
|
||||
|
||||
Katika muktadha wa kujifunza mashine, kufaa kwa mfano kunahusu usahihi wa kazi ya msingi ya mfano unavyojaribu kuchambua data ambayo hauijui.
|
||||
Katika muktadha wa kujifunza kwa mashine, kufit wa mfano kunahusu usahihi wa kazi msingi wa mfano unapojaribu kuchambua data isiyojulikana kwao.
|
||||
|
||||
🎓 **Kutofaa** na **kufaa kupita kiasi** ni matatizo ya kawaida yanayopunguza ubora wa mfano, kwani mfano unafaa aidha si vizuri vya kutosha au vizuri kupita kiasi. Hii husababisha mfano kufanya utabiri aidha kwa ukaribu sana au kwa umbali sana na data yake ya mafunzo. Mfano uliokaa kupita kiasi hutabiri data ya mafunzo vizuri sana kwa sababu umejifunza maelezo na kelele za data vizuri sana. Mfano usiofaa si sahihi kwani hauwezi kuchambua data yake ya mafunzo wala data ambayo bado haujaiona kwa usahihi.
|
||||
🎓 **Underfitting** na **overfitting** ni matatizo ya kawaida yanayopunguza ubora wa mfano, wakati mfano unafit kwa kiasi kisichotosheleza au kwa kiasi kikubwa mno. Hii husababisha mfano kutoa utabiri ulio karibu sana au mbali mno na data ya mafunzo. Mfano uliopitiliza (overfit) hutabiri data ya mafunzo vizuri mno kwa sababu umejifunza kwa undani maelezo na kelele ya data. Mfano usiofaa (underfit) haupo sahihi kwa vile hauwezi kuchambua data ya mafunzo au data isiyojulikana kwa usahihi.
|
||||
|
||||

|
||||
> Picha ya taarifa na [Jen Looper](https://twitter.com/jenlooper)
|
||||

|
||||
> Infographic na [Jen Looper](https://twitter.com/jenlooper)
|
||||
|
||||
## Kuboresha vigezo
|
||||
## Sahihisha vigezo
|
||||
|
||||
Mara mafunzo yako ya awali yanapokamilika, angalia ubora wa mfano na fikiria kuuboresha kwa kurekebisha 'vigezo vya juu'. Soma zaidi kuhusu mchakato huu [katika nyaraka](https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters?WT.mc_id=academic-77952-leestott).
|
||||
Mara mafunzo ya awali yanapokamilika, tazama ubora wa mfano na fikiria kuuboresha kwa kubadilisha 'hyperparameters' zake. Soma zaidi kuhusu mchakato [katika nyaraka](https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters?WT.mc_id=academic-77952-leestott).
|
||||
|
||||
## Utabiri
|
||||
|
||||
Huu ndio wakati ambapo unaweza kutumia data mpya kabisa kujaribu usahihi wa mfano wako. Katika muktadha wa ML 'iliyotumika', ambapo unajenga mali za wavuti kutumia mfano katika uzalishaji, mchakato huu unaweza kuhusisha kukusanya pembejeo za mtumiaji (mfano wa kubonyeza kitufe) kuweka kigezo na kukituma kwa mfano kwa ajili ya uchambuzi au tathmini.
|
||||
Huu ni wakati ambapo unaweza kutumia data mpya kabisa kujaribu usahihi wa mfano wako. Katika mazingira ya ML 'waliyozishika', ambapo unajenga mali za wavuti kutumika mfano kwenye uzalishaji, mchakato huu unaweza kuhusisha ukusanyaji wa maingizo ya mtumiaji (bonyeza kitufe, kwa mfano) kuweka kigezo na kukituma kwa mfano kwa madhumuni ya utambuzi au tathmini.
|
||||
|
||||
Katika masomo haya, utagundua jinsi ya kutumia hatua hizi kuandaa, kujenga, kujaribu, kutathmini, na kutabiri - hatua zote za mwanasayansi wa data na zaidi, unavyosonga mbele katika safari yako ya kuwa mhandisi wa ML 'full stack'.
|
||||
Katika masomo haya, utagundua jinsi ya kutumia hatua hizi kuandaa, kujenga, kujaribu, kutathmini, na kutabiri - vitendo vyote vya mtaalamu wa data na zaidi, unapoendelea na safari yako ya kuwa mhandisi wa ML wa 'full stack'.
|
||||
|
||||
---
|
||||
|
||||
## 🚀Changamoto
|
||||
|
||||
Chora mchoro wa mtiririko unaoonyesha hatua za mtaalamu wa ML. Unaona uko wapi sasa katika mchakato? Unadhani utapata ugumu wapi? Nini kinaonekana rahisi kwako?
|
||||
Chora mchoro wa mtiririko unaoonyesha hatua za mtaalamu wa ML. Unaona wapi mwenyewe kwa sasa katika mchakato? Unatarajia kupata shida wapi? Nini kinaonekana rahisi kwako?
|
||||
|
||||
## [Jaribio la baada ya somo](https://ff-quizzes.netlify.app/en/ml/)
|
||||
|
||||
## Mapitio na Kujisomea
|
||||
## Mapitio & Kujifunza Peke Yako
|
||||
|
||||
Tafuta mtandaoni mahojiano na wanasayansi wa data wanaojadili kazi zao za kila siku. Hapa kuna [moja](https://www.youtube.com/watch?v=Z3IjgbbCEfs).
|
||||
Tafuta mtandaoni mahojiano na wataalamu wa data wanaozungumzia kazi zao za kila siku. Hapa kuna [moja](https://www.youtube.com/watch?v=Z3IjgbbCEfs).
|
||||
|
||||
## Kazi
|
||||
## Kazi ya Nyumbani
|
||||
|
||||
[Mahojiano na mwanasayansi wa data](assignment.md)
|
||||
[Hoja na mtaalamu wa data](assignment.md)
|
||||
|
||||
---
|
||||
|
||||
**Kanusho**:
|
||||
Hati hii imetafsiriwa kwa kutumia huduma ya kutafsiri ya AI [Co-op Translator](https://github.com/Azure/co-op-translator). Ingawa tunajitahidi kuhakikisha usahihi, tafadhali fahamu kuwa tafsiri za kiotomatiki zinaweza kuwa na makosa au kutokuwa sahihi. Hati ya asili katika lugha yake ya awali inapaswa kuzingatiwa kama chanzo cha mamlaka. Kwa taarifa muhimu, tafsiri ya kitaalamu ya binadamu inapendekezwa. Hatutawajibika kwa kutoelewana au tafsiri zisizo sahihi zinazotokana na matumizi ya tafsiri hii.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER START -->
|
||||
**Tangazo la Hukumu**:
|
||||
Hati hii imetafsiriwa kwa kutumia huduma ya tafsiri ya AI [Co-op Translator](https://github.com/Azure/co-op-translator). Wakati tunajitahidi kwa usahihi, tafadhali fahamu kuwa tafsiri za moja kwa moja zinaweza kuwa na makosa au upungufu wa usahihi. Hati ya asili katika lugha yake halisi inapaswa kuzingatiwa kama chanzo cha mamlaka. Kwa taarifa muhimu, tafsiri ya mtaalamu wa binadamu inapendekezwa. Hatuwezi kuwajibika kwa kutoelewana au tafsiri zisizo sahihi zinazotokana na matumizi ya tafsiri hii.
|
||||
<!-- CO-OP TRANSLATOR DISCLAIMER END -->
|
||||
Loading…
Reference in new issue